注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)工具書(shū)社科工具書(shū)海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)自動(dòng)分類(lèi)研究

海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)自動(dòng)分類(lèi)研究

海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)自動(dòng)分類(lèi)研究

定 價(jià):¥38.00

作 者: 王效岳,白如江 等 著
出版社: 人民出版社
叢編項(xiàng):
標(biāo) 簽: 社會(huì)科學(xué) 圖書(shū)館學(xué)/檔案學(xué) 文獻(xiàn)學(xué)

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787010148472 出版時(shí)間: 2016-01-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)針對(duì)文本分類(lèi)方法在發(fā)展過(guò)程中出現(xiàn)的問(wèn)題,圍繞“本體及其在文本分類(lèi)中的應(yīng)用”和“海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)自動(dòng)分類(lèi)”兩個(gè)方面展開(kāi)探討。深入研究了海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)處理技術(shù),比較分析了適合網(wǎng)絡(luò)文獻(xiàn)自動(dòng)獲取及并行處理的工具;設(shè)計(jì)了基于Heritrix與Hadoop平臺(tái)的海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)獲取及并行處理模型和基于WordNet與SUMO本體集成的語(yǔ)義驅(qū)動(dòng)自動(dòng)文檔分類(lèi)模型;梳理了本體以及本體集成理論、方法和工具;開(kāi)發(fā)了海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)并行獲取和自動(dòng)分類(lèi)原型系統(tǒng)。

作者簡(jiǎn)介

  王效岳,男,1961年生,工學(xué)博士,教授,山東理工大學(xué)科技信息研究所所長(zhǎng)。中國(guó)圖書(shū)館學(xué)會(huì)高等學(xué)校圖書(shū)館分會(huì)委員,山東省科技情報(bào)學(xué)會(huì)副理事長(zhǎng),山東省圖書(shū)館學(xué)會(huì)常務(wù)理事。研究方向?yàn)閿?shù)據(jù)挖掘與信息處理技術(shù)。主編及參編學(xué)術(shù)著作6部,省部級(jí)課題6項(xiàng)、廳局級(jí)課題10余項(xiàng),發(fā)表學(xué)術(shù)論文80余篇,其中被EI、CSSCI索引30余篇。授權(quán)發(fā)明專(zhuān)利3項(xiàng)。獲省科技進(jìn)步3等獎(jiǎng)l項(xiàng),廳局級(jí)科技進(jìn)步2等獎(jiǎng)2項(xiàng)、3等獎(jiǎng)3項(xiàng)。白如江,男,1979年生,管理學(xué)博士,副研究館員,山東理工大學(xué)圖書(shū)館數(shù)字資源部主任。研究領(lǐng)域包括文本數(shù)據(jù)挖掘、自然語(yǔ)言處理、信息檢索技術(shù)、高科技戰(zhàn)略情報(bào)研究等。主持國(guó)家社科青年基金項(xiàng)目l項(xiàng),教育部人文社會(huì)科學(xué)青年基金項(xiàng)目等省部級(jí)課題多項(xiàng)。

圖書(shū)目錄


緒論
第一章 網(wǎng)絡(luò)爬蟲(chóng)
第一節(jié) 網(wǎng)絡(luò)爬蟲(chóng)
一、開(kāi)源網(wǎng)絡(luò)爬蟲(chóng)工具
二、爬蟲(chóng)工具比較分析
第二節(jié) Hadoop平臺(tái)
一、Hadoop與其他系統(tǒng)的比較
二、Hadoop項(xiàng)目及結(jié)構(gòu)
三、Hadoop分布式文件系統(tǒng)
四、MapReduce編程模型
五、Hadoop平臺(tái)搭建
第二章 海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)獲取及并行處理模型
第一節(jié) 網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)的主要來(lái)源及常用文件格式
一、網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)的主要來(lái)源及特點(diǎn)
二、網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)的常用文件格式
第二節(jié) 網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)自動(dòng)獲取實(shí)驗(yàn)
一、實(shí)驗(yàn)環(huán)境
二、實(shí)驗(yàn)平臺(tái)搭建
第三節(jié) 網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)資源獲取
一、網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)獲取方案
二、種子站點(diǎn)的選擇
三、抓取任務(wù)的配置
四、文件類(lèi)型和大小過(guò)濾
五、網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)獲取實(shí)驗(yàn)結(jié)果
第四節(jié) 網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)資源判定
第五節(jié) 網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)并行處理
一、數(shù)據(jù)預(yù)處理
二、并行處理
第六節(jié) MapReduce任務(wù)優(yōu)化
一、任務(wù)調(diào)度
二、任務(wù)數(shù)量
三、Combine函數(shù)
四、文件壓縮
五、重用JVM
六、網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)并行處理模塊實(shí)驗(yàn)結(jié)果
第三章 本體集成
第一節(jié) 本體研究
一、本體概念
二、本體基本構(gòu)成要素
三、本體類(lèi)型
四、本體表示語(yǔ)言
第二節(jié) 本體庫(kù)研究
一、國(guó)內(nèi)外主要本體庫(kù)
二、本體庫(kù)比較分析
第三節(jié) 本體集成基本過(guò)程
第四節(jié) 本體集成工具
一、工具介紹
二、工具比較與分析
第五節(jié) 本體集成方法
一、基于形式概念分析(FCA)的本體集成方法
二、基于范疇論的本體集成方法
三、基于RDFS圖閉包的本體集成方法
第四章 基于語(yǔ)義驅(qū)動(dòng)文本自動(dòng)分類(lèi)研究
第一節(jié) 文檔自動(dòng)分類(lèi)基本理論
一、文檔自動(dòng)分類(lèi)基本概念
二、文檔自動(dòng)分類(lèi)基本流程
三、文檔自動(dòng)分類(lèi)性能評(píng)價(jià)指標(biāo)
第二節(jié) 基于語(yǔ)義驅(qū)動(dòng)文檔自動(dòng)分類(lèi)概念
第三節(jié) 基于語(yǔ)義驅(qū)動(dòng)文檔自動(dòng)分類(lèi)實(shí)現(xiàn)基礎(chǔ)
第四節(jié) 基于語(yǔ)義驅(qū)動(dòng)文檔自動(dòng)分類(lèi)方法模型
一、詞向量空間構(gòu)建
二、語(yǔ)義向量空間構(gòu)建
第五章 基于本體集成的文檔語(yǔ)義分類(lèi)模型
第一節(jié) SUMO和WordNet本體庫(kù)概述
一、WordNet本體庫(kù)
二、SUMO本體庫(kù)
第二節(jié) WordNet與SUMO本體庫(kù)映射機(jī)制研究
一、映射動(dòng)機(jī)
二、映射模型
三、映射實(shí)例
四、映射效果及應(yīng)用分析
第三節(jié) 基于WordNet與SUMO本體集成文檔語(yǔ)義分類(lèi)模型設(shè)計(jì)與實(shí)現(xiàn)
一、實(shí)驗(yàn)平臺(tái)構(gòu)建
二、實(shí)驗(yàn)數(shù)據(jù)集及方法
三、集成本體庫(kù)構(gòu)建
四、詞向量空間到概念向量空間的映射
五、概念向量空間通用化
六、分類(lèi)模型訓(xùn)練與測(cè)試過(guò)程描述
七、實(shí)驗(yàn)評(píng)估指標(biāo)
八、實(shí)驗(yàn)及結(jié)果分析
第六章 海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)自動(dòng)分類(lèi)系統(tǒng)
第一節(jié) 海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)自動(dòng)分類(lèi)系統(tǒng)
一、開(kāi)發(fā)環(huán)境
二、海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)自動(dòng)獲取模塊
三、海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)詞一文檔矩陣處理模塊
四、本體集成模塊
五、基于語(yǔ)義驅(qū)動(dòng)的分類(lèi)模塊
第二節(jié) 海量網(wǎng)絡(luò)學(xué)術(shù)文獻(xiàn)自動(dòng)分類(lèi)系統(tǒng)實(shí)現(xiàn)
一、系統(tǒng)主要技術(shù)及標(biāo)準(zhǔn)
二、系統(tǒng)功能
第七章 總結(jié)及展望
第一節(jié) 總結(jié)
第二節(jié) 展望
附錄A
附錄B
附錄C
附錄D
參考文獻(xiàn)
索引
后記

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)