注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡(luò)家庭與辦公軟件Hadoop高級數(shù)據(jù)分析:使用Hadoop生態(tài)系統(tǒng)設(shè)計和構(gòu)建大數(shù)據(jù)系統(tǒng)

Hadoop高級數(shù)據(jù)分析:使用Hadoop生態(tài)系統(tǒng)設(shè)計和構(gòu)建大數(shù)據(jù)系統(tǒng)

Hadoop高級數(shù)據(jù)分析:使用Hadoop生態(tài)系統(tǒng)設(shè)計和構(gòu)建大數(shù)據(jù)系統(tǒng)

定 價:¥59.80

作 者: Kerry Koitzsch,王建峰,王瑛琦 著
出版社: 清華大學出版社
叢編項: 大數(shù)據(jù)應(yīng)用與技術(shù)叢書
標 簽: 暫缺

ISBN: 9787302487302 出版時間: 2017-12-01 包裝: 平裝
開本: 16開 頁數(shù): 225 字數(shù):  

內(nèi)容簡介

  掌握Hadoop高級數(shù)據(jù)分析技術(shù)學習高級分析技術(shù),并利用現(xiàn)有工具包使分析應(yīng)用更加強大、精確和高效!《Hadoop高級數(shù)據(jù)分析使用Hadoop生態(tài)系統(tǒng)設(shè)計和構(gòu)建大數(shù)據(jù)系統(tǒng)》將架構(gòu)、設(shè)計及實現(xiàn)信息恰當?shù)厝跒橐惑w,將指導你創(chuàng)建*基礎(chǔ)方法(SF分類、聚類、推薦)的分析系統(tǒng)。在《Hadoop高級數(shù)據(jù)分析使用Hadoop生態(tài)系統(tǒng)設(shè)計和構(gòu)建大數(shù)據(jù)系統(tǒng)》中,*佳實踐強調(diào)“確保連貫、高效的開發(fā)”。將使用包含工具箱、庫、可視化組件和報表代碼在內(nèi)的標準第三方組件,借助集成“組合件”開發(fā)一個可運行的、可擴展的、端到端的完整示例系統(tǒng)?!禜adoop高級數(shù)據(jù)分析使用Hadoop生態(tài)系統(tǒng)設(shè)計和構(gòu)建大數(shù)據(jù)系統(tǒng)》強調(diào)以下四點:●具有分析組件及合理可視化結(jié)果的完整、靈活、可配置、高性能數(shù)據(jù)管道系統(tǒng)的重要性。深入探討的主題包括Spark、H2O、VopalWabbit(NLP)、StanfordNLP、ApacheMahout,以及其他適用的工具包、庫和插件?!?佳實踐和結(jié)構(gòu)化設(shè)計原則。包括重要主題及示例部分?!裼没旌洗钆浠蚧旌舷到y(tǒng)實現(xiàn)應(yīng)用目標的重要性。你在學習深度示例時可體會到混合方法的重要性。●使用現(xiàn)有第三方庫是有效開發(fā)的關(guān)鍵。在開發(fā)示例系統(tǒng)時,深度示例將展示一些第三方工具包的功能。

作者簡介

  Kerry Koitzsch在計算機科學、圖像處理和軟件工程等領(lǐng)域擁有超過二十年的工作經(jīng)驗,致力于研究Apache Hadoop和Apache Spark技術(shù)。Kerry擅長軟件咨詢,精通一些定制的大數(shù)據(jù)應(yīng)用,包括分布式搜索、圖像分析、立體視覺和智能圖像檢索系統(tǒng)。Kerry目前就職于Kildane軟件技術(shù)股份有限公司,該公司是加州桑尼維爾市的一個機器人系統(tǒng)和圖像分析軟件提供商。

圖書目錄

目錄
第Ⅰ部分概念
第1章概述:用Hadoop構(gòu)建數(shù)據(jù)分析系統(tǒng)3
1.1構(gòu)建DAS的必要性4
1.2HadoopCore及其簡史4
1.3Hadoop生態(tài)系統(tǒng)概述5
1.4AI技術(shù)、認知計算、深度學習以及BDA6
1.5自然語言處理與BDAS6
1.6SQL與NoSQL查詢處理6
1.7必要的數(shù)學知識7
1.8設(shè)計及構(gòu)建BDAS的循環(huán)過程7
1.9如何利用Hadoop生態(tài)系統(tǒng)實現(xiàn)BDA10
1.10“圖像大數(shù)據(jù)”(IABD)基本思想10
1.10.1使用的編程語言12
1.10.2Hadoop生態(tài)系統(tǒng)的多語言組件12
1.10.3Hadoop生態(tài)系統(tǒng)架構(gòu)13
1.11有關(guān)軟件組合件與框架的注意事項13
1.12ApacheLucene、Solr及其他:開源搜索組件14
1.13建立BDAS的架構(gòu)15
1.14你需要了解的事情15
1.15數(shù)據(jù)可視化與報表17
1.15.1使用EclipseIDE作為開發(fā)環(huán)境18
1.15.2本書未講解的內(nèi)容19
1.16本章小結(jié)21
第2章Scala及Python進階23
2.1動機:選擇正確的語言定義應(yīng)用23
2.2Scala概覽24
2.3Python概覽29
2.4錯誤診斷、調(diào)試、配置文件及文檔31
2.4.1Python的調(diào)試資源32
2.4.2Python文檔33
2.4.3Scala的調(diào)試資源33
2.5編程應(yīng)用與示例33
2.6本章小結(jié)34
2.7參考文獻34
第3章Hadoop及分析的標準工具集35
3.1庫、組件及工具集:概覽35
3.2在評估系統(tǒng)中使用深度學習方法38
3.3使用Spring框架及SpringData44
3.4數(shù)字與統(tǒng)計庫:R、Weka及其他44
3.5分布式系統(tǒng)的OLAP技術(shù)44
3.6用于分析的Hadoop工具集:ApacheMahout及相關(guān)工具45
3.7ApacheMahout的可視化46
3.8ApacheSpark庫與組件46
3.8.1可供選擇的不同類型的shell46
3.8.2ApacheSpark數(shù)據(jù)流47
3.8.3SparklingWater與H2O機器學習48
3.9組件使用與系統(tǒng)建立示例48
3.10封包、測試和文檔化示例系統(tǒng)50
3.11本章小結(jié)51
3.12參考文獻51
第4章關(guān)系、NoSQL及圖數(shù)據(jù)庫53
4.1圖查詢語言:Cypher及Gremlin55
4.2Cypher示例55
4.3Gremlin示例56
4.4圖數(shù)據(jù)庫:ApacheNeo4J58
4.5關(guān)系數(shù)據(jù)庫及Hadoop生態(tài)系統(tǒng)59
4.6Hadoop以及UA組件59
4.7本章小結(jié)63
4.8參考文獻64
第5章數(shù)據(jù)管道及其構(gòu)建方法65
5.1基本數(shù)據(jù)管道66
5.2ApacheBeam簡介67
5.3ApacheFalcon簡介68
5.4數(shù)據(jù)源與數(shù)據(jù)接收:使用ApacheTika構(gòu)建數(shù)據(jù)管道68
5.5計算與轉(zhuǎn)換70
5.6結(jié)果可視化及報告71
5.7本章小結(jié)74
5.8參考文獻74
第6章Hadoop、Lucene、Solr與高級搜索技術(shù)75
6.1Lucene/Solr生態(tài)系統(tǒng)簡介75
6.2Lucene查詢語法76
6.3使用Solr的編程示例79
6.4使用ELK棧(Elasticsearch、Logstash、Kibana)85
6.5Solr與Elasticsearch:特點與邏輯93
6.6應(yīng)用于Elasticsearch和Solr的SpringData組件95
6.7使用LingPipe和GATE實現(xiàn)定制搜索99
6.8本章小結(jié)108
6.9參考文獻108
第Ⅱ部分架構(gòu)及算法
第7章分析技術(shù)及算法概覽111
7.1算法類型綜述111
7.2統(tǒng)計/數(shù)值技術(shù)112
7.3貝葉斯技術(shù)113
7.4本體驅(qū)動算法114
7.5混合算法:組合算法類型115
7.6代碼示例116
7.7本章小結(jié)119
7.8參考文獻119
第8章規(guī)則引擎、系統(tǒng)控制與系統(tǒng)編排121
8.1規(guī)則系統(tǒng)JBossDrools介紹121
8.2基于規(guī)則的軟件系統(tǒng)控制124
8.3系統(tǒng)協(xié)調(diào)與JBossDrools125
8.4分析引擎示例與規(guī)則控制126
8.5本章小結(jié)129
8.6參考文獻129
第9章綜合提升:設(shè)計一個完整的分析系統(tǒng)131
9.1本章小結(jié)136
9.2參考文獻136
第Ⅲ部分組件與系統(tǒng)
第10章數(shù)據(jù)可視化:可視化與交互分析139
10.1簡單的可視化139
10.2AngularJS和Friends簡介143
10.3使用JHipster集成SpringXD
和AngularJS143
10.4使用d3.js、sigma.js及其他
工具152
10.5本章小結(jié)153
10.6參考文獻153
第Ⅳ部分案例研究與應(yīng)用

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號