注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)家庭與辦公軟件Hadoop大數(shù)據(jù)分析

Hadoop大數(shù)據(jù)分析

Hadoop大數(shù)據(jù)分析

定 價:¥38.00

作 者: 高永彬,錢亮宏,方志軍 著
出版社: 中國鐵道出版社
叢編項(xiàng): 高等學(xué)校大數(shù)據(jù)技術(shù)與應(yīng)用規(guī)劃教材
標(biāo) 簽: 暫缺

購買這本書可以去


ISBN: 9787113259198 出版時間: 2019-07-01 包裝: 平裝
開本: 16開 頁數(shù): 184 字?jǐn)?shù):  

內(nèi)容簡介

  本書適合作為高等學(xué)校計(jì)算機(jī)、通信與網(wǎng)絡(luò)工程等本科專業(yè)的教材,也可作為相關(guān)學(xué)科專業(yè)碩士研究生、信息網(wǎng)絡(luò)規(guī)劃設(shè)計(jì)人員、網(wǎng)絡(luò)運(yùn)行管理維護(hù)人員和網(wǎng)絡(luò)管理技術(shù)科研人員的參考用書。

作者簡介

  高永彬:博士、講師,就職于上海工程技術(shù)大學(xué),博士畢業(yè)于韓國全北國立大學(xué),在模式識別、機(jī)器學(xué)習(xí)領(lǐng)域積累了大量的研究與實(shí)戰(zhàn)經(jīng)驗(yàn)。特別地,在基于深度學(xué)習(xí)技術(shù)的人臉識別以及車型檢測技術(shù)進(jìn)行了深入地研究,發(fā)表了近30篇期刊/會議論文,取得了豐厚的研究成果,發(fā)表在包括Information Sciences, Pattern Recognition Letters等高水平期刊中,其中SCI收錄5篇,EI收錄4篇。錢亮宏,男,畢業(yè)于上海交通大學(xué)電子信息與電氣工程學(xué)院,1989年8月出生,擁有10年R語言使用經(jīng)驗(yàn),一直奮戰(zhàn)在數(shù)據(jù)分析與挖掘領(lǐng)域的線,作為金融和互聯(lián)網(wǎng)行業(yè)資深數(shù)據(jù)挖掘?qū)<?。方志軍,男,教授,現(xiàn)任上海工程技術(shù)大學(xué)電子電氣工程學(xué)院院長,1971年9月出生,主要從事人工智能、機(jī)器視覺、大數(shù)據(jù)分析等方面的研究,主講課程包括數(shù)字圖像處理、機(jī)器視覺、計(jì)算機(jī)導(dǎo)論、大數(shù)據(jù)導(dǎo)論和程序設(shè)計(jì)等。

圖書目錄

第1部分 Hadoop核心基礎(chǔ)
第1章 Hadoop簡介 2
1.1 Hadoop產(chǎn)生背景 2
1.2 Hadoop簡要?dú)v史 3
1.3 Hadoop生態(tài)系統(tǒng)組件 3
1.4 Hadoop版本和商用支持 5
1.5 Hadoop的基礎(chǔ)環(huán)境配置 6
1.6 Hadoop的安裝 7
1.7 Hadoop的配置 11
1.8 Hadoop的運(yùn)行 14
小結(jié) 19
習(xí)題 19
第2章 HDFS文件系統(tǒng) 20
2.1 HDFS簡介 20
2.2 HDFS架構(gòu) 20
2.3 HDFS文件塊 21
2.4 HDFS常用操作 22
小結(jié) 24
習(xí)題 24
第3章 YARN資源管理 25
3.1 YARN架構(gòu) 25
3.2 YARN調(diào)度策略 26
3.3 YARN常用操作 28
小結(jié) 30
習(xí)題 31
第4章 MapReduce計(jì)算框架 32
4.1 MapReduce原理 32
4.2 MapReduce作業(yè)數(shù)據(jù)流 33
4.3 Hadoop流處理 35
4.4 MapReduce程序?qū)崿F(xiàn)詞頻
統(tǒng)計(jì) 35
4.5 MapReduce程序的Reducer
數(shù)量 40
4.6 MapReduce程序的Combiner 41
4.7 MapReduce程序?qū)崿F(xiàn)數(shù)據(jù)
連接 43
小結(jié) 49
習(xí)題 49
第2部分 Hive數(shù)據(jù)倉庫
第5章 Hive簡介 52
5.1 Hive概述 52
5.2 Hive的安裝 53
5.3 Hive的運(yùn)行 56
小結(jié) 59
習(xí)題 59
第6章 Hive數(shù)據(jù)定義 60
6.1 數(shù)據(jù)庫操作 60
6.2 數(shù)據(jù)表基本操作 62
6.3 存儲格式和行格式 65
6.4 數(shù)據(jù)類型 67
6.5 外部表 70
6.6 分區(qū)表 72
小結(jié) 74
習(xí)題 74

第7章 Hive數(shù)據(jù)操作 75
7.1 數(shù)據(jù)導(dǎo)入 75
7.2 數(shù)據(jù)插入 78
7.3 數(shù)據(jù)導(dǎo)出 82
小結(jié) 84
習(xí)題 84
第8章 Hive數(shù)據(jù)查詢 85
8.1 基本查詢 85
8.2 數(shù)據(jù)聚合 87
8.3 數(shù)據(jù)連接 90
小結(jié) 92
習(xí)題 93
第3部分 Spark數(shù)據(jù)分析
第9章 Spark簡介 96
9.1 Spark概述 96
9.2 Spark原理 97
9.3 Spark的安裝 98
9.4 Spark運(yùn)行方式 99
9.5 Spark運(yùn)行位置 101
9.6 Spark運(yùn)行參數(shù) 104
小結(jié) 104
習(xí)題 104
第10章 Spark大數(shù)據(jù)處理 105
10.1 數(shù)據(jù)框的創(chuàng)建 105
10.2 數(shù)據(jù)框的選擇 107
10.3 數(shù)據(jù)框的運(yùn)算和聚合 110
10.4 數(shù)據(jù)框的增加、刪除
和修改 114
10.5 數(shù)據(jù)框的連接 116
10.6 數(shù)據(jù)框的變形 119
小結(jié) 120
習(xí)題 120
第11章 Spark機(jī)器學(xué)習(xí)流程 121
11.1 數(shù)據(jù)探索 122
11.2 數(shù)據(jù)劃分 123
11.3 數(shù)據(jù)填充 124
11.4 類別變量處理 125
11.5 特征選擇 128
11.6 建模與調(diào)優(yōu) 131
11.7 測試與評估 133
小結(jié) 135
習(xí)題 135
第12章 Spark有監(jiān)督學(xué)習(xí)模型 136
12.1 線性回歸模型 140
12.2 邏輯回歸模型 142
12.3 決策樹模型 145
12.4 隨機(jī)森林模型 152
12.5 神經(jīng)網(wǎng)絡(luò) 158
12.6 協(xié)同過濾 163
小結(jié) 166
習(xí)題 166
第13章 Spark無監(jiān)督學(xué)習(xí)模型 167
13.1 k均值聚類模型 168
13.2 主成分分析模型 172
13.3 關(guān)聯(lián)分析模型 173
小結(jié) 176
習(xí)題 176

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號