第1章 大數據的產生發(fā)展
1.1 互聯網和物聯網上的數據
1.2 大數據的使用
1.3 數據挖掘中的一些概念
1.4 數據倉庫
第2章 Hadoop概述
2.1 Hadoop的起源發(fā)展
2.2 Hadoop核心基礎架構
2.3 Hadoop上的各組件
2.4 Spark和Hadoop
第3章 MapReduce的工作機制
3.1 剖析MapReduce作業(yè)運行機制
3.2 程序運行失敗分析
3.3 shuffle和排序
3.4 任務的執(zhí)行
第4章 MapReduce的類型格式與特征
4.1 MapReduce的類型
4.2 輸入輸出格式
4.3 MapReduce的特性
第5章 Hadoop分布式文件系統
5.1 HDFS的設計與概念
5.2 Hadoop文件系統
5.3 數據接口的分析
5.4 剖析文件數據流
5.5 通過distcp并行復制分析
第6章 Hadoop生態(tài)系統
6.1 Hive簡介分析
6.2 Hive原理與架構
6.3 HBase簡介分析
6.4 HBase原理與架構
第7章 管理Hadoop
7.1 HDFS的分析
7.2 監(jiān)控日志
7.3 日常管理維護
第8章 Hadoop安全
8.1 安全的核心
8.2 Hadoop中的認證安全
8.3 Hadoop中的授權安全
8.4 Hadoop中的數據保密性
8.5 Hadoop中的日志審計
第9章 使用Hadoop進行數據分析
9.1 數據分析工作流
9.2 機器學習
9.3 Apache Mahout
9.4 使用Hadoop和Mahout進行文檔分析
第10章 Hadoop在互聯網公司的應用
10.1 Hadoop在騰訊的應用
10.2 Hadoop在Facebook的應用
10.3 金山的Hadoop應用
10.4 迅雷公司對Hadoop的應用
第11章 Hadoop和行業(yè)應用的結合應用
11.1 Hadoop和運營商的結合
11.2 Hadoop和公用事業(yè)的結合
11.3 Hadoop和“智慧工商”的結合
11.4 Hadoop和金融的結合
11.5 Hadoop和醫(yī)療的結合
11.6 Hadoop和物流的結合
11.7 Hadoop和媒體的結合
參考文獻