本書以Hadoop及其周邊框架為主線,介紹了整個Hadoop生態(tài)系統(tǒng)主流的大數據開發(fā)技術。全書共16章,第1章講解了VMware中CentOS 7操作系統(tǒng)的安裝;第2章講解了大數據開發(fā)之前對操作系統(tǒng)集群環(huán)境的配置;第3~16章講解了Hadoop生態(tài)系統(tǒng)各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和數據實時處理系統(tǒng)Flume、Kafka、Storm、Spark以及分布式搜索系統(tǒng)Elasticsearch等的基礎知識、架構原理、集群環(huán)境搭建,同時包括常用的Shell命令、API操作、源碼剖析,并通過實際案例加深對各個框架的理解與應用。通過閱讀本書,讀者即使沒有任何大數據基礎,也可以對照書中的步驟成功搭建屬于自己的大數據集群并獨立完成項目開發(fā)。 本書可作為Hadoop新手入門的指導書,也可作為大數據開發(fā)人員的隨身手冊以及大數據從業(yè)者的參考用書。