大數據技術讓我們以一種****的方式,對海量數據進行分析,從中獲得有巨大價值的產品和服務,最終形成變革之力。本書圍繞Hadoop和Spark兩個主流大數據技術進行講解,主要內容包括Hadoop環(huán)境配置、Hadoop分布式文件系統(tǒng)(HDFS)、Hadoop分布式計算框架MapReduce、Hadoop資源調度框架YARN與Hadoop新特性、Hadoop分布式數據庫HBase、數據倉庫Hive、大數據離線處理輔助系統(tǒng)、Spark Core、Spark SQL、Spark Streaming等知識。本書緊密結合實際應用,運用大量案例說明和實踐,提煉含金量十足的開發(fā)經驗。另外,本書配以多元的學習資源和支持服務,包括視頻教程、案例素材下載、學習交流社區(qū)、討論組等學習內容,為讀者帶來全方位的學習體驗。