大數(shù)據(jù)讓我們以一種前所未有的方式,通過對海量數(shù)據(jù)進行分析,獲得有巨大價值的產品和服務,*終形成變革之力。本書圍繞Hadoop和Spark這兩個主流技術進行講解,主要內容包括Hadoop環(huán)境配置、分布式文件系統(tǒng)HDFS、分布式計算框架MapReduce、資源調度框架YARN與Hadoop新特性、大數(shù)據(jù)數(shù)據(jù)倉庫Hive、離線處理輔助系統(tǒng)、Spark Core、 Spark SQL、Spark Streaming等知識。為保證*學習效果,本書緊密結合實際應用,利用大量案例說明和實踐,提煉含金量十足的開發(fā)經驗。本書使用Hadoop和Spark進行大數(shù)據(jù)開發(fā),并配以完善的學習資源和支持服務,包括視頻教程、案例素材下載、學習交流社區(qū)、討論組等終身學習內容,為開發(fā)者帶來全方位的學習體驗,更多技術支持請訪問課工場官網:www.kgc.cn。