本書以Spark 0.9版本為基礎進行編寫,是一本全面介紹Spark及Spark生態(tài)圈相關技術的書籍,是國內首本深入介紹 Spark 原理和架構的技術書籍。主要內容有 Spark 基礎功能介紹及內部重要模塊分析,包括部署模式、調度框架、存儲管理以及應用監(jiān)控;同時也詳細介紹了 Spark 生態(tài)圈中其他的軟件和模塊,包括 SQL 處理引擎 Shark 和 Spark SQL、流式處理引擎 Spark Streaming、圖計算框架 Graphx 以及分布式內存文件系統 Tachyon。本書從概念和原理上對 Spark 核心框架和生態(tài)圈做了詳細的解讀,并對 Spark 的應用現狀和未來發(fā)展做了一定的介紹,旨在為大數據從業(yè)人員和 Spark愛好者提供一個更深入學習的平臺。本書適合任何大數據、Spark 領域的從業(yè)人員閱讀,同時也為架構師、軟件開發(fā)工程師和大數據愛好者展現了一個現代大數據框架的架構原理和實現細節(jié)。相信通過學習本書,讀者能夠熟悉和掌握 Spark 這一當前流行的大數據框架,并將其投入到生產實踐中去。