本書針對大數(shù)據(jù)處理的兩種典型方式,即批處理和流處理,介紹了當前Apache軟件基金會三大軟件開源項目Hadoop、Spark和Storm中主要的存儲及計算框架。本書從初學者的角度出發(fā),聚焦于大數(shù)據(jù)處理框架的基本原理以及安裝和部署等實踐過程。通過本書的學習,讀者在了解處理框架的結構、設計原理以及執(zhí)行流程等原理性知識的同時,還可以結合本書給出的完整部署過程以及WordCount等示例的完整源代碼,熟悉如何使用這些處理框架來編寫大數(shù)據(jù)處理程序以及大數(shù)據(jù)處理程序的基本結構。本書配套PPT、源代碼等資源,歡迎選用本書作為教材的老師登錄機工教育服務網www.cmpedu.com注冊下載。本書可作為高等院校計算機、數(shù)據(jù)科學與大數(shù)據(jù)技術及人工智能或相關專業(yè)的本科生或研究生教材,也可供相關工程技術人員閱讀參考。