本書系統(tǒng)、全面地介紹大數(shù)據(jù)技術的基礎知識。全書共13章,首先介紹大數(shù)據(jù)行業(yè)與技術趨勢;然后介紹大數(shù)據(jù)生態(tài)圈的各項技術,包括分布式文件系統(tǒng)、Hive分布式數(shù)據(jù)倉庫、HBase技術原理、MapReduce和YARN技術原理、Spark基于內存的分布式計算、Flink流批一體分布式實時處理引擎、數(shù)據(jù)采集與數(shù)據(jù)裝載工具、Kafka分布式消息訂閱系統(tǒng)、高可靠集群安全模式、分布式全文檢索Elasticsearch、Redis內存數(shù)據(jù)庫等;最后介紹華為大數(shù)據(jù)解決方案。通過學習本書所講內容,讀者可以整體了解大數(shù)據(jù)技術,掌握大數(shù)據(jù)生態(tài)圈中各項技術最為基礎和關鍵的知識。本書可作為數(shù)據(jù)科學與大數(shù)據(jù)、軟件工程、計算機科學與技術等專業(yè)的大數(shù)據(jù)概論課程的教材,也可供大數(shù)據(jù)工程技術人員學習或參考使用,還可作為華為HCIA認證考試的培訓教材。