大數據時代,MapReduce的重要性不言而喻。Hadoop作為MapReduce框架的一個實現(xiàn),受到業(yè)界廣泛的認同,并被廣泛部署和應用。盡管Hadoop為數據開發(fā)工程師入門和編程提供了極大便利,但構造一個真正滿足性能要求的MapReduce程序并不簡單。數據量巨大是大數據工作的現(xiàn)實問題,而對低響應時間的要求則時常困擾著數據開發(fā)工程師?!禜adoop MapReduce性能優(yōu)化》采用原理與實踐相結合的方式,通過原理講解影響MapReduce性能的因素,透過實例一步步地教讀者如何發(fā)現(xiàn)性能瓶頸并消除瓶頸,如何識別系統(tǒng)薄弱環(huán)節(jié)并改善薄弱環(huán)節(jié),講解過程中融合了作者在優(yōu)化實踐過程中積累的豐富經驗,具有很強的針對性。讀完本書,能讓讀者對Hadoop具有更強的駕馭能力,從而構造出性能最優(yōu)的MapReduce程序。Hadoop性能問題既是程序層面的問題,也是系統(tǒng)層面的問題。本書既覆蓋了系統(tǒng)層面的優(yōu)化又覆蓋了程序層面的優(yōu)化,非常適合Hadoop管理員和有經驗的數據開發(fā)工程師閱讀。對于初學者,本書第1章也作了必要的技術鋪墊,避免對后面章節(jié)的理解產生梯度。