本書內容基于Spark新版本展開,符合企業(yè)目前開發(fā)需要。本書全面講解Spark SQL相關知識和實戰(zhàn)應用,各章均提供較為豐富的案例及其詳細的操作步驟,并配套示例源碼、數據集、PPT課件和教學大綱。本書共10章。第1~3章為Spark SQL的基礎準備部分,內容包括Spark SQL的發(fā)展和簡介、Spark的典型數據容器及關系、Spark概述與環(huán)境搭建、Spark典型數據結構RDD;第4~7章為Spark SQL的基礎應用部分,內容包括Spark SQL入門實戰(zhàn)(包括Scala編程基礎)、SQL基礎語法、操作多數據源、SparkSQL性能調優(yōu)等;第8~10章分別通過影評數據分析、商品統計數據分析、咖啡銷售數據分析等3個實戰(zhàn)項目進行鞏固提升。本書內容翔實、示例豐富,既可作為Spark初學者、大數據分析人員、大數據應用開發(fā)人員的自學手冊,也可作為高等院?;蚋呗毟邔T盒S嬎銠C、軟件工程、數據科學與大數據技術、智能科學與技術、人工智能等專業(yè)大數據課程的教材。本書封面貼有清華大學出版社防偽標簽,無標簽者不得銷售。版權所有,侵權必究。舉報:010-62782989,beiqinquan@tup.tsinghua.edu.cn。