注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書教育/教材/教輔教材研究生/本科/專科教材Spark大數據分析技術(Python版 微課版)

Spark大數據分析技術(Python版 微課版)

Spark大數據分析技術(Python版 微課版)

定 價:¥59.00

作 者: 曹潔
出版社: 清華大學出版社
叢編項: 面向新工科專業(yè)建設計算機系列教材
標 簽: 暫缺

購買這本書可以去


ISBN: 9787302625520 出版時間: 2023-03-01 包裝: 平裝
開本: 16開 頁數: 字數:  

內容簡介

  《Spark大數據分析技術(Python版·微課版)/面向新工科專業(yè)建設計算機系列教材》特色:循序漸進講解Spark大數據全流程處理相關技術,配備大量的實例?!禨park大數據分析技術(Python版·微課版)/面向新工科專業(yè)建設計算機系列教材》內容豐富,涵蓋了Spark大數據處理框架、SparkRDD編程、SparkSQL結構化數據處理、HBase分布式數據庫、SparkStreaming流計算、SparkMLlib機器學習、數據可視化等內容?!禨park大數據分析技術(Python版·微課版)/面向新工科專業(yè)建設計算機系列教材》注重Spark各生態(tài)組件原理剖析與算法的Python代碼實現相結合,做到理論與實踐并重?!禨park大數據分析技術(Python版·微課版)/面向新工科專業(yè)建設計算機系列教材》系統(tǒng)介紹Spark大數據處理框架。全書共8章,內容包括大數據技術概述、Spark大數據處理框架、Spark RDD編程、Spark SQL結構化數據處理、HBase分布式數據庫、Spark Streaming流計算、Spark MLlib機器學習、數據可視化?!禨park大數據分析技術(Python版·微課版)/面向新工科專業(yè)建設計算機系列教材》可作為高等院校計算機科學與技術、信息管理與信息系統(tǒng)、軟件工程、數據科學與大數據技術、人工智能等專業(yè)的大數據課程教材,也可供從事大數據開發(fā)和研究工作的工程師和科技工作者參考。

作者簡介

  曹潔,博士,畢業(yè)于同濟大學計算機軟件與理論專業(yè);研究方向為大數據技術、并行分布式處理等。在《軟件學報》《電子學報》《計算機研究與發(fā)展》《通信學報》等核心期刊上發(fā)表學術論文十余篇;主講Python語言程序設計、大數據技術、大數據分析等課程;主編出版7《Python語言程序設計》《Python數據挖掘技術及應用》《Hadoop+Spark大數據技術》等多本省部級規(guī)劃教材。

圖書目錄

第1章 大數據技術概述
1.1 大數據的基本概念
1.1.1 大數據的定義
1.1.2 大數據的特征
1.1.3 大數據思維
1.2 代表性大數據技術
1.2.1 Hadoop
1.2.2 Spark
1.2.3 Flink
1.3 大數據編程語言
1.4 在線資源
1.5 拓展閱讀——三次信息化浪潮的啟示
1.6 習題
第2章 Spark大數據處理框架
2.1 Spark概述
2.1.1 Spark的產生背景
2.1.2 Spark的優(yōu)點
2.1.3 Spark的應用場景
2.1.4 Spark的生態(tài)系統(tǒng)
2.2 Spark運行機制
2.2.1 Spark基本概念
2.2.2 Spark運行架構
2.3 在VirtualBox上安裝Linux集群
2.3.1 Master節(jié)點的安裝
2.3.2 虛擬機克隆安裝Slavel節(jié)點
2.4 Hadoop安裝前的準備工作
2.4.1 創(chuàng)建hadoop用戶和更新APT
2.4.2 安裝SSH、配置SSH無密碼登錄
2.4.3 安裝Java環(huán)境
2.4.4 Linux系統(tǒng)下Scala版本的Eclipse的安裝與配置
2.4.5 Eclipse環(huán)境下Java程序開發(fā)實例
2.5 Hadoop的安裝與配置
2.5.1 下載Hadoop安裝文件
2.5.2 Hadoop單機模式配置
2.5.3 Hadoop偽分布式模式配置
2.5.4 Hadoop分布式模式配置
2.6 Spark的安裝與配置
2.6.1 下載Spark安裝文件
2.6.2 單機模式配置
2.6.3 偽分布式模式配置
2.7 使用PySpark編寫Python代碼
2.8 安裝pip工具和常用的數據分析庫
2.9 安裝Anaconda和配置Jupyter Notebook
2.9.1 安裝Anaconda
2.9.2 配置Jupyter Notebook
2.9.3 運行Jupyter Notebook
2.9.4 配置Jupyter Notebook實現和PySpark交互
2.9.5 為Anaconda安裝擴展庫
2.10 拓展閱讀——Spark誕生的啟示
2.11 習題
……
第3章 Spark RDD編程
第4章 Spark SQL結構化數據處理
第5章 HBase分布式數據庫
第6章 Spark Streaming流計算
第7章 Spark MLlib機器學習
第8章 數據可視化
參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號