注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)家庭與辦公軟件Python數(shù)據(jù)分析與大數(shù)據(jù)處理從入門(mén)到精通

Python數(shù)據(jù)分析與大數(shù)據(jù)處理從入門(mén)到精通

Python數(shù)據(jù)分析與大數(shù)據(jù)處理從入門(mén)到精通

定 價(jià):¥89.00

作 者: 朱春旭 著
出版社: 北京大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787301307656 出版時(shí)間: 2019-10-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 464 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  《Python數(shù)據(jù)分析與大數(shù)據(jù)處理從入門(mén)到精通》主要講解數(shù)據(jù)分析與大數(shù)據(jù)處理所需的技術(shù)、基礎(chǔ)設(shè)施、核心概念、實(shí)施流程。從編程語(yǔ)言準(zhǔn)備、數(shù)據(jù)采集與清洗、數(shù)據(jù)分析與可視化,到大型數(shù)據(jù)的分布式存儲(chǔ)與分布式計(jì)算,貫穿了整個(gè)大數(shù)據(jù)項(xiàng)目開(kāi)發(fā)流程。本書(shū)輕理論、重實(shí)踐,目的是讓讀者快速上手。1篇首先介紹了Python的基本語(yǔ)法、面向?qū)ο箝_(kāi)發(fā)、模塊化設(shè)計(jì)等,掌握Python的編程方式。然后介紹了多線程、多進(jìn)程及其相互間的通信,讓讀者對(duì)分布式程序有個(gè)基本的認(rèn)識(shí)。第2篇介紹了網(wǎng)絡(luò)數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)存儲(chǔ)等技術(shù)。第3篇介紹了Python常用的數(shù)據(jù)分析工具,擴(kuò)展了更多的數(shù)據(jù)清洗、插值方法,為最終的數(shù)據(jù)可視化奠定基礎(chǔ)。第4篇是大數(shù)據(jù)分析的重點(diǎn)。首先介紹了Hadoop的框架原理、調(diào)度原理,MapReduce原理與編程模型、環(huán)境搭建,接著介紹了Spark框架原理、環(huán)境搭建方式,以及如何與Hive等第三方工具進(jìn)行交互,還介紹了新的結(jié)構(gòu)化流式處理技術(shù)。第5篇通過(guò)三個(gè)項(xiàng)目實(shí)例,綜合介紹了如何分析網(wǎng)頁(yè)、如何搭建分布式爬蟲(chóng)、如何應(yīng)對(duì)常見(jiàn)的反爬蟲(chóng)、如何設(shè)計(jì)數(shù)據(jù)模型、如何設(shè)計(jì)架構(gòu)模型、如何在實(shí)踐中綜合運(yùn)用前四篇涉及的技術(shù)。本書(shū)既適合非計(jì)算機(jī)專業(yè)的編程“小白”,也適合剛畢業(yè)或即將畢業(yè)走向工作崗位的廣大畢業(yè)生,以及已經(jīng)有編程經(jīng)驗(yàn),但想轉(zhuǎn)行做大數(shù)據(jù)分析的專業(yè)人士。同時(shí),還可以作為廣大職業(yè)院校、電腦培訓(xùn)班的教學(xué)參考用書(shū)。

作者簡(jiǎn)介

  朱春旭,高級(jí)軟件工程師,長(zhǎng)期對(duì)企業(yè)、軟件開(kāi)發(fā)公司、政府機(jī)構(gòu)培訓(xùn)大數(shù)據(jù)開(kāi)發(fā)與應(yīng)用課程,對(duì)Python大數(shù)據(jù)處理與分析相關(guān)應(yīng)用有深入研究,并編寫(xiě)有《極客內(nèi)參-大數(shù)據(jù)開(kāi)發(fā)實(shí)戰(zhàn)》教程45篇,總共30000 字。

圖書(shū)目錄

第1篇 Python程序設(shè)計(jì) \n
第1章 Python入門(mén) 3 \n
1.1 Python概述 4 \n
1.2 搭建Python開(kāi)發(fā)環(huán)境 6 \n
1.3 Python開(kāi)發(fā)工具介紹 11 \n
1.4 Python軟件包的管理 13 \n
1.5 實(shí)訓(xùn):編寫(xiě)“Hello World” 15 \n
本章小結(jié) 16 \n
第2章 Python基礎(chǔ) 17 \n
2.1 變量 18 \n
2.2 標(biāo)識(shí)符 24 \n
2.3 代碼組織 26 \n
2.4 輸入與輸出 28 \n
2.5 運(yùn)算符與優(yōu)先級(jí) 30 \n
2.6 新手問(wèn)答 30 \n
2.7 實(shí)訓(xùn):設(shè)計(jì)一個(gè)簡(jiǎn)易計(jì)算器 31 \n
本章小結(jié) 31 \n
第3章 數(shù)據(jù)類(lèi)型與流程控制 32 \n
3.1 數(shù)字類(lèi)型 33 \n
3.2 字符串類(lèi)型 37 \n
3.3 集合類(lèi)型 40 \n
3.4 流程控制語(yǔ)句 45 \n
3.5 新手問(wèn)答 47 \n
3.6 實(shí)訓(xùn):設(shè)計(jì)算法,輸出乘法表 49 \n
本章小結(jié) 50 \n
第4章 函數(shù)、模塊、包 51 \n
4.1 自定義函數(shù) 52 \n
4.2 函數(shù)參數(shù) 55 \n
4.3 函數(shù)式編程 58 \n
4.4 模塊與包 63 \n
4.5 新手問(wèn)答 65 \n
4.6 實(shí)訓(xùn):設(shè)計(jì)算法,對(duì)列表進(jìn)行排序 67 \n
本章小結(jié) 68 \n
第5章 面向?qū)ο蟮某绦蛟O(shè)計(jì) 69 \n
5.1 面向?qū)ο?70 \n
5.2 自定義類(lèi) 71 \n
5.3 屬性 73 \n
5.4 方法 79 \n
5.5 類(lèi)的繼承 83 \n
5.6 可調(diào)用對(duì)象 86 \n
5.7 不可變對(duì)象 87 \n
5.8 新手問(wèn)答 88 \n
5.9 實(shí)訓(xùn):設(shè)計(jì)算法,構(gòu)造一棵二叉樹(shù) 90 \n
本章小結(jié) 92 \n
第6章 高級(jí)主題 93 \n
6.1 生成器 94 \n
6.2 迭代器 96 \n
6.3 異步處理 97 \n
6.4 錯(cuò)誤、調(diào)試 103 \n
6.5 新手問(wèn)答 108 \n
6.6 實(shí)訓(xùn):使用多進(jìn)程技術(shù)統(tǒng)計(jì)數(shù)據(jù)并匯總 109 \n
本章小結(jié) 110 \n
第2篇 數(shù)據(jù)采集與數(shù)據(jù)清洗 \n
第7章 網(wǎng)絡(luò)數(shù)據(jù)采集 113 \n
7.1 HTTP請(qǐng)求概述 114 \n
7.2 XPath網(wǎng)頁(yè)解析 114 \n
7.3 Scrapy數(shù)據(jù)采集入門(mén) 119 \n
7.4 Scrapy應(yīng)對(duì)反爬蟲(chóng)程序 126 \n
7.5 CrawlSpider類(lèi) 131 \n
7.6 分布式爬蟲(chóng) 132 \n
7.7 新手問(wèn)答 136 \n
7.8 實(shí)訓(xùn):構(gòu)建百度云音樂(lè)爬蟲(chóng) 136 \n
本章小結(jié) 139 \n
第8章 數(shù)據(jù)清洗 140 \n
8.1 數(shù)據(jù)清洗的意義 141 \n
8.2 數(shù)據(jù)清洗的內(nèi)容 141 \n
8.3 數(shù)據(jù)格式與存儲(chǔ)類(lèi)型 142 \n
8.4 數(shù)據(jù)清洗的步驟 145 \n
8.5 數(shù)據(jù)清洗的工具 147 \n
8.6 新手問(wèn)答 151 \n
8.7 實(shí)訓(xùn):清洗百度云音樂(lè)數(shù)據(jù)并儲(chǔ)存到CSV  151 \n
本章小結(jié) 152 \n
第3篇 數(shù)據(jù)分析與可視化 \n
第9章 NumPy數(shù)值計(jì)算 155 \n
9.1 NumPy基礎(chǔ) 156 \n
9.2 形狀操作 164 \n
9.3 副本、淺拷貝和深拷貝 166 \n
9.4 高級(jí)索引 168 \n
9.5 排序統(tǒng)計(jì) 171 \n
9.6 新手問(wèn)答 173 \n
9.7 實(shí)訓(xùn):銷(xiāo)售額統(tǒng)計(jì)  174 \n
本章小結(jié) 175 \n
第10章 Matplotlib可視化 176 \n
10.1 圖形的基本要素 177 \n
10.2 繪圖基礎(chǔ) 177 \n
10.3 設(shè)置樣式 186 \n
10.4 圖形樣例 189 \n
10.5 新手問(wèn)答 198 \n
10.6 實(shí)訓(xùn):營(yíng)業(yè)數(shù)據(jù)可視化 199 \n
本章小結(jié) 201 \n
第11章 Pandas統(tǒng)計(jì)分析 202 \n
11.1 Pandas數(shù)據(jù)結(jié)構(gòu) 203 \n
11.2 基礎(chǔ)功能 210 \n
11.3 統(tǒng)計(jì)分析 217 \n
11.4 時(shí)間數(shù)據(jù) 229 \n
11.5 數(shù)據(jù)整理 231 \n
11.6 高級(jí)功能 234 \n
11.7 讀寫(xiě)MySQL數(shù)據(jù)庫(kù) 236 \n
11.8 新手問(wèn)答 237 \n
11.9 實(shí)訓(xùn):成績(jī)分析 237 \n
本章小結(jié) 239 \n
第12章 Seaborn可視化 240 \n
12.1 Seaborn概述 241 \n
12.2 可視化數(shù)據(jù)關(guān)系 242 \n
12.3 根據(jù)數(shù)據(jù)分類(lèi)繪圖 246 \n
12.4 單變量與雙變量 251 \n
12.5 線性關(guān)系 256 \n
12.6 新手問(wèn)答 258 \n
12.7 實(shí)訓(xùn):成績(jī)分析可視化 258 \n
本章小結(jié) 260 \n
第4篇 大數(shù)據(jù)存儲(chǔ)與快速分析篇 \n
第13章 Hadoop數(shù)據(jù)存儲(chǔ)與基本操作 263 \n
13.1 Hadoop概述 264 \n
13.2 Hadoop數(shù)據(jù)存儲(chǔ)與任務(wù)調(diào)度原理 268 \n
13.3 Hadoop基礎(chǔ)環(huán)境搭建 273 \n
13.4 Hadoop部署模式 294 \n
13.5 Hadoop常用操作命令 298 \n
13.6 新手問(wèn)答 300 \n
13.7 實(shí)訓(xùn):動(dòng)手搭建Hadoop集群環(huán)境 301 \n
本章小結(jié) 309 \n
第14章 Spark入門(mén) 310 \n
14.1 Spark概述 311 \n
14.2 Spark核心原理 312 \n
14.3 Spark基礎(chǔ)環(huán)境搭建 315 \n
14.4 Spark運(yùn)行模式 317 \n
14.5 新手問(wèn)答 321 \n
14.6 實(shí)訓(xùn):動(dòng)手搭建Spark集群 322 \n
本章小結(jié) 323 \n
第15章 Spark RDD編程 324 \n
15.1 RDD設(shè)計(jì)原理 325 \n
15.2 RDD編程 328 \n
15.3 鍵值對(duì)RDD 335 \n
15.4 文件讀寫(xiě) 340 \n
15.5 編程進(jìn)階 342 \n
15.6 新手問(wèn)答 347 \n
15.7 實(shí)訓(xùn):統(tǒng)計(jì)海鮮銷(xiāo)售情況 348 \n
本章小結(jié) 350 \n
第16章 Spark SQL編程 351 \n
16.1 Spark SQL概述 352 \n
16.2 創(chuàng)建DataFrame對(duì)象 360 \n
16.3 DataFrame常用API 364 \n
16.4 保存DataFrame 370 \n
16.5 新手問(wèn)答 372 \n
16.6 實(shí)訓(xùn):統(tǒng)計(jì)手機(jī)銷(xiāo)售情況 373 \n
本章小結(jié) 375 \n
第17章 Spark流式計(jì)算編程 376 \n
17.1 流計(jì)算簡(jiǎn)介 377 \n
17.2 Discretized Stream 379 \n
17.3 Structured Streaming 385 \n
17.4 新手問(wèn)答 397 \n
17.5 實(shí)訓(xùn):實(shí)時(shí)統(tǒng)計(jì)貸款金額 397 \n
本章小結(jié) 398 \n
第5篇 項(xiàng)目實(shí)戰(zhàn)篇 \n
第18章 分析電商網(wǎng)站銷(xiāo)售數(shù)據(jù) 401 \n
18.1 目標(biāo)分析 402 \n
18.2 數(shù)據(jù)采集 405 \n
18.3 數(shù)據(jù)分析 411 \n
本章小結(jié) 416 \n
第19章 分析旅游網(wǎng)站數(shù)據(jù) 417 \n
19.1 目標(biāo)分析 418 \n
19.2 數(shù)據(jù)采集 420 \n
19.3 數(shù)據(jù)分析 425 \n
本章小結(jié) 429 \n
第20章 分析在售二手房數(shù)據(jù) 430 \n
20.1 目標(biāo)分析 431 \n
20.2 數(shù)據(jù)采集 434 \n
20.3 數(shù)據(jù)分析 440 \n
本章小結(jié) 446 \n
附錄:Python常見(jiàn)面試題精選 447 \n
主要參考文獻(xiàn) 450

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)