注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫(kù)Python數(shù)據(jù)分析

Python數(shù)據(jù)分析

Python數(shù)據(jù)分析

定 價(jià):¥79.00

作 者: 江雪松,鄒靜 著
出版社: 清華大學(xué)出版社
叢編項(xiàng): 人工智能科學(xué)與技術(shù)叢書(shū)
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787302555179 出版時(shí)間: 2020-07-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 320 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  這是一個(gè)數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,如何解讀數(shù)據(jù),將數(shù)據(jù)轉(zhuǎn)變?yōu)橹R(shí)、利用知識(shí)做出決策將是所有企業(yè)必不可少的能力。在數(shù)據(jù)分析過(guò)程中我們清洗數(shù)據(jù),探索數(shù)據(jù),利用數(shù)據(jù)進(jìn)行決策。本書(shū)將以當(dāng)前z流行數(shù)據(jù)科學(xué)分析工具Python為基礎(chǔ)介紹如何構(gòu)建基于Python的數(shù)據(jù)科學(xué)環(huán)境,利用Pandas處理與分析數(shù)據(jù),如何利用Matplotlib以及Seaborn進(jìn)行數(shù)據(jù)可視化。同時(shí)本書(shū)還將以商業(yè)應(yīng)用為目標(biāo),通過(guò)學(xué)習(xí)還將掌握何利用學(xué)習(xí)到的Python數(shù)據(jù)分析知識(shí)來(lái)完成客戶(hù)留存分析,同期群分析,時(shí)間序列分析,產(chǎn)品銷(xiāo)售數(shù)據(jù)的關(guān)聯(lián)分析,客戶(hù)聚類(lèi),統(tǒng)計(jì)檢驗(yàn)等數(shù)據(jù)分析。

作者簡(jiǎn)介

  江雪松2001年獲工學(xué)碩士學(xué)位,曾服務(wù)于華為、諾基亞等公司,有豐富的產(chǎn)品團(tuán)隊(duì)與研發(fā)團(tuán)隊(duì)管理經(jīng)驗(yàn)。先后擔(dān)任項(xiàng)目經(jīng)理、研發(fā)經(jīng)理、產(chǎn)品研發(fā)負(fù)責(zé)人,管理多個(gè)產(chǎn)品全球支持與交付團(tuán)隊(duì),軟件維護(hù)業(yè)務(wù)。 鄒靜2006年獲理學(xué)碩士學(xué)位,現(xiàn)服務(wù)于四川省人民醫(yī)院,擔(dān)任副主任藥師。擁有十多年的臨床藥物試驗(yàn)設(shè)計(jì)、數(shù)據(jù)統(tǒng)計(jì)與分析經(jīng)驗(yàn)。先后參加了多個(gè)國(guó)家自然科學(xué)基金項(xiàng)目及四川省衛(wèi)生廳科研項(xiàng)目。

圖書(shū)目錄


目錄




上篇Pandas數(shù)據(jù)分析基礎(chǔ)

第1章數(shù)據(jù)分析初探

1.1“數(shù)據(jù)+”時(shí)代的到來(lái)

1.2什么是數(shù)據(jù)分析

1.2.1數(shù)據(jù)分析的目標(biāo)

1.2.2數(shù)據(jù)分析分類(lèi)

1.2.3典型的數(shù)據(jù)分析方法

1.3數(shù)據(jù)分析的基本流程

1.3.1問(wèn)題定義

1.3.2收集數(shù)據(jù)

1.3.3數(shù)據(jù)處理

1.3.4數(shù)據(jù)分析

1.3.5結(jié)果解讀與應(yīng)用

1.4硝煙中的數(shù)據(jù)分析

1.4.1數(shù)據(jù)分析的產(chǎn)生

1.4.2驗(yàn)證問(wèn)題

1.4.3尋找原因

1.4.4數(shù)據(jù)怎么說(shuō)

1.4.5數(shù)據(jù)分析中應(yīng)該避免的典型問(wèn)題

第2章搭建數(shù)據(jù)科學(xué)開(kāi)發(fā)環(huán)境

2.1為什么選擇Python

2.1.1人生苦短,我用Python

2.1.2為何Python是數(shù)據(jù)科學(xué)家的最佳選擇

2.2Python數(shù)據(jù)科學(xué)開(kāi)發(fā)棧

2.2.1Cython

2.2.2NumPy

2.2.3IPython

2.2.4Jupyter

2.2.5SciPy

2.2.6Matplotlib

2.2.7Pandas

2.2.8Scikitlearn


2.2.9NetworkX


2.2.10PyMC3

2.2.11數(shù)據(jù)科學(xué)領(lǐng)域中最新的一些Python包

2.3Anaconda的安裝與使用

2.3.1安裝Anaconda

2.3.2利用Conda管理Python環(huán)境

2.3.3利用Conda管理Python包

2.3.4安裝本書(shū)所需的包

2.4使用Jupyter Notebook進(jìn)行可重復(fù)數(shù)據(jù)分析

2.4.1Jupyter Notebook的配置

2.4.2Jupyter Notebook中的單元格

2.4.3Jupyter Notebook中的命令模式與編輯模式鍵

2.4.4使用Jupyter Notebook進(jìn)行數(shù)據(jù)分析





第3章Pandas基礎(chǔ)

3.1什么是DataFrame

3.1.1DataFrame的基本要素

3.1.2數(shù)據(jù)類(lèi)型

3.1.3了解Series

3.1.4鏈?zhǔn)椒椒?br />
3.2索引與列

3.2.1修改索引與列

3.2.2添加、修改或刪除列

3.3選擇多列

第4章數(shù)據(jù)篩選

4.1使用.loc和.iloc篩選行與列數(shù)據(jù)

4.1.1選擇Series和DataFrame中的行

4.1.2同時(shí)選擇行與列

4.2布爾選擇

4.2.1計(jì)算布爾值

4.2.2多條件篩選數(shù)據(jù)

第5章開(kāi)始利用Pandas進(jìn)行數(shù)據(jù)分析

5.1了解元數(shù)據(jù)

5.2數(shù)據(jù)類(lèi)型轉(zhuǎn)換

5.3缺失數(shù)據(jù)與異常數(shù)據(jù)處理

5.3.1缺失值與重復(fù)值

5.3.2處理缺失數(shù)據(jù)

5.3.3NumPy與Pandas對(duì)缺失數(shù)據(jù)的不同處理方式

5.3.4填充缺失值

5.4處理重復(fù)數(shù)據(jù)

5.5異常值

5.6描述性統(tǒng)計(jì)


第6章數(shù)據(jù)整理

6.1什么是數(shù)據(jù)整理

6.1.1數(shù)據(jù)的語(yǔ)義

6.1.2整齊的數(shù)據(jù)


6.2數(shù)據(jù)整理實(shí)戰(zhàn)

6.2.1列標(biāo)題是值,而非變量名

6.2.2多個(gè)變量存儲(chǔ)在一列中

6.2.3變量既在列中存儲(chǔ),又在行中存儲(chǔ)

6.2.4多個(gè)觀測(cè)單元存儲(chǔ)在同一表中

6.2.5一個(gè)觀測(cè)單元存儲(chǔ)在多個(gè)表中

6.2.6思考

第7章分組統(tǒng)計(jì)

7.1分組、應(yīng)用和聚合

7.2Pandas中的GroupBy操作

7.2.1單列數(shù)據(jù)分組統(tǒng)計(jì)

7.2.2多列數(shù)據(jù)分組統(tǒng)計(jì)

7.2.3使用自定義函數(shù)進(jìn)行分組統(tǒng)計(jì)

7.2.4數(shù)據(jù)過(guò)濾與變換

第8章數(shù)據(jù)整合

8.1數(shù)據(jù)讀入

8.1.1基本數(shù)據(jù)讀入方法

8.1.2文件讀取進(jìn)階

8.1.3讀取其他格式文件

8.2數(shù)據(jù)合并

8.2.1認(rèn)識(shí)merge操作

8.2.2merge進(jìn)階

8.2.3join與concat

第9章數(shù)據(jù)可視化

9.1Matplotlib

9.1.1繪制第一個(gè)散點(diǎn)圖

9.1.2理解figure與axes

9.1.3Matplotlib中面向?qū)ο笈c類(lèi)Matlab語(yǔ)法的區(qū)別

9.1.4修改坐標(biāo)軸屬性

9.1.5修改圖形屬性

9.1.6定制圖例,添加標(biāo)注

9.1.7子圖

9.1.8利用Matplotlib繪制各種圖形

9.2Pandas繪圖

9.2.1Pandas基礎(chǔ)繪圖

9.2.2整合Pandas繪圖與Matplotlib繪圖

9.3Seaborn

9.3.1Seaborn中的樣式

9.3.2Seaborn繪制統(tǒng)計(jì)圖形

9.4可視化進(jìn)階

9.4.1其他可視化工具

9.4.2推薦讀物

第10章探索性數(shù)據(jù)分析——某電商銷(xiāo)售數(shù)據(jù)分析

10.1數(shù)據(jù)清洗

10.1.1分析準(zhǔn)備

10.1.2了解數(shù)據(jù)

10.2數(shù)據(jù)清洗與整理

10.2.1數(shù)據(jù)類(lèi)型轉(zhuǎn)換與錯(cuò)誤數(shù)據(jù)刪除

10.2.2添加新數(shù)據(jù)

10.3探索性數(shù)據(jù)分析

10.3.1客戶(hù)分析

10.3.2訂單趨勢(shì)分析

10.3.3客戶(hù)國(guó)家分析

10.3.4留給讀者的問(wèn)題

下篇Python數(shù)據(jù)分析實(shí)戰(zhàn)

第11章群組分析

11.1群組分析概述

11.1.1從AARRR到RARRA的轉(zhuǎn)變

11.1.2什么是群組分析

11.2群組分析實(shí)戰(zhàn)

11.2.1定義群組以及周期

11.2.2群組分析具體過(guò)程

11.2.3思考

第12章利用RFM分析對(duì)用戶(hù)進(jìn)行分類(lèi)

12.1RFM分析簡(jiǎn)介

12.1.1RFM模型概述

12.1.2理解RFM

12.2RFM實(shí)戰(zhàn)

12.2.1R、F、M值的計(jì)算

12.2.2利用RFM模型對(duì)客戶(hù)進(jìn)行細(xì)分

12.2.3思考

第13章購(gòu)物籃分析

13.1購(gòu)物籃分析概述

13.1.1什么是購(gòu)物籃分析

13.1.2購(gòu)物籃分析在超市中的應(yīng)用

13.1.3購(gòu)物籃分析實(shí)現(xiàn)

13.2購(gòu)物籃分析案例

13.2.1Mlxtend庫(kù)中Apriori算法使用介紹

13.2.2在線銷(xiāo)售數(shù)據(jù)購(gòu)物籃分析

13.3留給讀者的思考

第14章概率分布

14.1隨機(jī)數(shù)

14.2常見(jiàn)的概率分布


14.2.1均勻分布

14.2.2正態(tài)分布

14.2.3二項(xiàng)分布

14.2.4泊松分布

14.2.5幾何分布與指數(shù)分布

14.3點(diǎn)估計(jì)與置信區(qū)間

14.3.1點(diǎn)估計(jì)

14.3.2抽樣分布與中心極限定理

14.3.3置信區(qū)間

14.4留給讀者的思考

第15章假設(shè)檢驗(yàn)

15.1假設(shè)檢驗(yàn)概述

15.1.1初識(shí)假設(shè)檢驗(yàn)

15.1.2假設(shè)檢驗(yàn)的步驟

15.1.3假設(shè)檢驗(yàn)中的Ⅰ類(lèi)錯(cuò)誤與Ⅱ類(lèi)錯(cuò)誤

15.2Python中的假設(shè)檢驗(yàn)

15.2.1單樣本ttest

15.2.2雙樣本ttest

15.2.3配對(duì)ttest

15.2.4卡方檢驗(yàn)

15.3留給讀者的思考

第16章一名數(shù)據(jù)分析師的游戲上線之旅

16.1游戲啟動(dòng)時(shí)間是否超過(guò)目標(biāo)

16.1.1啟動(dòng)時(shí)間是否超過(guò)3秒

16.1.2構(gòu)造啟動(dòng)時(shí)間監(jiān)測(cè)圖

16.2次日留存率是否大于30%

16.3應(yīng)該在游戲第幾關(guān)加入關(guān)聯(lián)微信提示

16.3.1A/B測(cè)試

16.3.2貝葉斯解決方案

16.4如何定價(jià)

16.5留給讀者的思考

第17章利用數(shù)據(jù)分析找工作

17.1設(shè)定分析目標(biāo)

17.1.1問(wèn)題定義

17.1.2獲取數(shù)據(jù)

17.2準(zhǔn)備分析數(shù)據(jù)

17.2.1數(shù)據(jù)準(zhǔn)備

17.2.2數(shù)據(jù)清洗

17.3開(kāi)始數(shù)據(jù)分析

17.3.1職位來(lái)自哪里

17.3.2職位薪酬如何

17.3.3崗位要求

17.3.4思考

第18章用數(shù)據(jù)解讀成都房?jī)r(jià)

18.1設(shè)定分析目標(biāo)

18.1.1問(wèn)題定義

18.1.2獲取數(shù)據(jù)

18.2解讀成都二手房

18.2.1數(shù)據(jù)準(zhǔn)備

18.2.2列名調(diào)整

18.2.3數(shù)據(jù)類(lèi)型轉(zhuǎn)換

18.2.4數(shù)據(jù)解讀

18.2.5思考

第19章時(shí)間序列分析

19.1認(rèn)識(shí)時(shí)間序列數(shù)據(jù)

19.1.1讀入時(shí)間序列數(shù)據(jù)

19.1.2時(shí)間序列數(shù)據(jù)的可視化

19.2時(shí)間序列數(shù)據(jù)的分解

19.2.1認(rèn)識(shí)時(shí)間序列數(shù)據(jù)中的模式

19.2.2Python中進(jìn)行時(shí)間序列數(shù)據(jù)的分解

19.3時(shí)間序列的平穩(wěn)性

19.3.1認(rèn)識(shí)平穩(wěn)與非平穩(wěn)時(shí)間序列

19.3.2如何讓時(shí)間序列平穩(wěn)

19.4利用ARIMA模型分析家具銷(xiāo)售

19.4.1ARIMA模型簡(jiǎn)介

19.4.2數(shù)據(jù)準(zhǔn)備

19.4.3ARIMA模型中的參數(shù)

19.5留給讀者的思考

第20章股票數(shù)據(jù)分析

20.1股票收益分析

20.1.1獲取股票數(shù)據(jù)

20.1.2計(jì)算每日收益

20.1.3多只股票收益比較

20.1.4股價(jià)相關(guān)性分析

20.2CAPM資產(chǎn)定價(jià)模型選股

20.2.1CAPM公式

20.2.2在Python中實(shí)現(xiàn)CAPM

20.3留給讀者的思考

第21章大規(guī)模數(shù)據(jù)處理

21.1不同規(guī)模數(shù)據(jù)處理工具的選擇

21.2利用Pandas處理大規(guī)模數(shù)據(jù)

21.2.1文件分塊讀入

21.2.2使用數(shù)據(jù)庫(kù)

21.2.3使用DASK

21.3其他可選方法

21.4留給讀者的思考

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)