注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)工業(yè)技術(shù)建筑科學(xué)建筑設(shè)計(jì)Python數(shù)據(jù)分析與數(shù)據(jù)化運(yùn)營(yíng)

Python數(shù)據(jù)分析與數(shù)據(jù)化運(yùn)營(yíng)

Python數(shù)據(jù)分析與數(shù)據(jù)化運(yùn)營(yíng)

定 價(jià):¥99.00

作 者: 宋天龍
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787111584605 出版時(shí)間: 2017-12-01 包裝:
開本: 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書內(nèi)容從邏輯上共分為兩大部分,第壹部分是有關(guān)數(shù)據(jù)分析類的主題,第二部分是有關(guān)數(shù)據(jù)化運(yùn)營(yíng)的主題。第壹部分的內(nèi)容包括1/2/3/4章和附錄,主要介紹了Python和數(shù)據(jù)化運(yùn)營(yíng)的基本知識(shí)、數(shù)據(jù)來源獲取、數(shù)據(jù)預(yù)處理以及數(shù)據(jù)分析和挖掘的關(guān)鍵經(jīng)驗(yàn)。第二部分的內(nèi)容包括5/6/7/8/9章的內(nèi)容,分別介紹了會(huì)員運(yùn)營(yíng)、商品運(yùn)營(yíng)、流量運(yùn)營(yíng)和內(nèi)容運(yùn)營(yíng)四個(gè)大主題,以及提升數(shù)據(jù)化運(yùn)營(yíng)價(jià)值度的方法。在每個(gè)數(shù)據(jù)化運(yùn)營(yíng)主題中都包含了基本知識(shí)、評(píng)估指標(biāo)、應(yīng)用場(chǎng)景、數(shù)據(jù)分析模型、數(shù)據(jù)分析小技巧、數(shù)據(jù)分析大實(shí)話以及2個(gè)應(yīng)用案例。

作者簡(jiǎn)介

暫缺《Python數(shù)據(jù)分析與數(shù)據(jù)化運(yùn)營(yíng)》作者簡(jiǎn)介

圖書目錄

目錄 Contents \n
贊譽(yù) \n
前言 \n
第1章 Python和數(shù)據(jù)化運(yùn)營(yíng)1 \n
1.1 用Python做數(shù)據(jù)化運(yùn)營(yíng)1 \n
1.1.1 Python是什么1 \n
1.1.2 數(shù)據(jù)化運(yùn)營(yíng)是什么2 \n
1.1.3 Python用于數(shù)據(jù)化運(yùn)營(yíng)5 \n
1.2 數(shù)據(jù)化運(yùn)營(yíng)所需的Python相關(guān)工具和組件6 \n
1.2.1 Python程序6 \n
1.2.2 Python IDE7 \n
1.2.3 Python第三方庫(kù)8 \n
1.2.4 數(shù)據(jù)庫(kù)和客戶端16 \n
1.2.5 SSH遠(yuǎn)程客戶端18 \n
1.3 內(nèi)容延伸:Python的OCR和TensorFlow18 \n
1.3.1 OCR工具:Tesseract-OCR18 \n
1.3.2 機(jī)器學(xué)習(xí)框架—TensorFlow19 \n
1.4 第一個(gè)用Python實(shí)現(xiàn)的數(shù)據(jù)化運(yùn)營(yíng)分析實(shí)例—銷售預(yù)測(cè)20 \n
1.4.1 案例概述20 \n
1.4.2 案例過程20 \n
1.4.3 案例小結(jié)28 \n
1.5 本章小結(jié)28 \n
第2章 數(shù)據(jù)化運(yùn)營(yíng)的數(shù)據(jù)來源31 \n
2.1 數(shù)據(jù)化運(yùn)營(yíng)的數(shù)據(jù)來源類型31 \n
2.1.1 數(shù)據(jù)文件31 \n
2.1.2 數(shù)據(jù)庫(kù)32 \n
2.1.3 API33 \n
2.1.4 流式數(shù)據(jù)34 \n
2.1.5 外部公開數(shù)據(jù)34 \n
2.1.6 其他35 \n
2.2 使用Python獲取運(yùn)營(yíng)數(shù)據(jù)35 \n
2.2.1 從文本文件讀取運(yùn)營(yíng)數(shù)據(jù)35 \n
2.2.2 從Excel獲取運(yùn)營(yíng)數(shù)據(jù)46 \n
2.2.3 從關(guān)系型數(shù)據(jù)庫(kù)MySQL讀取運(yùn)營(yíng)數(shù)據(jù)48 \n
2.2.4 從非關(guān)系型數(shù)據(jù)庫(kù)MongoDB讀取運(yùn)營(yíng)數(shù)據(jù)56 \n
2.2.5 從API獲取運(yùn)營(yíng)數(shù)據(jù)59 \n
2.3 內(nèi)容延伸:讀取非結(jié)構(gòu)化網(wǎng)頁、文本、圖像、視頻、語音64 \n
2.3.1 從網(wǎng)頁中爬取運(yùn)營(yíng)數(shù)據(jù)64 \n
2.3.2 讀取非結(jié)構(gòu)化文本數(shù)據(jù)65 \n
2.3.3 讀取圖像數(shù)據(jù)65 \n
2.3.4 讀取視頻數(shù)據(jù)68 \n
2.3.5 讀取語音數(shù)據(jù)70 \n
2.4 本章小結(jié)75 \n
第3章 11條數(shù)據(jù)化運(yùn)營(yíng)不得不知道的數(shù)據(jù)預(yù)處理經(jīng)驗(yàn)76 \n
3.1 數(shù)據(jù)清洗:缺失值、異常值和重復(fù)值的處理76 \n
3.1.1 數(shù)據(jù)列缺失的4種處理方法76 \n
3.1.2 不要輕易拋棄異常數(shù)據(jù)78 \n
3.1.3  數(shù)據(jù)重復(fù)就需要去重嗎79 \n
3.1.4 代碼實(shí)操:Python數(shù)據(jù)清洗81 \n
3.2 將分類數(shù)據(jù)和順序數(shù)據(jù)轉(zhuǎn)換為標(biāo)志變量89 \n
3.2.1 分類數(shù)據(jù)和順序數(shù)據(jù)是什么89 \n
3.2.2 運(yùn)用標(biāo)志方法處理分類和順序數(shù)據(jù)90 \n
3.2.3 代碼實(shí)操:Python標(biāo)志轉(zhuǎn)換90 \n
3.3 大數(shù)據(jù)時(shí)代的數(shù)據(jù)降維94 \n
3.3.1 需要數(shù)據(jù)降維的情況94 \n
3.3.2 基于特征選擇的降維94 \n
3.3.3 基于維度轉(zhuǎn)換的降維96 \n
3.3.4 代碼實(shí)操:Python數(shù)據(jù)降維97 \n
3.4 解決樣本類別分布不均衡的問題100 \n
3.4.1 哪些運(yùn)營(yíng)場(chǎng)景中容易出現(xiàn)樣本不均衡100 \n
3.4.2 通過過抽樣和欠抽樣解決樣本不均衡101 \n
3.4.3 通過正負(fù)樣本的懲罰權(quán)重解決樣本不均衡101 \n
3.4.4 通過組合/集成方法解決樣本不均衡102 \n
3.4.5 通過特征選擇解決樣本不均衡102 \n
3.4.6 代碼實(shí)操:Python處理樣本不均衡102 \n
3.5 如何解決運(yùn)營(yíng)數(shù)據(jù)源的沖突問題106 \n
3.5.1 為什么會(huì)出現(xiàn)多數(shù)據(jù)源的沖突107 \n
3.5.2 如何應(yīng)對(duì)多數(shù)據(jù)源的沖突問題109 \n
3.6 數(shù)據(jù)化運(yùn)營(yíng)要抽樣還是全量數(shù)據(jù)109 \n
3.6.1 什么時(shí)候需要抽樣110 \n
3.6.2 如何進(jìn)行抽樣110 \n
3.6.3 抽樣需要注意的幾個(gè)問題111 \n
3.6.4 代碼實(shí)操:Python數(shù)據(jù)抽樣113 \n
3.7 解決運(yùn)營(yíng)數(shù)據(jù)的共線性問題116 \n
3.7.1 如何檢驗(yàn)共線性117 \n
3.7.2 解決共線性的5種常用方法117 \n
3.7.3 代碼實(shí)操:Python處理共線性問題118 \n
3.8 有關(guān)相關(guān)性分析的混沌120 \n
3.8.1 相關(guān)和因果是一回事嗎120 \n
3.8.2 相關(guān)系數(shù)低就是不相關(guān)嗎121 \n
3.8.3 代碼實(shí)操:Python相關(guān)性分析121 \n
3.9 標(biāo)準(zhǔn)化,讓運(yùn)營(yíng)數(shù)據(jù)落入相同的范圍122 \n
3.9.1 實(shí)現(xiàn)中心化和正態(tài)分布的Z-Score122 \n
3.9.2 實(shí)現(xiàn)歸一化的Max-Min123 \n
3.9.3 用于稀疏數(shù)據(jù)的MaxAbs123 \n
3.9.4 針對(duì)離群點(diǎn)的RobustScaler123 \n
3.9.5 代碼實(shí)操:Python數(shù)據(jù)標(biāo)準(zhǔn)化處理123 \n
3.10 離散化,對(duì)運(yùn)營(yíng)數(shù)據(jù)做邏輯分層126 \n
3.10.1 針對(duì)時(shí)間數(shù)據(jù)的離散化127 \n
3.10.2 針對(duì)多值離散數(shù)據(jù)的離散化127 \n
3.10.3 針對(duì)連續(xù)數(shù)據(jù)的離散化127 \n
3.10.4 針對(duì)連續(xù)數(shù)據(jù)的二值化128 \n
3.10.5 代碼實(shí)操:Python數(shù)據(jù)離散化處理128 \n
3.11 數(shù)據(jù)處理應(yīng)該考慮哪些運(yùn)營(yíng)業(yè)務(wù)因素133 \n
3.11.1 考慮固定和突發(fā)運(yùn)營(yíng)周期133 \n
3.11.2 考慮運(yùn)營(yíng)需求的有效性134 \n
3.11.3 考慮交付時(shí)要貼合運(yùn)營(yíng)落地場(chǎng)景134 \n
3.11.4 不要忽視業(yè)務(wù)專家經(jīng)驗(yàn)135 \n
3.11.5 考慮業(yè)務(wù)需求的變動(dòng)因素136 \n
3.12 內(nèi)容延伸:非結(jié)構(gòu)化數(shù)據(jù)的預(yù)處理137 \n
3.12.1 網(wǎng)頁數(shù)據(jù)解析137 \n
3.12.2 網(wǎng)絡(luò)用戶日志解析144 \n
3.12.3 圖像的基本預(yù)處理148 \n
3.12.4 自然語言文本預(yù)處理154 \n
3.13 本章小結(jié)157 \n
第4章 跳過運(yùn)營(yíng)數(shù)據(jù)分析和挖掘的“大坑”159 \n
4.1 聚類分析159 \n
4.1.1 當(dāng)心數(shù)據(jù)異常對(duì)聚類結(jié)果的影響160 \n
4.1.2 超大數(shù)據(jù)量時(shí)應(yīng)該放棄K均值算法160 \n
4.1.3 聚類不僅是建模的終點(diǎn),更是重要的中間預(yù)處理過程162 \n
4.1.4 高維數(shù)據(jù)上無法應(yīng)用聚類嗎163 \n
4.1.5 如何選擇聚類分析算法164 \n
4.1.6 代碼實(shí)操:Python聚類分析164 \n
4.2 回歸分析172 \n
4.2.1 注意回歸自變量之間的共線性問題172 \n
4.2.2 相關(guān)系數(shù)、判定系數(shù)和回歸系數(shù)之間到底什么關(guān)系172 \n
4.2.3 判定系數(shù)是否意味著相應(yīng)的因果聯(lián)系173 \n
4.2.4 注意應(yīng)用回歸模型時(shí)研究自變量是否產(chǎn)生變化173 \n
4.2.5 如何選擇回歸分析算法174 \n
4.2.6 代碼實(shí)操:Python回歸分析174 \n
4.3 分類分析183 \n
4.3.1 防止分類模型的過擬合問題183 \n
4.3.2 使用關(guān)聯(lián)算法做分類分析183 \n
4.3.3 用分類分析來提煉規(guī)則、提取變量、處理缺失值184 \n
4.3.4

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)