定 價(jià):¥68.00
作 者: | 李周平 |
出版社: | 上海交通大學(xué)出版社 |
叢編項(xiàng): | |
標(biāo) 簽: | 暫缺 |
ISBN: | 9787313200327 | 出版時(shí)間: | 2018-09-01 | 包裝: | 平裝 |
開(kāi)本: | 16開(kāi) | 頁(yè)數(shù): | 字?jǐn)?shù): |
第1章 數(shù)據(jù)科學(xué)概述
1.1什么是數(shù)據(jù)科學(xué)
1.2數(shù)據(jù)分析師、數(shù)據(jù)工程師與數(shù)據(jù)科學(xué)家
第2章Python語(yǔ)法基礎(chǔ)
2.1 Python的程序結(jié)構(gòu)
2.2 Python編碼規(guī)范
2.3 Python編程環(huán)境的搭建
2.4 Python的數(shù)據(jù)結(jié)構(gòu)
2.5 Python控制語(yǔ)句
習(xí)題
第3章 使用Urllib庫(kù)編寫(xiě)爬蟲(chóng)
3.1 網(wǎng)絡(luò)爬蟲(chóng)概述
3.2 使用Urllib.request模塊編寫(xiě)爬蟲(chóng)
3.3 修改User-Agent屬性模擬瀏覽器訪(fǎng)問(wèn)
3.4 HTTP協(xié)議詳解
3.5 模擬HTTP-GET方法的爬蟲(chóng)
3.6 模擬HTTP-POST方法的爬蟲(chóng)
習(xí)題
第4章 使用正則表達(dá)式提取數(shù)據(jù)
4.1 正則表達(dá)式原理
4.2 正則表達(dá)式語(yǔ)法
4.3 re模塊常用的函數(shù)
4.4 正則表達(dá)式應(yīng)用實(shí)例
習(xí)題
第5章 使用BeautifulSoup庫(kù)提取數(shù)據(jù)
5.1 BeautifulSoup包簡(jiǎn)介
5.2 BeautifulSoup的信息提取
5.3 BeautifulSoup的遍歷
習(xí)題
第6章 爬蟲(chóng)項(xiàng)目實(shí)戰(zhàn)
6.1網(wǎng)易新聞中心爬蟲(chóng)
6.2 通過(guò)Session模擬登錄豆瓣
6.3 鏈家二手房信息爬蟲(chóng)
6.4爬取拉勾網(wǎng)JSON格式數(shù)據(jù)
習(xí)題
第7章 Pandas數(shù)據(jù)處理基礎(chǔ)
7.1數(shù)據(jù)處理概述
7.2 Pandas數(shù)據(jù)結(jié)構(gòu)
7.3 DataFrame的基本操作
7.4 DataFrame數(shù)據(jù)的連接
7.4 Pandas數(shù)據(jù)輸入輸出
習(xí)題
第8章 Pandas數(shù)據(jù)處理常用方法
8.1 分組統(tǒng)計(jì)與轉(zhuǎn)換
8.2 缺失值處理
8.3 時(shí)間序列數(shù)據(jù)處理
8.4 向量轉(zhuǎn)換
習(xí)題
第9章 數(shù)據(jù)處理實(shí)戰(zhàn)
9.1二手房數(shù)據(jù)處理
9.2 職位數(shù)據(jù)處理
9.3 職位描述的文本信息處理
習(xí)題
第10章 SQLite數(shù)據(jù)庫(kù)操作
10.1 SQLite數(shù)據(jù)庫(kù)簡(jiǎn)介
10.2 Python讀寫(xiě)SQLite
10.3 Pandas讀寫(xiě)SQLite
習(xí)題
第11章 機(jī)器學(xué)習(xí)概述
11.1 認(rèn)識(shí)機(jī)器學(xué)習(xí)
11.2 機(jī)器學(xué)習(xí)的應(yīng)用范圍
11.3 機(jī)器學(xué)習(xí)的算法
11.4 Scikit-learn機(jī)器學(xué)xibao
習(xí)題
第12章 從線(xiàn)性回歸到分類(lèi)
12.1線(xiàn)性回歸算法
12.2 邏輯回歸分類(lèi)算法
習(xí)題
第13章 分類(lèi)模型及應(yīng)用
13.1 K近鄰分類(lèi)算法
13.2 決策樹(shù)分類(lèi)算法
13.3 隨機(jī)森林分類(lèi)算法
習(xí)題
第14章 分類(lèi)模型的評(píng)估
14.1訓(xùn)練與測(cè)試樣本
14.2 性能評(píng)價(jià)指標(biāo)
14.3分類(lèi)閾值的調(diào)整
習(xí)題
參考文獻(xiàn)