注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡人工智能Python機器學習

Python機器學習

Python機器學習

定 價:¥79.00

作 者: [美] 塞巴斯蒂安·拉施卡(Sebastian Raschka) 著;高明,徐瑩,陶虎成 譯
出版社: 機械工業(yè)出版社
叢編項: 數(shù)據(jù)科學與工程技術(shù)叢書
標 簽: 程序設(shè)計 計算機/網(wǎng)絡

購買這本書可以去


ISBN: 9787111558804 出版時間: 2017-03-01 包裝: 平裝
開本: 16開 頁數(shù): 259 字數(shù):  

內(nèi)容簡介

  機器學習與預測分析正在改變企業(yè)和其他組織的運作方式,本書將帶領(lǐng)讀者進入預測分析的世界。全書共13章,除了簡要介紹機器學習及Python在機器學習中的應用,還系統(tǒng)講述了數(shù)據(jù)分類、數(shù)據(jù)預處理、模型優(yōu)化、集成學習、回歸、聚類、神經(jīng)網(wǎng)絡、深度學習等內(nèi)容。本書將機器學習背后的基本理論與應用實踐聯(lián)系起來,通過這種方式讓讀者聚焦于如何正確地提出問題、解決問題。本書講解了如何使用Python的核心元素以及強大的機器學習庫,同時還展示了如何正確使用一系列統(tǒng)計模型。本書可作為學習數(shù)據(jù)科學的初學者及想進一步拓展數(shù)據(jù)科學領(lǐng)域認識的讀者的參考書。同樣,本書也適合計算機等相關(guān)專業(yè)的本科生、研究生閱讀。

作者簡介

  Sebastian Raschka,是密歇根州立大學的博士生,他在計算生物學領(lǐng)域提出了幾種新的計算方法,還被科技博客Analytics Vidhya評為GitHub上具影響力的數(shù)據(jù)科學家。他有一整年都使用Python進行編程的經(jīng)驗,同時還多次參加數(shù)據(jù)科學應用與機器學習領(lǐng)域的研討會。正是因為Sebastian 在數(shù)據(jù)科學、機器學習以及Python等領(lǐng)域擁有豐富的演講和寫作經(jīng)驗,他才有動力完成此書的撰寫,目的是幫助那些不具備機器學習背景的人設(shè)計出由數(shù)據(jù)驅(qū)動的解決方案。他還積極參與到開源項目中,由他開發(fā)完成的計算方法已經(jīng)被成功應用到了機器學習競賽(如Kaggle等)中。在業(yè)余時間,他沉醉于構(gòu)建體育運動的預測模型,要么待在電腦前,要么在運動。首先,我要感謝Arun Ross和Pang-Ning Tan教授,以及那些曾經(jīng)啟發(fā)我并激起我在模式分類、機器學習、數(shù)據(jù)挖掘領(lǐng)域興趣的人。我還想借此機會對Python社區(qū)和開源包的開發(fā)者表示感謝,他們幫助我創(chuàng)建了一個用于科學研究和數(shù)據(jù)科學的完美開發(fā)環(huán)境。在此,還要特別感謝scikit-learn的核心開發(fā)人員。作為此項目的一個參與者,我有幸與這些極客合作,他們不僅對機器學習有著深入的了解,同時還都是非常出色的程序員。后,我還要感謝所有對本書感興趣的讀者,也真心希望我的熱情能夠感染大家一起加入到Python與機器學習社區(qū)中來。

圖書目錄

譯者序
推薦序
作者簡介
審校者簡介
前言
第1章 賦予計算機學習數(shù)據(jù)的能力1
1.1構(gòu)建智能機器將數(shù)據(jù)轉(zhuǎn)化為知識1
1.2 機器學習的三種不同方法1
1.2.1 通過監(jiān)督學習對未來事件進行預測2
1.2.2 通過強化學習解決交互式問題4
1.2.3 通過無監(jiān)督學習發(fā)現(xiàn)數(shù)據(jù)本身潛在的結(jié)構(gòu)4
1.2.4 基本術(shù)語及符號介紹5
1.3 構(gòu)建機器學習系統(tǒng)的藍圖6
1.3.1 數(shù)據(jù)預處理6
1.3.2 選擇預測模型類型并進行訓練7
1.3.3 模型驗證與使用未知數(shù)據(jù)進行預測8
1.4 Python在機器學習中的應用8
本章小結(jié)9
第2章 機器學習分類算法10
2.1 人造神經(jīng)元—早期機器學習概覽10
2.2 使用Python實現(xiàn)感知器學習算法13
2.3 自適應線性神經(jīng)元及其學習的收斂性19
2.3.1 通過梯度下降最小化代價函數(shù)20
2.3.2 使用Python實現(xiàn)自適應線性神經(jīng)元21
2.3.3 大規(guī)模機器學習與隨機梯度下降25
本章小結(jié)29
第3章 使用scikit-learn實現(xiàn)機器學習分類算法30
3.1 分類算法的選擇30
3.2 初涉scikit-learn的使用30
使用scikit-learn訓練感知器31
3.3 邏輯斯諦回歸中的類別概率34
3.3.1 初識邏輯斯諦回歸與條件概率34
3.3.2 通過邏輯斯諦回歸模型的代價函數(shù)獲得權(quán)重36
3.3.3 使用scikit-learn訓練邏輯斯諦回歸模型37
3.3.4 通過正則化解決過擬合問題39
3.4 使用支持向量機最大化分類間隔41
3.4.1 對分類間隔最大化的直觀認識41
3.4.2 使用松弛變量解決非線性可分問題42
3.4.3 使用scikit-learn實現(xiàn)SVM44
3.5 使用核SVM解決非線性問題44
3.6 決策樹48
3.6.1 最大化信息增益—獲知盡可能準確的結(jié)果49
3.6.2 構(gòu)建決策樹52
3.6.3 通過隨機森林將弱分類器集成為強分類器53
3.7 惰性學習算法—k-近鄰算法54
本章小結(jié)57
第4章 數(shù)據(jù)預處理—構(gòu)建好的訓練數(shù)據(jù)集58
4.1 缺失數(shù)據(jù)的處理58
4.1.1 將存在缺失值的特征或樣本刪除59
4.1.2 缺失數(shù)據(jù)填充60
4.1.3 理解scikit-learn預估器的API60
4.2 處理類別數(shù)據(jù)61
4.2.1 有序特征的映射61
4.2.2 類標的編碼62
4.2.3 標稱特征上的獨熱編碼63
4.3 將數(shù)據(jù)集劃分為訓練數(shù)據(jù)集和測試數(shù)據(jù)集64
4.4 將特征的值縮放到相同的區(qū)間65
4.5 選擇有意義的特征66
4.5.1 使用L1正則化滿足數(shù)據(jù)稀疏化67
4.5.2 序列特征選擇算法70
4.6 通過隨機森林判定特征的重要性74
本章小結(jié)76
第5章 通過降維壓縮數(shù)據(jù)77
5.1 無監(jiān)督數(shù)據(jù)降維技術(shù)—主成分分析77
5.1.1 總體方差與貢獻方差78
5.1.2 特征轉(zhuǎn)換80
5.1.3 使用scikit-learn進行主成分分析82
5.2 通過線性判別分析壓縮無監(jiān)督數(shù)據(jù)84
5.2.1 計算散布矩陣85
5.2.2 在新特征子空間上選取線性判別算法87
5.2.3 將樣本映射到新的特征空間89
5.2.4 使用scikit-learn進行LDA分析90
5.3 使用核主成分分析進行非線性映射91
5.3.1 核函數(shù)與核技巧91
5.3.2 使用Python實現(xiàn)核主成分分析94
5.3.3 映射新的數(shù)據(jù)點99
5.3.4 scikit-learn中的核主成分分析102
本章小結(jié)103
第6章 模型評估與參數(shù)調(diào)優(yōu)實戰(zhàn)104
6.1 基于流水線的工作流104
6.1.1 加載威斯康星乳腺癌數(shù)據(jù)集104
6.1.2 在流水線中集成數(shù)據(jù)轉(zhuǎn)換及評估操作105
6.2 使用k折交叉驗證評估模型性能106
6.2.1 holdout方法106
6.2.2 k折交叉驗證107
6.3 通過學習及驗證曲線來調(diào)試算法110
6.3.1 使用學習曲線判定偏差和方差問題110
6.3.2 通過驗證曲線來判定過擬合與欠擬合112
6.4 使用網(wǎng)格搜索調(diào)優(yōu)機器學習模型113
6.4.1 使用網(wǎng)絡搜索調(diào)優(yōu)超參114
6.4.2 通過嵌套交叉驗證選擇算法115
6.5 了解不同的性能評價指標116
6.5.1 讀取混淆矩陣116
6.5.2 優(yōu)化分類模型的準確率和召回率117
6.5.3 繪制ROC曲線118
6.5.4 多類別分類的評價標準121
本章小結(jié)121
第7章 集成學習—組合不同的模型122
7.1 集成學習122
7.2 實現(xiàn)一個簡單的多數(shù)投票分類器125
7.3 評估與調(diào)優(yōu)集成分類器131
7.4 bagging —通過bootstrap樣本構(gòu)建集成分類器135
7.5 通過自適應boosting提高弱學習機的性能138
本章小結(jié)143
第8章 使用機器學習進行情感分析144
8.1 獲取IMDb電影評論數(shù)據(jù)集144
8.2 詞袋模型簡介146
8.2.1 將單詞轉(zhuǎn)換為特征向量146
8.2.2 通過詞頻-逆文檔頻率計算單詞關(guān)聯(lián)度147
8.2.3 清洗文本數(shù)據(jù)148
8.2.4 標記文檔149
8.3 訓練用于文檔分類的邏輯斯諦回歸模型151
8.4 使用大數(shù)據(jù)—在線算法與外存學習152
本章小結(jié)155
第9章 在Web應用中嵌入機器學習模型156
9.1 序列化通過scikit-learn擬合的模型156
9.2 使用SQLite數(shù)據(jù)庫存儲數(shù)據(jù)158
9.3 使用Flask開發(fā)Web應用160
9.3.1 第一個Flask Web應用160
9.3.2 表單驗證及渲染161
9.4 將電影分類器嵌入Web應用164
9.5 在公共服務器上部署Web應用169
本章小結(jié)172
第10章 使用回歸分析預測連續(xù)型目標變量173
10.1 簡單線性回歸模型初探173
10.2 波士頓房屋數(shù)據(jù)集174
10.3 基于最小二乘法構(gòu)建線性回歸模型178
10.3.1 通過梯度下降計算回歸參數(shù)178
10.3.2 使用scikit-learn估計回歸模型的系數(shù)181
10.4 使用RANSAC擬合高魯棒性回歸模型182
10.5 線性回歸模型性能的評估184
10.6 回歸中的正則化方法185
10.7 線性回歸模型的曲線化-多項式回歸186
10.7.1 房屋數(shù)據(jù)集中的非線性關(guān)系建模188
10.7.2 使用隨機森林處理非線性關(guān)系190
本章小結(jié)193
第11章 聚類分析——處理無類標數(shù)據(jù)194
11.1 使用k-means算法對相似對象進行分組194
11.1.1 k-means++196
11.1.2 硬聚類與軟聚類198
11.1.3 使用肘方法確定簇的最佳數(shù)量199
11.1.4 通過輪廓圖定量分析聚類質(zhì)量200
11.2 層次聚類203
11.2.1 基于距離矩陣進行層次聚類204
11.2.2 樹狀圖與熱度圖的關(guān)聯(lián)207
11.2.3 通過scikit-learn進行凝聚聚類208
11.3 使用DBSCAN劃分高密度區(qū)域209
本章小結(jié)212
第12章 使用人工神經(jīng)網(wǎng)絡識別圖像213
12.1 使用人工神經(jīng)網(wǎng)絡對復雜函數(shù)建模213
12.1.1 單層神經(jīng)網(wǎng)絡回顧214
12.1.2 多層神經(jīng)網(wǎng)絡架構(gòu)簡介215
12.1.3 通過正向傳播構(gòu)造神經(jīng)網(wǎng)絡216
12.2 手寫數(shù)字的識別218
12.2.1 獲取MNIST數(shù)據(jù)集218
12.2.2 實現(xiàn)一個多層感知器222
12.3 人工神經(jīng)網(wǎng)絡的訓練228
12.3.1 計算邏輯斯諦代價函數(shù)228
12.3.2 通過反向傳播訓練神經(jīng)網(wǎng)絡230
12.4 建立對反向傳播的直觀認識231
12.5 通過梯度檢驗調(diào)試神經(jīng)網(wǎng)絡232
12.6 神經(jīng)網(wǎng)絡的收斂性236
12.7 其他神經(jīng)網(wǎng)絡架構(gòu)237
12.7.1 卷積神經(jīng)網(wǎng)絡237
12.7.2 循環(huán)神經(jīng)網(wǎng)絡238
12.8 關(guān)于神經(jīng)網(wǎng)絡的實現(xiàn)239
本章小結(jié)240
第13章 使用Theano并行訓練神經(jīng)網(wǎng)絡241
13.1 使用Theano構(gòu)建、編譯并運行表達式241
13.1.1 什么是Theano242
13.1.2 初探Theano243
13.1.3 配置Theano244
13.1.4 使用數(shù)組結(jié)構(gòu)245
13.1.5 整理思路—線性回歸示例247
13.2 為前饋神經(jīng)網(wǎng)絡選擇激勵函數(shù)250
13.2.1 邏輯斯諦函數(shù)概述250
13.2.2 通過softmax函數(shù)評估多類別分類任務中的類別概率252
13.2.3 通過雙曲正切函數(shù)增大輸出范圍252
13.3 使用Keras提高訓練神經(jīng)網(wǎng)絡的效率254
本章小結(jié)258

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號