123,123

內(nèi)容簡介

　　本書是一本面向機(jī)器學(xué)習(xí)實務(wù)的專業(yè)指南，通過系統(tǒng)化的工程學(xué)視角幫助讀者將機(jī)器學(xué)習(xí)理論轉(zhuǎn)化為實際應(yīng)用。全書共九章。內(nèi)容從基礎(chǔ)知識到模型標(biāo)準(zhǔn)化、部署模式、擴(kuò)展規(guī)模及深度學(xué)習(xí)應(yīng)用，層層深入，逐步構(gòu)建機(jī)器學(xué)習(xí)工程的完整知識體系。書中特別強(qiáng)調(diào)如何在Python中高效編碼與設(shè)計，如何在大規(guī)模數(shù)據(jù)集上開發(fā)，以及當(dāng)下熱門的大型語言模型（LLM）構(gòu)建與運營方法。本書不僅傳播技術(shù)，更傳遞了工程學(xué)的嚴(yán)謹(jǐn)與實踐精神，旨在培養(yǎng)能夠解決復(fù)雜技術(shù)問題并引領(lǐng)數(shù)據(jù)科學(xué)發(fā)展的專業(yè)人才。無論是初學(xué)者，還是行業(yè)從業(yè)者，本書對讀者來說都是一次深入機(jī)器學(xué)習(xí)工程的寶貴探索。

作者簡介

　　Andrew McMahon（彼得·麥克馬洪），多年來在多個行業(yè)中構(gòu)建了具有高影響力的機(jī)器學(xué)習(xí)產(chǎn)品。他目前擔(dān)任英國NatWest集團(tuán)的首席MLOps工程師，并擁有倫敦帝國理工學(xué)院理論凝聚態(tài)物理博士學(xué)位。他是一位活躍的博主、演講者、播客嘉賓，并在MLOps社區(qū)中擔(dān)任領(lǐng)導(dǎo)角色。他是AI Right播客的聯(lián)合主持人，并榮獲2022年英國數(shù)據(jù)獎“年度新星”和2019年數(shù)據(jù)科學(xué)基金會頒發(fā)的“年度數(shù)據(jù)科學(xué)家”稱號。Andrew P. McMahon多年來在多個行業(yè)中構(gòu)建了具有高影響力的機(jī)器學(xué)習(xí)產(chǎn)品。目前，他擔(dān)任英國NatWest集團(tuán)的首席MLOps工程師，并擁有倫敦帝國理工學(xué)院理論凝聚態(tài)物理博士學(xué)位。他是一位活躍的博主、演講者、播客嘉賓，并在MLOps社區(qū)擔(dān)任領(lǐng)導(dǎo)角色。他是AI Right播客的聯(lián)合主持人，并榮獲2022年英國數(shù)據(jù)獎“年度新星”和2019年數(shù)據(jù)科學(xué)基金會頒發(fā)的“年度數(shù)據(jù)科學(xué)家”稱號。譯者：殷海英，從2013年底開始在美國大學(xué)作為客座教授，主持?jǐn)?shù)據(jù)分析與數(shù)據(jù)科學(xué)項目的研究生研修班，截止2021年已經(jīng)開辦近20期，培訓(xùn)來自世界多個國家的數(shù)百名碩士（含博士）研究生。并獨立編寫數(shù)據(jù)分析與數(shù)據(jù)科學(xué)教材，并設(shè)計多版實訓(xùn)教程。在甲骨文公司，作為亞太區(qū)的數(shù)據(jù)科學(xué)家參與Oracle數(shù)據(jù)科學(xué)產(chǎn)品的研發(fā)與推廣。近期的主要研究方向為機(jī)器視覺與高性能運算在現(xiàn)實當(dāng)中的應(yīng)用。作為甲骨文公司官方媒體的管理員及編輯，從2016年起編寫并發(fā)表近100篇技術(shù)文章，涵蓋數(shù)據(jù)庫技術(shù)、數(shù)據(jù)科學(xué)以及機(jī)器視覺等方面。

圖書目錄

第1章機(jī)器學(xué)習(xí)工程簡介 1
技術(shù)要求 2
定義數(shù)據(jù)學(xué)科的分類 4
數(shù)據(jù)科學(xué)家 4
機(jī)器學(xué)習(xí)工程師 5
機(jī)器學(xué)習(xí)運維工程師 6
數(shù)據(jù)工程師 8
作為一個高效的團(tuán)隊進(jìn)行協(xié)作 8
在現(xiàn)實世界中的機(jī)器學(xué)習(xí)工程 9
什么是機(jī)器學(xué)習(xí)解決方案？ 12
為什么使用Python？ 14
機(jī)器學(xué)習(xí)系統(tǒng)的高層設(shè)計 14
示例1：批量異常檢測服務(wù) 15
示例2：預(yù)測API 21
示例3：分類流程 26
本章小結(jié) 30
第2章機(jī)器學(xué)習(xí)開發(fā)流程 32
技術(shù)要求 33
配置我們的工具 34
設(shè)置AWS賬戶 38
從概念到解決方案的四個步驟 39
將這與CRISP-DM進(jìn)行比較 41
發(fā)現(xiàn) 42
使用用戶故事 43
運行 45
開發(fā) 46
部署 63
了解你的部署選項 63
理解DevOps和MLOps 65
使用GitHub Actions構(gòu)建第一個CI/CD示例 68
持續(xù)模型性能測試 72
持續(xù)模型訓(xùn)練 74
本章小結(jié) 76
第3章從模型到模型工廠 78
技術(shù)要求 79
定義模型工廠 80
掌握學(xué)習(xí)的方法 81
定義目標(biāo) 81
減小損失 82
準(zhǔn)備數(shù)據(jù) 83
為機(jī)器學(xué)習(xí)設(shè)計特征工程 84
設(shè)計分類特征工程 84
設(shè)計數(shù)值特征工程 86
設(shè)計訓(xùn)練系統(tǒng) 89
訓(xùn)練-系統(tǒng)設(shè)計選項 90
訓(xùn)練-運行模式 91
訓(xùn)練-持久化 92
模型重訓(xùn)練 93
檢測數(shù)據(jù)漂移 95
檢測概念漂移 98
設(shè)置限制 100
診斷漂移 101
修正數(shù)據(jù)漂移 103
其他監(jiān)控工具 105
自動訓(xùn)練 109
自動化的層次結(jié)構(gòu) 109
優(yōu)化超參數(shù) 111
AutoML 118
持久化你的模型 121
構(gòu)建模型工廠與管道 125
Scikit-learn管道 126
Spark ML管道 130
本章小結(jié) 133
第4章打包封裝 135
技術(shù)要求 136
編寫優(yōu)秀的Python代碼 136
回顧基礎(chǔ)知識 137
訣竅與技巧 139
堅持標(biāo)準(zhǔn) 142
編寫高質(zhì)量的PySpark代碼 144
選擇風(fēng)格 145
面向?qū)ο缶幊?145
函數(shù)式編程 148
打包你的代碼 150
為什么要打包？ 151
選擇打包的用例 152
設(shè)計你的包 153
構(gòu)建你自己的包 158
使用Makefile管理你的環(huán)境 160
使用Poetry進(jìn)行打包 165
測試、日志記錄、安全性和錯誤處理 170
測試 170
保護(hù)你的解決方案 174
分析自己的代碼以發(fā)現(xiàn)安全問題 175
分析依賴項以發(fā)現(xiàn)安全問題 177
記錄日志 180
錯誤處理 183
不要重復(fù)發(fā)明輪子 191
本章小結(jié) 191
第5章部署模式和工具 193
技術(shù)要求 194
設(shè)計系統(tǒng) 194
基于原則構(gòu)建 196
探索一些標(biāo)準(zhǔn)的機(jī)器學(xué)習(xí)模式 199
在數(shù)據(jù)湖中暢游 199
微服務(wù) 200
基于事件的設(shè)計 202
批處理 203
容器化 204
在AWS上托管你自己的微服務(wù) 208
推送到ECR 209
在ECS上托管 211
使用Airflow構(gòu)建通用管道 224
Airflow 224
構(gòu)建高級機(jī)器學(xué)習(xí)管道 237
使用ZenML 237
使用Kubeflow 249
選擇你的部署策略 259
本章小結(jié) 260
第6章擴(kuò)展規(guī)模 262
技術(shù)要求 263
使用Spark進(jìn)行擴(kuò)展 263
Spark技巧和竅門 265
云上的Spark 273
啟動無服務(wù)器基礎(chǔ)設(shè)施 283
使用Kubernetes實現(xiàn)大規(guī)模容器化 292
使用Ray進(jìn)行擴(kuò)展 294
開始使用Ray進(jìn)行機(jī)器學(xué)習(xí) 298
設(shè)計大規(guī)模系統(tǒng) 305
本章小結(jié) 308
第7章深度學(xué)習(xí)、生成人工智能和LLMOps 310
深入探討深度學(xué)習(xí) 311
使用PyTorch 314
將深度學(xué)習(xí)擴(kuò)展并投入生產(chǎn)實踐 318
微調(diào)和遷移學(xué)習(xí) 322
使用LLM 331
理解LLM 332
通過API使用LLM 333
使用LLM進(jìn)行編碼 336
利用LLM構(gòu)建未來 340
LLM驗證 341
PromptOps 343
本章小結(jié) 344
第8章構(gòu)建ML微服務(wù) 345
技術(shù)要求 345
理解預(yù)測問題 346
設(shè)計我們的預(yù)測服務(wù) 348
選擇工具 350
規(guī)模化訓(xùn)練 352
使用FastAPI提供模型服務(wù) 356
響應(yīng)和請求模式 359
在微服務(wù)中管理模型 363
將所有內(nèi)容整合在一起 366
容器化并部署到Kubernetes 371
將應(yīng)用程序容器化 372
使用Kubernetes進(jìn)行擴(kuò)展 373
部署策略 376
本章小結(jié) 377
第9章構(gòu)建一個提取、轉(zhuǎn)換、機(jī)器學(xué)習(xí)用例 379
技術(shù)要求 380
理解批處理問題 382
設(shè)計ETML解決方案 384
工具選擇 386
接口和存儲 386
模型的擴(kuò)展 387
ETML管道的調(diào)度 388
執(zhí)行構(gòu)建 389
使用高級Airflow功能構(gòu)建ETML管道 390
本章小結(jié) 403

作　者：	（美）Andrew Mcmahon（彼得·麥克馬洪）
出版社：	電子工業(yè)出版社
叢編項：
標(biāo)　簽：	暫缺

ISBN：	9787121500169	出版時間：	2025-04-01	包裝：	平塑勒
開本：		頁數(shù)：		字?jǐn)?shù)：

Python機(jī)器學(xué)習(xí)工程實戰(zhàn)（第2版）

購買這本書可以去

內(nèi)容簡介

作者簡介

圖書目錄

本目錄推薦

太赫茲檢測技術(shù)及其在電氣設(shè)備中…

數(shù)字化設(shè)計與制造技術(shù)（第二版&…

電力電纜

中國沼氣工程案例圖鑒：生物天然…

仿生霧水收集工程材料

科技成果轉(zhuǎn)化信息服務(wù)系統(tǒng)研究

連續(xù)管工程失效與安全評定

超快激光局域調(diào)控光熱敏折變玻璃…

高砷礦區(qū)食物鏈中砷的生物富集特…

氧化鋯復(fù)合兩性氧化物低溫催化水…