注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術工業(yè)技術一般工業(yè)技術Python機器學習工程實戰(zhàn)(第2版)

Python機器學習工程實戰(zhàn)(第2版)

Python機器學習工程實戰(zhàn)(第2版)

定 價:¥198.00

作 者: (美)Andrew Mcmahon(彼得·麥克馬洪)
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787121500169 出版時間: 2025-04-01 包裝: 平塑勒
開本: 頁數(shù): 字數(shù):  

內(nèi)容簡介

  本書是一本面向機器學習實務的專業(yè)指南,通過系統(tǒng)化的工程學視角幫助讀者將機器學習理論轉化為實際應用。全書共九章。內(nèi)容從基礎知識到模型標準化、部署模式、擴展規(guī)模及深度學習應用,層層深入,逐步構建機器學習工程的完整知識體系。書中特別強調(diào)如何在Python中高效編碼與設計,如何在大規(guī)模數(shù)據(jù)集上開發(fā),以及當下熱門的大型語言模型(LLM)構建與運營方法。本書不僅傳播技術,更傳遞了工程學的嚴謹與實踐精神,旨在培養(yǎng)能夠解決復雜技術問題并引領數(shù)據(jù)科學發(fā)展的專業(yè)人才。無論是初學者,還是行業(yè)從業(yè)者,本書對讀者來說都是一次深入機器學習工程的寶貴探索。

作者簡介

  Andrew McMahon(彼得·麥克馬洪),多年來在多個行業(yè)中構建了具有高影響力的機器學習產(chǎn)品。他目前擔任英國NatWest集團的首席MLOps工程師,并擁有倫敦帝國理工學院理論凝聚態(tài)物理博士學位。他是一位活躍的博主、演講者、播客嘉賓,并在MLOps社區(qū)中擔任領導角色。他是AI Right播客的聯(lián)合主持人,并榮獲2022年英國數(shù)據(jù)獎“年度新星”和2019年數(shù)據(jù)科學基金會頒發(fā)的“年度數(shù)據(jù)科學家”稱號。Andrew P. McMahon多年來在多個行業(yè)中構建了具有高影響力的機器學習產(chǎn)品。目前,他擔任英國NatWest集團的首席MLOps工程師,并擁有倫敦帝國理工學院理論凝聚態(tài)物理博士學位。他是一位活躍的博主、演講者、播客嘉賓,并在MLOps社區(qū)擔任領導角色。他是AI Right播客的聯(lián)合主持人,并榮獲2022年英國數(shù)據(jù)獎“年度新星”和2019年數(shù)據(jù)科學基金會頒發(fā)的“年度數(shù)據(jù)科學家”稱號。譯者:殷海英,從2013年底開始在美國大學作為客座教授,主持數(shù)據(jù)分析與數(shù)據(jù)科學項目的研究生研修班,截止2021年已經(jīng)開辦近20期,培訓來自世界多個國家的數(shù)百名碩士(含博士)研究生。并獨立編寫數(shù)據(jù)分析與數(shù)據(jù)科學教材,并設計多版實訓教程。在甲骨文公司,作為亞太區(qū)的數(shù)據(jù)科學家參與Oracle數(shù)據(jù)科學產(chǎn)品的研發(fā)與推廣。近期的主要研究方向為機器視覺與高性能運算在現(xiàn)實當中的應用。作為甲骨文公司官方媒體的管理員及編輯,從2016年起編寫并發(fā)表近100篇技術文章,涵蓋數(shù)據(jù)庫技術、數(shù)據(jù)科學以及機器視覺等方面。

圖書目錄

第1章 機器學習工程簡介 1
技術要求 2
定義數(shù)據(jù)學科的分類 4
數(shù)據(jù)科學家 4
機器學習工程師 5
機器學習運維工程師 6
數(shù)據(jù)工程師 8
作為一個高效的團隊進行協(xié)作 8
在現(xiàn)實世界中的機器學習工程 9
什么是機器學習解決方案? 12
為什么使用Python? 14
機器學習系統(tǒng)的高層設計 14
示例1:批量異常檢測服務 15
示例2:預測API 21
示例3:分類流程 26
本章小結 30
第2章 機器學習開發(fā)流程 32
技術要求 33
配置我們的工具 34
設置AWS賬戶 38
從概念到解決方案的四個步驟 39
將這與CRISP-DM進行比較 41
發(fā)現(xiàn) 42
使用用戶故事 43
運行 45
開發(fā) 46
部署 63
了解你的部署選項 63
理解DevOps和MLOps 65
使用GitHub Actions構建第一個CI/CD示例 68
持續(xù)模型性能測試 72
持續(xù)模型訓練 74
本章小結 76
第3章 從模型到模型工廠 78
技術要求 79
定義模型工廠 80
掌握學習的方法 81
定義目標 81
減小損失 82
準備數(shù)據(jù) 83
為機器學習設計特征工程 84
設計分類特征工程 84
設計數(shù)值特征工程 86
設計訓練系統(tǒng) 89
訓練-系統(tǒng)設計選項 90
訓練-運行模式 91
訓練-持久化 92
模型重訓練 93
檢測數(shù)據(jù)漂移 95
檢測概念漂移 98
設置限制 100
診斷漂移 101
修正數(shù)據(jù)漂移 103
其他監(jiān)控工具 105
自動訓練 109
自動化的層次結構 109
優(yōu)化超參數(shù) 111
AutoML 118
持久化你的模型 121
構建模型工廠與管道 125
Scikit-learn管道 126
Spark ML管道 130
本章小結 133
第4章 打包封裝 135
技術要求 136
編寫優(yōu)秀的Python代碼 136
回顧基礎知識 137
訣竅與技巧 139
堅持標準 142
編寫高質量的PySpark代碼 144
選擇風格 145
面向對象編程 145
函數(shù)式編程 148
打包你的代碼 150
為什么要打包? 151
選擇打包的用例 152
設計你的包 153
構建你自己的包 158
使用Makefile管理你的環(huán)境 160
使用Poetry進行打包 165
測試、日志記錄、安全性和錯誤處理 170
測試 170
保護你的解決方案 174
分析自己的代碼以發(fā)現(xiàn)安全問題 175
分析依賴項以發(fā)現(xiàn)安全問題 177
記錄日志 180
錯誤處理 183
不要重復發(fā)明輪子 191
本章小結 191
第5章 部署模式和工具 193
技術要求 194
設計系統(tǒng) 194
基于原則構建 196
探索一些標準的機器學習模式 199
在數(shù)據(jù)湖中暢游 199
微服務 200
基于事件的設計 202
批處理 203
容器化 204
在AWS上托管你自己的微服務 208
推送到ECR 209
在ECS上托管 211
使用Airflow構建通用管道 224
Airflow 224
構建高級機器學習管道 237
使用ZenML 237
使用Kubeflow 249
選擇你的部署策略 259
本章小結 260
第6章 擴展規(guī)模 262
技術要求 263
使用Spark進行擴展 263
Spark技巧和竅門 265
云上的Spark 273
啟動無服務器基礎設施 283
使用Kubernetes實現(xiàn)大規(guī)模容器化 292
使用Ray進行擴展 294
開始使用Ray進行機器學習 298
設計大規(guī)模系統(tǒng) 305
本章小結 308
第7章 深度學習、生成人工智能和LLMOps 310
深入探討深度學習 311
使用PyTorch 314
將深度學習擴展并投入生產(chǎn)實踐 318
微調(diào)和遷移學習 322
使用LLM 331
理解LLM 332
通過API使用LLM 333
使用LLM進行編碼 336
利用LLM構建未來 340
LLM驗證 341
PromptOps 343
本章小結 344
第8章 構建ML微服務 345
技術要求 345
理解預測問題 346
設計我們的預測服務 348
選擇工具 350
規(guī)?;柧?352
使用FastAPI提供模型服務 356
響應和請求模式 359
在微服務中管理模型 363
將所有內(nèi)容整合在一起 366
容器化并部署到Kubernetes 371
將應用程序容器化 372
使用Kubernetes進行擴展 373
部署策略 376
本章小結 377
第9章 構建一個提取、轉換、機器學習用例 379
技術要求 380
理解批處理問題 382
設計ETML解決方案 384
工具選擇 386
接口和存儲 386
模型的擴展 387
ETML管道的調(diào)度 388
執(zhí)行構建 389
使用高級Airflow功能構建ETML管道 390
本章小結 403

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號