注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡軟件與程序設計計算機視覺與PyTorch項目實戰(zhàn):基于深度學習框架的端到端產品級模型設計與開發(fā)

計算機視覺與PyTorch項目實戰(zhàn):基于深度學習框架的端到端產品級模型設計與開發(fā)

計算機視覺與PyTorch項目實戰(zhàn):基于深度學習框架的端到端產品級模型設計與開發(fā)

定 價:¥99.00

作 者: [印] 阿克謝·庫爾卡尼(Akshay Kulkarni)、阿達沙·希瓦南達(Adarsha Shivananda)、尼廷·奈杰·夏爾馬著 歐拉 譯
出版社: 清華大學出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787302657422 出版時間: 2024-04-01 包裝: 平裝-膠訂
開本: 16開 頁數(shù): 字數(shù):  

內容簡介

  《計算機視覺與PyTorch項目實戰(zhàn):基于深度學習框架的端到端產品級模型設計與開發(fā)》使用PyTorch 框架來討論計算機視覺算法及其應用。首先介紹計算機視覺基礎,主題涉及卷積神經網絡、ResNet、YOLO、數(shù)據(jù)增強和業(yè)內使用的其他常規(guī)技術。隨后簡要概述PyTorch 庫。接下來探究圖像分類問題、對象檢測技術以及如何在訓練和運行推理的同時實現(xiàn)遷移學習。最后通過一個完整的建模過程來闡述深度學習框架PyTorch 是如何運用優(yōu)化技巧和模型AI 可解釋性的。《計算機視覺與PyTorch項目實戰(zhàn):基于深度學習框架的端到端產品級模型設計與開發(fā)》適合具有一定基礎的中高級讀者閱讀和參考,可以幫助他們使用遷移學習和PyTorch 來搭建產品級的計算機視覺模型。

作者簡介

  著譯者和技術審閱者簡介阿克謝·庫爾卡尼(Akshay Kulkarni),AI與機器學習(ML)布道師和思想領袖,為財富500強提供咨詢服務,幫助客戶推動AI和數(shù)字化戰(zhàn)略轉型。作為谷歌開發(fā)者,他經常受邀在機器學習和數(shù)據(jù)科學大會(包括Strata、O'Reilly的Conf和GIDS)發(fā)表演講。他還是印度多個頂級研究生院的客座教授。2019年,他入選“印度40位40歲以下數(shù)據(jù)科學家”名單。業(yè)余時間,他喜歡閱讀、寫作、寫代碼以及為有抱負的數(shù)據(jù)科學工程師提供幫助。目前,他和自己的家人居住在印度班加羅爾。 阿達沙·希瓦南達(Adarsha Shivananda),數(shù)據(jù)科學和MLOps先行者,致力于創(chuàng)建世界級的MLOps能力以確保人工智能可以持續(xù)交付價值。他的使命是在組織內部和外部建立一個數(shù)據(jù)科學家人才庫,通過培訓來解決問題,他在這方面一直保持領先地位。他先后就職于制藥、保健、包裝消費、零售和營銷領域。目前,他居住在印度班加羅爾,喜歡閱讀和數(shù)據(jù)科學培訓。 尼廷·奈杰·夏爾馬(Nitin Ranjan Sharma),諾華制藥產品經理,主要帶領團隊使用多模型技術來開發(fā)產品,此外也為財富500強公司提供咨詢服務,使用機器學習和深度學習框架來幫助他們解決復雜的業(yè)務問題。他主要關注的領域和核心專長是計算機視覺,比如解決圖像和視頻數(shù)據(jù)的業(yè)務難題。在加入諾華制藥之前,他的身份是Publicis Sapient、EY和TekSystems Global Services數(shù)據(jù)科學團隊成員。他經常受邀在數(shù)據(jù)科學大會上發(fā)表演講并喜歡培訓和指導數(shù)據(jù)科學愛好者開展工作。此外,他還是一名非?;钴S的開源貢獻者。 歐拉,奉行知行合一,擅長于問題的引導和拆解。目前感興趣的方向有機器學習、人工智能和商業(yè)分析。 賈萊姆·拉吉·羅希特(Jalem Raj Rohit),Episource公司的高級數(shù)據(jù)科學家,全面領導計算機視覺工作。他參與創(chuàng)辦了Pydata德里和Pydata孟買等機器學習社群并以組織者和嘉賓的身份舉辦和參加了很多小型聚會與大型會議大會。他寫了兩本書,錄制了視頻課程(Julia語言和無服務器項目)。他的興趣領域包括計算機視覺、MLOps和分布式系統(tǒng)。

圖書目錄

第1章 計算機視覺的基礎構成
第2章 圖像分類
第3章 構建目標檢測模型
第4章 構建圖像分割模型
第5章 基于圖像的搜索和推薦系統(tǒng)
第6章 姿態(tài)估計
第7章 圖像異常檢測
第8章 圖像超分辨率
第9章 視頻分析
第10章 計算機視覺的可解釋AI
詳細目錄
第1章 計算機視覺的基本構成 001
1.1 什么是計算機視覺 002
1.1.1 應用 002
1.1.2 通道 005
1.1.3 卷積神經網絡 007
1.1.4 了解CNN架構類型 014
1.1.5 掌握深度學習模型 021
1.1.6 PyTorch簡介 024
1.2 小結 026
第2章 圖像分類 027
2.1 本章所涵蓋的主題 028
2.2 方法概述 028
2.3 創(chuàng)建圖像分類流程 029
2.3.1 第一個基本模型 030
2.3.2 數(shù)據(jù) 030
2.3.3 數(shù)據(jù)探索 032
2.3.4 數(shù)據(jù)加載器 033
2.3.5 定義模型 035
2.3.6 訓練過程 040
2.3.7 基本模型的第二種變體 044
2.3.8 基本模型的第三種變體 046
2.3.9 基本模型的第四種變體 052
2.7 小結 053
第3章 構建目標檢測模型 055
3.1 使用Boosted Cascade進行目標檢測 056
3.2 R-CNN 058
3.2.1 區(qū)域候選網絡 059
3.2.2 快速區(qū)域卷積神經網絡 062
3.2.3 候選區(qū)域網絡的工作原理 063
3.2.4 錨框生成層 064
3.2.5 候選區(qū)域層 065
3.3 Mask R-CNN 065
3.4 YOLO 066
3.5 YOLO V2/V3 068
3.6 項目代碼片段 069
3.7 小結 082
第4章 構建圖像分割模型 083
4.1 圖像分割 084
4.2 PyTorch預訓練支持 086
4.2.1 語義分割 086
4.2.2 實例分割 089
4.3 模型優(yōu)化 090
4.4 小結 106
第5章 基于圖的搜索和推薦系統(tǒng) 107
5.1 問題陳述 107
5.2 方法和方法論 108
5.3 實現(xiàn) 109
5.3.1 數(shù)據(jù)集 109
5.3.2 安裝和導入庫 110
5.3.3 導入和理解數(shù)據(jù) 111
5.3.4 特征工程 114
5.3.5 計算相似度和排名 121
5.3.6 可視化推薦結果 122
5.3.7 從用戶處接收圖輸入并推薦相似產品 125
5.4 小結 128
第6章 姿態(tài)估計 129
6.1 自頂向下的方法 130
6.2 自底向上的方法 130
6.3 OpenPose 131
6.3.1 分支1 131
6.3.2 分支2 131
6.4 HRNet 133
6.5 Higher HRNet 135
6.6 PoseNet 136
6.6.1 PoseNet工作機制 136
6.6.2 PoseNet的優(yōu)點和缺點 140
6.6.3 姿態(tài)估計的應用 140
6.6.4 在雜貨店視頻上進行的測試用例 140
6.7 實現(xiàn) 141
6.8 小結 148
第7章 圖像異常檢測 149
7.1 異常檢測 149
7.2 方法1:使用預訓練的分類模型 151
7.3 方法2:使用自編碼器 165
7.4 小結 168
第8章 圖像超分辨率 169
8.1 利用最近鄰概念放大圖像 170
8.2 理解雙線性插值 171
8.3 變分自編碼器 172
8.4 生成式對抗網絡 176
8.5 模型代碼 177
8.6 模型開發(fā) 177
8.7 運行應用程序 188
8.8 小結 190
第9章 視頻分析 191
9.1 問題陳述 192
9.2 方法 194
9.3 實現(xiàn) 195
9.3.1 數(shù)據(jù) 196
9.3.2 把視頻上傳到Google Colab 197
9.3.3 將視頻轉換為一系列圖像 197
9.3.4 圖像提取 198
9.3.5 數(shù)據(jù)預處理 198
9.3.6 確定雜貨店中的熱點 200
9.3.7 導入圖像 203
9.3.8 獲取人群計數(shù) 203
9.3.9 安保與監(jiān)控 205
9.3.10 確定人口統(tǒng)計學特征(年齡和性別) 208
9.4 小結 210
第10章 計算機視覺的可解釋AI 211
10.1 Grad-CAM 212
10.2 Grad-CAM 213
10.3 NBDT 214
10.4 Grad-CAM和Grad-CAM 的實現(xiàn) 216
10.4.1 在單個圖像上的Grad-CAM和Grad-CAM 實現(xiàn) 216
10.4.2 在單個圖像上的NBDT實現(xiàn) 219
10.5 小結 221

本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號