注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)軟件與程序設(shè)計邊做邊學(xué)深度強化學(xué)習(xí):PyTorch程序設(shè)計實踐

邊做邊學(xué)深度強化學(xué)習(xí):PyTorch程序設(shè)計實踐

邊做邊學(xué)深度強化學(xué)習(xí):PyTorch程序設(shè)計實踐

定 價:¥69.00

作 者: 小川雄太郎(Yutaro ogawa) 著,申富饒 于僡譯 譯
出版社: 機械工業(yè)出版社
叢編項: 輕松上手IT技術(shù)日文譯叢
標(biāo) 簽: 暫缺

購買這本書可以去


ISBN: 9787111650140 出版時間: 2020-04-01 包裝: 平裝
開本: 16開 頁數(shù): 228 字?jǐn)?shù):  

內(nèi)容簡介

  Pytorch是基于python且具備強大GPU加速的張量和動態(tài)神經(jīng)網(wǎng)絡(luò),更是Python中優(yōu)先的深度學(xué)習(xí)框架,它使用強大的 GPU 能力,提供*大的靈活性和速度。本書指導(dǎo)讀者以Pytorch為工具在Python中學(xué)習(xí)深層強化學(xué)習(xí)(DQN)。主要內(nèi)容包括:強化學(xué)習(xí)概述及分類、強化學(xué)習(xí)的算法和實施方法、在Pytorch中實施深度規(guī)劃與實現(xiàn)。、“實施深層強化學(xué)習(xí)DQN”、理解并實施新的深層強化學(xué)習(xí)方法(Double-DQN、Dueling Network、Prioritized Experience Replay、A3C、A2C)。

作者簡介

暫缺《邊做邊學(xué)深度強化學(xué)習(xí):PyTorch程序設(shè)計實踐》作者簡介

圖書目錄

譯者序
前言
第1章 強化學(xué)習(xí)概述1
1.1 機器學(xué)習(xí)的分類(監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)、強化學(xué)習(xí))1
1.2 強化學(xué)習(xí)、深度強化學(xué)習(xí)的歷史6
1.3 深度強化學(xué)習(xí)的應(yīng)用實例11
參考文獻(xiàn)14
第2章 在走迷宮任務(wù)中實現(xiàn)強化學(xué)習(xí)16
2.1 Try Jupyter的使用方法16
2.2 迷宮和智能體的實現(xiàn)23
2.3 策略迭代法的實現(xiàn)31
2.4 價值迭代法的術(shù)語整理41
2.5 Sarsa的實現(xiàn)46
2.6 實現(xiàn)Q學(xué)習(xí)52
參考文獻(xiàn)57
第3章 在倒立擺任務(wù)中實現(xiàn)強化學(xué)習(xí)59
3.1 在本地PC上準(zhǔn)備強化學(xué)習(xí)的實現(xiàn)和執(zhí)行環(huán)境59
3.2 倒立擺任務(wù)“CartPole”64
3.3 由多變量連續(xù)值表示的狀態(tài)的表格表示69
3.4 Q學(xué)習(xí)的實現(xiàn)72
參考文獻(xiàn)80
第4章 使用PyTorch實現(xiàn)深度學(xué)習(xí)81
4.1 神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的歷史81
4.2 深度學(xué)習(xí)的計算方法89
4.3 使用PyTorch實現(xiàn)MNIST手寫數(shù)字分類任務(wù)94
參考文獻(xiàn)107
第5章 深度強化學(xué)習(xí)DQN的實現(xiàn)108
5.1 深度強化學(xué)習(xí)DQN(深度Q網(wǎng)絡(luò))的說明108
5.2 實現(xiàn)DQN的四個要點111
5.3 實現(xiàn)DQN(上) 113
5.4 實現(xiàn)DQN(下) 123
參考文獻(xiàn)127
第6章 實現(xiàn)深度強化學(xué)習(xí)的改進版128
6.1 深度強化學(xué)習(xí)算法發(fā)展圖128
6.2 DDQN的實現(xiàn)132
6.3 Dueling Network的實現(xiàn)141
6.4 優(yōu)先經(jīng)驗回放的實現(xiàn)145
6.5 A2C的實現(xiàn)157
參考文獻(xiàn)168
第7章 在AWS GPU環(huán)境中實現(xiàn)消磚塊游戲169
7.1 消磚塊游戲“Breakout”的描述169
7.2 準(zhǔn)備在AWS上使用GPU所需要的深度學(xué)習(xí)執(zhí)行環(huán)境174
7.3 學(xué)習(xí)Breakout的四個關(guān)鍵思想187
7.4 A2C的實現(xiàn)(上) 193
7.5 A2C的實現(xiàn)(下) 203
參考文獻(xiàn)212
后記214

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號