注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)人工智能深度強(qiáng)化學(xué)習(xí)理論與實(shí)踐

深度強(qiáng)化學(xué)習(xí)理論與實(shí)踐

深度強(qiáng)化學(xué)習(xí)理論與實(shí)踐

定 價(jià):¥89.00

作 者: 龍強(qiáng),章勝
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買這本書(shū)可以去


ISBN: 9787302625544 出版時(shí)間: 2023-03-01 包裝: 平裝
開(kāi)本: 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)比較全面、系統(tǒng)地介紹了深度強(qiáng)化學(xué)習(xí)的理論和算法,并配有大量的案例和編程實(shí)現(xiàn)。全書(shū)核心內(nèi)容可以分為3部分,第一部分為經(jīng)典強(qiáng)化學(xué)習(xí),包括第2、3、4章,主要內(nèi)容有動(dòng)態(tài)規(guī)劃法,蒙特卡洛法、時(shí)序差分法;第二部分為深度強(qiáng)化學(xué)習(xí),包括第6、7、8章,主要內(nèi)容有值函數(shù)近似法、策略梯度法、策略梯度法進(jìn)階;第三部分重點(diǎn)介紹了深度強(qiáng)化學(xué)習(xí)的經(jīng)典應(yīng)用——AlphaGo系列算法。另外,作為理論和算法的輔助,第1章介紹了強(qiáng)化學(xué)習(xí)的模型,第5章簡(jiǎn)單介紹了深度學(xué)習(xí)和PyTorch編程框架。 本書(shū)可以作為理工科大學(xué)相關(guān)專業(yè)研究生的學(xué)位課教材,也可以作為人工智能、機(jī)器學(xué)習(xí)相關(guān)專業(yè)高年級(jí)本科生的選修課教材,還可以作為相關(guān)領(lǐng)域?qū)W術(shù)研究人員、教師和工程技術(shù)人員的參考資料。

作者簡(jiǎn)介

暫缺《深度強(qiáng)化學(xué)習(xí)理論與實(shí)踐》作者簡(jiǎn)介

圖書(shū)目錄

暫缺《深度強(qiáng)化學(xué)習(xí)理論與實(shí)踐》目錄

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)