《深度強化學習實踐(原書第2版)》包括新的強化學習工具和技術,介紹了強化學習的基礎知識,以及如何動手編寫智能體以執(zhí)行一系列實際任務?!渡疃葟娀瘜W習實踐(原書第2版)》較上一版新增6章,專門介紹了強化學習的新發(fā)展,包括離散優(yōu)化(解決魔方問題)、多智能體方法、Microsoft的TextWorld環(huán)境、高級探索技術等。學完《深度強化學習實踐(原書第2版)》,你將對這個新興領域的前沿技術有深刻的理解。此外,你將獲得對深度Q-network、策略梯度方法、連續(xù)控制問題以及高度可擴展的非梯度方法等領域的可行洞見,還將學會如何構建經過強化學習訓練、價格低廉的真實硬件機器人,并通過逐步代碼優(yōu)化在短短30分鐘的訓練后解決Pong環(huán)境問題。簡而言之,《深度強化學習實踐(原書第2版)》將幫助你探索強化學習中令人興奮的復雜主題,讓你通過實例獲得經驗和知識。通過閱讀《深度強化學習實踐(原書第2版)》,你將:了解強化學習的深度學習上下文并實現(xiàn)復雜的深度學習模型。學會評估強化學習的方法,包括交叉熵、DQN、actor-critic、TRPO、PPO、DDPG、D4PG等。學會構建經過強化學習方法訓練的、價格低廉的硬件機器人。研究Microsoft的TextWorld環(huán)境,這是一個文字冒險游戲平臺。學會在強化學習中使用離散優(yōu)化來解決魔方問題。學會教你的智能體使用AlphaGo Zero玩四子連橫棋。探索有關AI聊天機器人等主題的較新深度強化學習技術。研究先進的探索技術,包括噪聲網絡和網絡蒸餾技術。