《深入淺出強化學習:原理入門》用通俗易懂的語言深入淺出地介紹了強化學習的基本原理,覆蓋了傳統(tǒng)的強化學習基本方法和當前炙手可熱的深度強化學習方法。開篇從最基本的馬爾科夫決策過程入手,將強化學習問題納入到嚴謹的數學框架中,接著闡述了解決此類問題最基本的方法——動態(tài)規(guī)劃方法,并從中總結出解決強化學習問題的基本思路:交互迭代策略評估和策略改善。 基于這個思路,分別介紹了基于值函數的強化學習方法和基于直接策略搜索的強化學習方法。最后介紹了逆向強化學習方法和近年具有代表性、比較前沿的強化學習方法。 除了系統(tǒng)地介紹基本理論,書中還介紹了相應的數學基礎和編程實例。因此,《深入淺出強化學習:原理入門》既適合零基礎的人員入門學習、也適合相關科研人員作為研究參考。