書籍:Mathematical Foundations of Reinforcement Learning
作者:趙世鈺
出版:Springer
編輯:陳萍萍的公主@一點人工一點智能
下載:書籍下載-《強化學習數學基礎》
01 書籍介紹
本書對基本概念、核心挑戰和經典強化學習算法進行了數學但易於理解的介紹。它旨在幫助讀者理解算法的理論基礎,提供對其設計和功能的見解。整個過程中包括許多説明性示例。數學內容經過精心設計,以確保可讀性和易於理解。
本書分為兩部分。第一部分是關於強化學習的數學基礎,涵蓋 Bellman 方程、Bellman 最優方程和隨機近似等主題。第二部分闡述了強化學習算法,包括價值迭代和策略迭代、蒙特卡洛方法、時間差分方法、價值函數方法、策略梯度方法和參與者-批評者方法。
作為一本內容詳實的著作,它不僅面向高校本科生、研究生、博士後學者、教師及工業界研究員,同時也吸引着所有希望深入瞭解強化學習領域的愛好者。
02 作者簡介
趙世鈺教授現任教於西湖大學工程學院,擔任智能無人系統實驗室的主任。他於2014年在新加坡國立大學取得電氣與計算機工程博士學位。在此之前,趙教授曾在英國謝菲爾德大學的自動控制與系統工程系任教。他的研究方向主要圍繞多機器人系統的決策制定與感知技術展開。