強化學習:原理與Python實現
肖智清 著
- 出版商: 機械工業
- 出版日期: 2019-07-01
- 定價: $534
- 售價: 8.5 折 $454
- 語言: 簡體中文
- ISBN: 7111631773
- ISBN-13: 9787111631774
-
相關分類:
Reinforcement
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
$534$507 -
$352實用機器學習 (Real-world Machine Learning)
-
$857深度學習 (Deep Learning)
-
$403深度學習與計算機視覺 : 算法原理、框架應用與代碼實現 (Deep Learning & Computer Vision:Algorithms and Examples)
-
$474$450 -
$408強化學習精要:核心算法與 TensorFlow 實現
-
$714$678 -
$301深度學習入門 基於 Python 的理論與實現
-
$352Python 強化學習實戰 : 應用 OpenAI Gym 和 TensorFlow 精通強化學習和深度強化學習
-
$780$616 -
$520$390 -
$505深度強化學習原理與實踐
-
$403統計強化學習:現代機器學習方法 (Statistical Reinforcement Learning: Modern Machine Learning Approaches)
-
$301特徵工程入門與實踐 (Feature Engineering Made Easy)
-
$680$612 -
$500$395 -
$611深度學習與圖像識別:原理與實踐
-
$796強化學習, 2/e (Reinforcement Learning: An Introduction, 2/e)
-
$505白話強化學習與 PyTorch
-
$580$458 -
$620$527 -
$690$517 -
$401深度學習:基於案例理解深度神經網絡
-
$750$638 -
$580$493
相關主題
商品描述
本書理論完備,涵蓋主流經典強化學習算法和深度強化學習算法;實戰性強,基於Python、Gym、TensorFlow 2、AlphaZero等構建,配套代碼與綜合案例。全書共12章,主要內容如下。
第1章:介紹強化學習的基礎知識與強化學習環境庫Gym的使用,並給出完整的編程實例。
第2~9章:介紹強化學習的理論知識。以Markov決策過程為基礎模型,覆蓋了所有主流強化學習理論和算法,包括資格跡等經典算法和深度確定性梯度策略等深度強化學習算法。所有章節都提供了與算法配套的Python程序,使讀者完全掌握強化學習算法的原理與應用。
第10~12章:介紹了多個熱門綜合案例,包括電動游戲、棋盤游戲和自動駕駛。算法部分涵蓋了在《自然》《科學》等權威期刊上發表的多個深度強化學習明星算法。
強化學習是一種重要的機器學習方法。近幾年不斷有新的明星強化學習算法發表,在科研機構和互聯網等行業中引起巨大反響。強化學習已經成為互聯網等行業從業人員的必備知識。為了讓讀者從理論與實踐方面系統地掌握強化學習,本書寫作時考慮了以下幾個方面。
本書亮點:
保證了理論完整性,涵蓋了主流經典強化學習算法和深度強化學習算法,且採用同一套字母演繹,方便理解。
為每章都配套了代碼(特別是深度強化學習),代碼的變量名與實現方法均一致,且代碼兼容Windows。
深度強化學習配套代碼基於TensorFlow 2實現,方便讀者研習掌握先進的算法與工具。
多個綜合案例,涵蓋AlphaZero應用、基於模擬環境的自動駕駛等。
對硬件配置要求低,第2~9章的配套代碼不需要GPU即可運行,第10~12章的配套代碼只需普通的GPU即可運行。
第1章:介紹強化學習的基礎知識與強化學習環境庫Gym的使用,並給出完整的編程實例。
第2~9章:介紹強化學習的理論知識。以Markov決策過程為基礎模型,覆蓋了所有主流強化學習理論和算法,包括資格跡等經典算法和深度確定性梯度策略等深度強化學習算法。所有章節都提供了與算法配套的Python程序,使讀者完全掌握強化學習算法的原理與應用。
第10~12章:介紹了多個熱門綜合案例,包括電動游戲、棋盤游戲和自動駕駛。算法部分涵蓋了在《自然》《科學》等權威期刊上發表的多個深度強化學習明星算法。
強化學習是一種重要的機器學習方法。近幾年不斷有新的明星強化學習算法發表,在科研機構和互聯網等行業中引起巨大反響。強化學習已經成為互聯網等行業從業人員的必備知識。為了讓讀者從理論與實踐方面系統地掌握強化學習,本書寫作時考慮了以下幾個方面。
本書亮點:
保證了理論完整性,涵蓋了主流經典強化學習算法和深度強化學習算法,且採用同一套字母演繹,方便理解。
為每章都配套了代碼(特別是深度強化學習),代碼的變量名與實現方法均一致,且代碼兼容Windows。
深度強化學習配套代碼基於TensorFlow 2實現,方便讀者研習掌握先進的算法與工具。
多個綜合案例,涵蓋AlphaZero應用、基於模擬環境的自動駕駛等。
對硬件配置要求低,第2~9章的配套代碼不需要GPU即可運行,第10~12章的配套代碼只需普通的GPU即可運行。