強化學習與最優控制
暫譯: 強化學習與最優控制技術
[美]德梅萃·P. 博賽卡斯(Dimitri P. Bertsekas) 著
- 出版商: 清華大學
- 出版日期: 2020-06-01
- 定價: $894
- 售價: 8.5 折 $760
- 語言: 英文
- ISBN: 7302540322
- ISBN-13: 9787302540328
-
相關分類:
Reinforcement、化學 Chemistry
已絕版
買這商品的人也買了...
-
$1,254Feedback Control of Dynamic Systems, 7/e (IE-Paperback)
-
$480$456 -
$560$504 -
$620$608 -
$1,100$1,045 -
$600$588 -
$857強化學習, 2/e (Reinforcement Learning: An Introduction, 2/e)
-
$658基於函數逼近的強化學習與動態規劃
-
$500$475 -
$774$735 -
$1,194$1,134 -
$400$360 -
$1,575Lean AI: How Innovative Startups Use Artificial Intelligence to Grow
-
$750$592 -
$403圖神經網絡:基礎與前沿
-
$1,200$948 -
$556遷移學習導論
-
$301詳解 FPGA:人工智能時代的驅動引擎
-
$658$619 -
$485直覺模糊時間序列分析
-
$880$616 -
$352Python 深度強化學習 — 使用 PyTorch, TensorFlow 和 OpenAI
-
$454聯邦學習原理與PySyft實戰
-
$594$564 -
$528$502
商品描述
本書的目的是考慮大型且具有挑戰性的多階段決策問題,這些問題原則上可以通過動態規劃和最優控制來解決,但它們的精確解決方案在計算上是難以處理的。本書討論依賴於近似的解決方法,以產生具有足夠性能的次優策略。這些方法統稱為增強學習,也可以叫做近似動態規劃和神經動態規劃等。 本書的主題產生於最優控制和人工智能思想的相互作用。本書的目的之一是探索這兩個領域之間的共同邊界,並架設一座具有任一領域背景的專業人士都可以訪問的橋梁。
商品描述(中文翻譯)
本書的目的是考慮大型且具有挑戰性的多階段決策問題,這些問題原則上可以通過動態規劃(dynamic programming)和最優控制(optimal control)來解決,但它們的精確解決方案在計算上是難以處理的。本書討論依賴於近似的解決方法,以產生具有足夠性能的次優策略。這些方法統稱為增強學習(reinforcement learning),也可以叫做近似動態規劃(approximate dynamic programming)和神經動態規劃(neural dynamic programming)等。本書的主題產生於最優控制和人工智能(artificial intelligence)思想的相互作用。本書的目的之一是探索這兩個領域之間的共同邊界,並架設一座具有任一領域背景的專業人士都可以訪問的橋梁。