基於函數逼近的強化學習與動態規劃
[羅]盧西恩·布索尼 [荷]羅伯特·巴布斯卡 [荷]巴特·德·舒特 [比]達米安·厄恩斯特
- 出版商: 人民郵電
- 出版日期: 2019-09-01
- 定價: $774
- 售價: 8.5 折 $658
- 語言: 簡體中文
- ISBN: 7115508305
- ISBN-13: 9787115508300
-
相關分類:
Reinforcement、化學 Chemistry
- 此書翻譯自: Reinforcement Learning and Dynamic Programming Using Function Approximators
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
$1,254Feedback Control of Dynamic Systems, 7/e (IE-Paperback)
-
$480$456 -
$560$504 -
$620$608 -
$426$404 -
$1,100$1,045 -
$607強化學習
-
$490大規模強化學習
-
$207生成對抗網絡入門指南 (Generative adversarial Networks)
-
$308推薦系統與深度學習
-
$500$425 -
$505移動傳感器與情境感知計算
-
$600$588 -
$857$806 -
$556電腦視覺與深度學習實戰:以 MATLAB、Python 為工具
-
$500$475 -
$560$442 -
$280$266 -
$300$270 -
$305物聯網技術導論與應用
-
$594$564 -
$500$390 -
$760強化學習與最優控制
-
$1,200$948 -
$834$792
相關主題
商品描述
本書討論大規模連續空間的強化學習理論及方法,重點介紹使用函數逼近的強化學習和動態規劃方法。該研究已成為近年來電腦科學與技術領域中最活躍的研究分支之一。
全書共分6 章。第1 章為概述;第2 章為動態規劃與強化學習介紹;第3 章為大規模連續空間中的動態規劃與強化學習;第4 章為基於模糊表示的近似值迭代;第5 章為用於在線學習和連續動作控制的近似策略迭代;第6 章為基於交叉熵基函數優化的近似策略搜索。
本書可以作為理工科高等院校電腦專業和自動控制專業研究生的教材,也可以作為相關領域科技工作者和工程技術人員的參考書。