強化學習與機器人控制 Human-Robot Interaction Control Using Reinforcement Learning
[墨] 餘文(Wen Yu),阿道夫·佩魯斯基亞(Adolfo Perrusquia)著 劉曉駿 譯
- 出版商: 清華大學
- 出版日期: 2023-09-01
- 售價: $588
- 貴賓價: 9.5 折 $559
- 語言: 簡體中文
- 頁數: 260
- 裝訂: 精裝
- ISBN: 7302637407
- ISBN-13: 9787302637400
-
相關分類:
Reinforcement、化學 Chemistry、機器人製作 Robots
- 此書翻譯自: Human-Robot Interaction Control Using Reinforcement Learning
立即出貨
買這商品的人也買了...
-
$400$360 -
$420$328 -
$594$564 -
$550$468 -
$505深度強化學習原理與實踐
-
$505UNIX 操作系統設計
-
$857強化學習, 2/e (Reinforcement Learning: An Introduction, 2/e)
-
$300$270 -
$750$638 -
$834$792 -
$594$564 -
$658深度強化學習:基礎、研究與應用
-
$779$740 -
$650$325 -
$534$507 -
$660$521 -
$654$621 -
$774$735 -
$720$562 -
$456$433 -
$599$569 -
$534$507 -
$419$398 -
$768$730 -
$611精通 ROS 機器人編程 (原書第3版)
相關主題
商品描述
在《強化學習與機器人控制》一書中,專家團隊不僅簡潔明瞭地描述了人機交互控制方案,還深入介紹了新穎的無模型強化學習控制器。本書首先簡述更先進的人機交互控制方案和強化學習,然後講解典型的環境模型,最後介紹一些更著名的參數估計識別技術。 《強化學習與機器人控制》提供了嚴謹的數學推理和演示,這有助於讀者理解控制方案和算法。書中還描述了人機交互控制和基於強化學習控制的穩定性和收斂性分析。另外,還討論了一些前沿話題,如逆運動學和速度運動學解決方案、神經控制以及機器人領域未來可能的發展趨勢。 ● 全面介紹基於模型的人機交互控制 ● 詳細研究基於歐拉角的無模型人機交互控制和“人機迴圈”機制控制 ● 實際討論機器人位置和力控制的強化學習以及機器人力控制的連續時間強化學習 ● 深入研究使用強化學習來控制最壞情況下不確定性的機器人,並使用多智能體強化學習對冗餘機器人進行控制
目錄大綱
目 錄
第I部分
人機交互控制
第1章 介紹 2
1.1 人機交互控制 2
1.2 控制強化學習 5
1.3 本書的結構安排 6
第2章 人機交互的環境模型 10
2.1 阻抗和導納 10
2.2 人機交互阻抗模型 15
2.3 人機交互模型的識別 18
2.4 本章小結 25
第3章 基於模型的人機交互控制 26
3.1 任務空間阻抗/導納控制 26
3.2 關節空間阻抗控制 29
3.3 準確性和魯棒性 30
3.4 模擬 33
3.5 本章小結 38
第4章 無模型人機交互控制 39
4.1 使用關節空間動力學進行任務空間控制 39
4.2 使用任務空間動力學進行任務空間控制 47
4.3 關節空間控制 48
4.4 模擬 49
4.5 實驗 55
4.6 本章小結 65
第5章 基於歐拉角的迴路控制 67
5.1 引言 67
5.2 關節空間控制 68
5.3 任務空間控制 74
5.4 實驗 77
5.5 本章小結 89
第II部分
機器人交互控制的強化學習
第6章 機器人位置/力控制的強化學習 92
6.1 引言 92
6.2 使用阻抗模型的位置/力控制 93
6.3 基於強化學習的位置/力控制 96
6.4 模擬和實驗 104
6.5 本章小結 110
第7章 用於力控制的連續時間強化學習 111
7.1 引言 111
7.2 用於強化學習的K均值聚類 112
7.3 使用強化學習的位置/力控制 116
7.4 實驗 123
7.5 本章小結 129
第8章 使用強化學習在最壞情況下的不確定性機器人控制 130
8.1 引言 130
8.2 使用離散時間強化學習的魯棒控制 131
8.3 具有k個最近鄰的雙Q學習 135
8.4 使用連續時間強化學習的魯棒控制 142
8.5 模擬和實驗:離散時間情況 146
8.6 模擬和實驗:連續時間情況 154
8.7 本章小結 162
第9章 使用多智能體強化學習的冗餘機器人控制 163
9.1 引言 163
9.2 冗餘機器人控制 164
9.3 冗餘機器人控制的多智能體強化學習 169
9.4 模擬和實驗 174
9.5 本章小結 179
第10章 使用強化學習的機器人 2神經控制 180
10.1 引言 180
10.2 使用離散時間強化學習的 2神經控制 181
10.3 連續時間的 2神經控制 196
10.4 示例 209
10.5 本章小結 219
第11章 結論 220
附錄A 機器人運動學和動力學 222
附錄B 強化學習控制 235