決策演算法 Algorithms for Decision Making

Kochenderfer, Mykel J., Wheeler, Tim A., Wray, Kyle H. 譯 餘青松//江紅//餘靖

買這商品的人也買了...

相關主題

商品描述

本書源自於史丹佛大學的相關課程,主要介紹不確定狀態下的決策演算法,涵蓋基本的數學問題和解算演算法。
本書共分為五個部分:
首先解決在單一時間點上簡單決策的不確定性和目標的推理問題;
然後介紹隨機環境中的序列決策問題;
接著討論模型不確定性,包括基於模型的方法和無模型的方法;
之後討論狀態不確定性,包括jing確信念狀態規劃、離線信念狀態規劃、線上信念狀態規劃等;
最後討論多智能體系統,涉及多智能體推理和協作智能體等。
本書主要關注規劃和強化學習,其中一些技術涉及監督學習和最佳化。
書中的演算法是用Julia程式語言實現的,並配有大量圖表、範例和練習題。
本書要求讀者俱備紮實的數學基礎,適合電腦科學、數學、統計學、電機工程、航太等領域的讀者閱讀。

目錄大綱

譯者序
前言
致謝
第1章 導論
1.1 決策
1.2 應用
1.2.1 飛機防撞控制系統
1.2.2 自動駕駛控制系統
1.2.3 乳癌篩檢
1.2.4 金融消費與投資組合配置
1.2.5 分散式森林火災監控系統
1.2.6 火星科學探測
1.3 方法
1.3.1 顯式編程
1.3.2 監督式學習
1.3.3 優化
1.3.4 規劃
1.3.5 強化學習
1.4 自動化決策過程的歷史
1.4.1 經濟學
1.4.2 心理學
1.4.3 神經科學
1.4.4 計算機科學
1.4.5 工程
1.4.6 數學
1.4.7 運籌學
1.5 社會影響
1.6 本書組織架構
1.6.1 機率推理
1.6.2 序列問題
1.6.3 模型不確定性
1.6.4 狀態不確定性
1.6.5 多智能體系統
第一部分 機率推理
第2章 表示
2.1 信念度和機率
2.2 機率分佈
2.2.1 離散機率分佈
2.2.2 連續性機率分佈
2.3 聯合分佈
2.3.1 離散聯合分佈
2.3.2 連續聯合分配
2.4 條件分佈
2.4.1 離散條件模型
2.4.2 條件高斯模型
2.4.3 線性高斯模型
2.4.4 條件線性高斯模型
2.4.5 sigmoid模型
2.4.6 確定性變數
2.5 貝葉斯網絡
2.6 條件獨立性
2.7 本章小結
2.8 練習題
第3章 推理
3.1 貝葉斯網路中的推理
3.2 樸素貝葉斯模型中的推理
3.3 “和積”變數消除
3.4 信念傳播
3.5 計算複雜度
3.6 直接抽樣
3.7 似然加權抽樣
3.8 吉布斯抽樣
3.9 高斯模型中的推理
3.10 本章小結
3.11 練習題
第4章 參數學習
4.1 最大似然參數學習
……
第二部分 序列問題
第三部分 模型不確定性
第四部分 狀態不確定性
第五部分 多智能體系統
附錄