人工智能:原理與實踐 Artificial Intelligence: A Textbook

Charu C.Aggarwal

  • 出版商: 機械工業
  • 出版日期: 2023-01-01
  • 定價: $894
  • 售價: 8.5$760
  • 語言: 簡體中文
  • 頁數: 378
  • 裝訂: 平裝
  • ISBN: 7111710673
  • ISBN-13: 9787111710677
  • 此書翻譯自: Artificial Intelligence: A Textbook
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

本書介紹了經典人工智能(邏輯或演繹推理)和現代人工智能(歸納學習和神經網絡)之間的覆蓋範圍。
分別闡述了三類方法:
演繹推理方法: 這些方法從預先定義的假設開始,並對其進行推理,以得出合乎邏輯的結論。
底層方法包括搜索和基於邏輯的方法。
這些方法在第1 章到第5 章中討論。
歸納學習方法:這些方法從例子開始,並使用統計方法來得出假設。
示例包括回歸建模、支持向量機、神經網絡、強化學習、無監督學習和概率圖形模型。
這些方法在第6 章到第11 章中討論。
整合推理和學習:第12 章和第13 章討論整合推理和學習的技術。
例子包括知識圖譜和神經符號人工智能的使用。

目錄大綱

目錄
推薦序一
推薦序二
譯者序
前言
第1章人工智能導論1
1.1 引言1
1.2 兩大流派1
1.3 通用人工智能9
1.4 代理的概念10
1.5 人工智能中的演繹推理12
1.5.1 實例13
1.5.2 演繹推理的經典方法17
1.5.3 演繹推理的優勢和局限19
1.6 人工智能中的歸納學習19
1.6.1 學習的類型20
1.6.2 無監督學習任務21
1.6.3 監督學習任務23
1.7 人工智能中的生物進化24
1.8 總結25
1.9 拓展閱讀26
1.10 練習26
第2章搜索狀態空間27
2.1 引言27
2.2 不知情搜索算法30
2.2.1 案例研究:八個拼圖問題35
2.2.2 案例研究:在線迷宮搜索36
2.2.3 通過雙向搜索提高效率36
2.3 知情搜索:佳優先搜索37
2.3.1 貪婪佳優先搜索39
2.3.2 A*-搜索算法40
2.4 具有特定於狀態的損失函數
的局部搜索41
2.4.1 爬山43
2.4.2 禁忌搜索45
2.4.3 模擬退火47
2.5 遺傳算法48
2.6 約束滿足問題50
2.6.1 作為約束滿足的旅行
推銷員問題50
2.6.2 作為約束滿足的圖著色51
2.6.3 數獨作為約束滿足51
2.6.4 約束滿足的搜索算法52
2.6.5 利用特定於狀態的
損失值53
2.7 總結53
2.8 拓展閱讀53
2.9 練習53
第3章多代理搜索55
3.1 引言55
3.2 不知情搜索:AND-OR
搜索樹56
3.2.1 處理兩個以上的代理59
3.2.2 處理非確定性環境59
3.3 具有特定於狀態的損失函數
的知情搜索樹60
3.3.1 啟發式變化63
3.3.2 適應對抗環境63
3.3.3 預存儲子樹65
3.3.4 設計評估函數面臨的挑戰66
3.3.5 極小極大樹的缺點67
3.4 alpha-beta剪枝69
3.5 蒙特卡羅樹搜索:歸納視圖71
3.5.1 對預期結果模型的改進74
3.5.2 演繹與歸納:小值
和蒙特卡羅樹77
3.5.3 應用於非確定性和部分
可觀測遊戲78
3.6 總結79
3.7 拓展閱讀79
3.8 練習80
第4章命題邏輯81
4.1 引言81
4.2 命題邏輯:基礎82
4.3 命題邏輯定律86
4.3.1 蘊涵和等價的有用性質88
4.3.2 重言式和可滿足性89
4.3.3 子句和規範形式90
4.4 命題邏輯作為專家系統的
先驅91
4.5 命題邏輯中表達式的等價性92
4.6 知識庫中的證明基礎94
4.7 矛盾證明法96
4.8 具有明確子句的有效蘊涵100
4.8.1 正向鏈接100
4.8.2 反向鏈接102
4.8.3 比較正向鏈接和
反向鏈接103
4.9 總結103
4.10 拓展閱讀104
4.11 練習104
第5章一階邏輯106
5.1 引言106
5.2 一階邏輯的基礎108
5.2.1 量詞的使用109
5.2.2 一階邏輯中的函數112
5.2.3 一階邏輯如何建立在
命題邏輯上113
5.2.4 標準化問題和範圍擴展115
5.2.5 否定與量詞的相互作用116
5.2.6 置換和斯科倫化117
5.2.7 為什麼一階邏輯更具
表現力119
5.3 填充知識庫120
5.4 一階邏輯專家系統示例122
5.5 系統推斷程序123
5.5.1 矛盾證明法123
5.5.2 正向鏈接125
5.5.3 反向鏈接126
5.6 總結126
5.7 拓展閱讀127
5.8 練習127
第6章機器學習:歸納觀點129
6.1 引言129
6.2 線性回歸131
6.2.1 隨機梯度下降132
6.2.2 基於矩陣的解決方案133
6.2.3 偏差的使用134
6.2.4 為什麼正則化很重要134
6.3 小二乘分類135
6.4 支持向量機138
6.5 邏輯回歸140
6.5.1 計算梯度140
6.5.2 比較支持向量機和
邏輯回歸140
6.5.3 邏輯回歸作為概率
分類器142
6.6 多類設置143
6.6.1 一對其餘,一票反對
一票143
6.6.2 多項式邏輯回歸144
6.7 Na?ve Bayes模型145
6.8 近鄰分類器147
6.9 決策樹148
6.9.1 決策樹構建的訓練階段148
6.9.2 拆分節點151
6.9.3 將決策樹推廣到隨機
森林152
6.10 基於規則的分類器153
6.10.1 順序覆蓋算法154
6.10.2 將基於規則的分類器與
專家系統中的邏輯規則
進行比較155
6.11 分類的評估155
6.11.1 分為訓練和測試部分157
6.11.2 絕對準確度測量158
6.11.3 排名措施159
6.12 總結162
6.13 拓展閱讀163
6.14 練習163
第7章神經網絡164
7.1 引言164
7.2 計算圖簡介165
7.2.1 神經網絡作為定向
計算圖168
7.2.2 softmax激活函數169
7.2.3 常見損失函數170
7.2.4 非線性如何增加
表達能力170
7.3 有向無環圖的優化172
7.3.1 計算圖的挑戰172
7.3.2 坡度計算的廣泛框架173
7.3.3 使用暴力計算節點到
節點的導數174
7.3.4 計算節點到節點導數
的動態規劃177
7.3.5 將節點到節點導數轉換
為損失到權重導數181
7.3.6 帶有向量變量的計算圖183
7.4 應用:神經網絡中的反向傳播185
7.4.1 常用激活函數的導數187
7.4.2 softmax的特殊情況187
7.4.3 以向量為中心的反向
傳播188
7.4.4 以向量為中心的反向
傳播示例190
7.5 計算圖的一般視圖192
7.6 總結194
7.7 拓展閱讀194
7.8 練習194
第8章特定領域的神經架構198
8.1 引言198
8.2 卷積神經網絡的基本原理198
8.3 卷積神經網絡的基本架構200
8.3.1 填充204
8.3.2 步幅205
8.3.3 典型的設置205
8.3.4 ReLU層206
8.3.5 池化206
8.3.6 完全連接層208
8.3.7 層之間的交錯208
8.3.8 分層特性工程210
8.4 卷積架構的案例研究211
8.4.1 AlexNet 212
8.4.2 VGG 214
8.4.3 ResNet 216
8.5 遞歸神經網絡的基本原理218
8.6 遞歸神經網絡的結構220
8.6.1 RNN語言建模實例222
8.6.2 通過時間反向傳播224
8.6.3 多層迭代網絡226
8.7 長短期記憶227
8.8 特定於領域的架構的應用231
8.8.1 自動圖像字幕的應用231
8.8.2 序列到序列學習和機器
翻譯232
8.9 總結233
8.10 拓展閱讀234
8.11 練習234
第9章無監督學習235
9.1 引言235
9.2 降維和矩陣分解236
9.2.1 對稱矩陣分解237
9.2.2 奇異值分解237
9.2.3 非負矩陣分解242
9.2.4 神經網絡降維246
9.3 聚類250
9.3.1 基於代表的算法250
9.3.2 自底向上的凝聚方法252
9.3.3 自頂向下的方法255
9.3.4 基於概率模型的算法256
9.3.5 科赫崙自組織映射259
9.3.6 譜聚類261
9.4 為什麼無監督學習很重要262
9.4.1 機器學習的特徵工程262
9.4.2 特徵工程的徑向基函數
網絡264
9.4.3 半監督學習265
9.5 總結269
9.6 拓展閱讀269
9.7 練習269
第10章強化學習271
10.1 引言271
10.2 無狀態算法:多臂老虎機272
10.2.1 Na?ve算法273
10.2.2 ?-?貪心算法273
10.2.3 上界方法273
10.3 強化學習框架274
10.4 蒙特卡羅抽樣276
10.4.1 蒙特卡羅抽樣算法276
10.4.2 用函數近似器進行
蒙特卡羅rollout 278
10.4.3 連接到蒙特卡羅樹搜索279
10.5 自舉法與時間差異學習280
10.5.1 Q-學習280
10.5.2 使用函數近似器282
10.5.3 例子:用於電子遊戲
設置的神經網絡細節284
10.5.4 策略上與非策略的
方法:SARSA 284
10.5.5 建模狀態與狀態–
動作對286
10.6 策略梯度方法288
10.6.1 似然比原則289
10.6.2 將監督學習與策略梯度
相結合290
10.6.3 玩家–評委算法290
10.6.4 持續的動作空間292
10.6.5 策略梯度的利與弊292
10.7 重溫蒙特卡羅樹搜索292
10.8 案例研究294
10.8.1 AlphaGo:圍棋的
冠軍級對弈294
10.8.2 自學習機器人297
10.8.3 自動駕駛汽車300
10.9 強化學習的弱點301
10.10 總結302
10.11 拓展閱讀302
10.12 練習303
第11章概率圖模型304
11.1 引言304
11.2 貝葉斯網絡305
11.3 機器學習中的基本概率模型307
11.4 玻爾茲曼機309
11.4.1 玻爾茲曼機如何產生
數據311
11.4.2 學習玻爾茲曼機的
權重311
11.5 受限玻爾茲曼機312
11.5.1 訓練RBM 314
11.5.2 對比發散算法315
11.5.3 實際問題和即興316
11.6 受限玻爾茲曼機的應用317
11.6.1 降維與數據重構317
11.6.2 協同過濾的RBM 319
11.6.3 條件因子分解:一個
簡潔的正則化技巧321
11.7 總結321
11.8 拓展閱讀322
11.9 練習322
第12章知識圖譜323
12.1 引言323
12.2 知識圖譜概述326
12.2.1 例子:詞網330
12.2.2 例子:雅虎331
12.2.3 例子:數據庫百科
全書332
12.2.4 例子:自由基332
12.2.5 例子:維基數據333
12.2.6 例子:基因本體333
12.3 如何構建知識圖譜334
12.3.1 知識圖譜的一階邏輯335
12.3.2 從非結構化數據中提取336
12.3.3 處理不完全性336
12.4 知識圖譜的應用337
12.4.1 搜索中的知識圖譜338
12.4.2 聚類知識圖譜339
12.4.3 實體分類340
12.4.4 鏈接預測和關係分類341
12.4.5 推薦系統342
12.5 總結342
12.6 拓展閱讀343
12.7 練習343
第13章綜合推理與學習344
13.1 引言344
13.2 偏差–方差權衡348
13.3 一個泛型演繹–歸納集合351
13.4 遷移學習354
13.4.1 圖像數據355
13.4.2 文本數據356
13.4.3 跨域遷移學習357
13.5 終身機器學習359
13.6 神經符號人工智能363
13.7 總結366
13.8 拓展閱讀366
13.9 練習366
參考文獻367