人工智能
王東、利節、許莎
相關主題
商品描述
本書向讀者介紹當代人工智能技術的入門知識,特別是以深度學習為代表的機器學習方法。本書主要內容包括人工智能在模擬人類視覺、聽覺、語言、行為、思維五個方面的最新進展,覆蓋了當前人工智能應用最廣泛的幾個領域,包括人臉識別、語音識別、聲紋識別、自然語言理解、機器人設計等。 本書介紹的很多算法都需要動手實踐才能有更好的理解。讀者可以下載本書的實驗套件 (ht p://iok.storg),邊學邊做,才能真正領略人工智能的神奇與瑰麗。 abocl.唯其如此, 本書是一本科普著作,沒有復雜的數學公式,適用於任何對人工智能技術感興趣的讀者。書中提到的每項關鍵技術都提供了參考文獻,有志於深入理解人工智能算法的讀者可以按圖索驥,深入鑽研。
作者簡介
王東, 1995-2002年清華本科、碩士,2010年英國愛丁堡大學博士,歷任Oracle中國軟件工程師、IBM中國高級軟件工程師、英國愛丁堡大學Marie Curie 研究員、法國EURECOM博士後研究員,美國Nuance公司高級研究科學家。
現任清華大學語音語言中心副研究員,中心常務副主任,FreeNeb公司首席科學家。
王東博士是全國人機語音通訊會議常設機構秘書長,是亞太信號信息處理聯盟(APASIPA)語音專委會副主席、傑出講師,是國際標準與語音數據資源委員會(COCOSDA)大陸區代表。
王東博士自1997年開始從事語音識別、自然語言處理方面的研究,在相關領域發表學術論文120餘篇,公開專利20餘項,其專利技術在日本軟銀、新松、智能管家等多家國內外著名公司應用,創造了良了的社會效益和經濟效益。
目錄大綱
目錄
第1章 神奇的人工智能 1
1.1 什麽是人工智能 2
1.2 人工智能簡史 2
1.2.1 數理邏輯:人工智能的前期積累 2
1.2.2 圖靈:人工智能的真正創始人 4
1.2.3 達特茅斯會議:AI的開端 5
1.2.4 人工智能的三起兩落 6
1.3 機器學習:現代人工智能的靈魂 8
1.3.1 什麽是機器學習 9
1.3.2 機器學習發展史 9
1.3.3 機器學習的基本框架 11
1.4 讓人驚訝的“學習” 13
1.4.1 從猴子摘香蕉到星際大戰 13
1.4.2 集體學習的機器人 14
1.4.3 圖片和文字理解 16
1.4.4 AlphaGo 17
1.4.5 機器智能會超過人類智能嗎 18
1.5 開始你的機器學習之旅 19
1.5.1 訓練、驗證與測試 19
1.5.2 Occam剃刀準則 20
1.5.3 沒有免費的午餐 20
1.5.4 對初學者的幾點建議 20
1.6 AIDemo示例系統 21
1.6.1 AIDemo環境搭建 21
1.6.2 AIDemo示例基礎 22
1.6.3 人臉檢測(Face-detection):第一個示例程序 23
第2章 認識你的臉 26
2.1 人臉識別概述 26
2.1.1 什麽是人臉識別 26
2.1.2 人臉識別系統的基本組成 28
2.1.3 人臉識別簡史 29
2.2 基於特徵臉的人臉識別 34
2.2.1 主成分分析 34
2.2.2 支持向量機 37
2.3 基於深度學習的人臉識別 39
2.3.1 神經網絡的故事 39
2.3.2 神經網絡結構 42
2.3.3 深度學習 43
2.3.4 基於深度捲積網絡的人臉識別 44
2.3.5 基於DNN的人臉識別性能 46
2.4 深度神經網絡的其他應用 49
2.4.1 人臉檢測 49
2.4.2 人臉正規化 50
2.4.3 圖像生成 50
2.4.4 圖像風格轉換 52
2.5 AIDemo:人臉識別 53
思考題 57
第3章 聆聽你的聲音 58
3.1 語音的產生與感知 59
3.1.1 語音的產生 59
3.1.2 語音的感知 61
3.2 語音識別概述 62
3.2.1 什麽是語音識別 62
3.2.2 語音識別簡史 63
3.3 基於GMM-HMM 的語音識別 67
3.3.1 MFCC特徵提取 68
3.3.2 GMM-HMM 聲學模型 68
3.3.3 N-Gram語言模型 69
3.3.4 解碼過程 70
3.4 基於深度學習的語音識別 71
3.4.1 DNN特徵提取 72
3.4.2 DNN靜態建模 72
3.4.3 RNN動態建模 72
3.5 說話人識別 76
3.5.1 傳統GMM-UBM 系統 76
3.5.2 基於DNN的說話人識別系統 77
3.6 語音合成 79
3.6.1 參數合成 80
3.6.2 拼接合成 81
3.6.3 統計模型合成 81
3.6.4 神經模型合成 82
3.7 AIDemo:語音信號處理 84
3.7.1 實驗說明 84
3.7.2 實驗步驟 84
思考題 86
第4章 理解你的語言 87
4.1 人類語言的復雜性 88
4.1.1 結構復雜性 88
4.1.2 語義復雜性 89
4.1.3 知識復雜性 90
4.1.4 時空復雜性 90
4.1.5 應用復雜性 91
4.1.6 什麽是語言理解 91
4.2 傳統語言理解方法 91
4.2.1 詞法分析 92
4.2.2 句法分析 93
4.2.3 語義分析 94
4.3 基於深度學習的語言理解方法 96
4.3.1 詞向量 97
4.3.2 句向量 99
4.3.3 傳統方法和深度學習方法對比 100
4.4 機器翻譯 101
4.4.1 機器翻譯的歷史 101
4.4.2 統計機器翻譯 103
4.4.3 神經機器翻譯 103
4.5 語言理解的其他應用 106
4.5.1 搜索引擎 106
4.5.2 推薦系統 108
4.5.3 會話機器人 109
4.6 AIDemo:計算中文詞向量 111
思考題 113
第5章 模仿你的行為 114
5.1 現代機器人發展史 115
5.2 基於設計的機器人 120
5.2.1 操作機器人 120
5.2.2 移動機器人 122
5.3 基於學習的機器人 124
5.3.1 簡單的例子:模仿學習 125
5.3.2 強化學習 125
5.3.3 強化學習的學習對象 128
5.4 深度強化學習方法 130
5.4.1 Atari游戲 130
5.4.2 AlphaGoZero 131
5.4.3 實體機器人 132
5.4.4 兩種機器人的比較 135
5.5 AIDemo:AI機器人 136
思考題 137
第6章 學習你的思維 138
6.1 形象思維 139
6.1.1 詩詞生成 139
6.1.2 DeepDream 143
6.2 邏輯思維 148
6.2.1 定理證明:精確邏輯推理 149
6.2.2 閱讀理解:非精確邏輯推理 151
6.3 AIDemo:DeepDream 156
思考題 158