深度學習——從算法本質、系統工程到產業實踐
王書浩、徐罡
- 出版商: 清華大學
- 出版日期: 2024-04-01
- 售價: $534
- 貴賓價: 9.5 折 $507
- 語言: 簡體中文
- ISBN: 7302657491
- ISBN-13: 9787302657491
-
相關分類:
DeepLearning
立即出貨 (庫存=1)
買這商品的人也買了...
-
$305數學女王的邀請 初等數論入門
-
$354$336 -
$474$450 -
$607算法設計 (Algorithm Design)
-
$474$450 -
$539$512 -
$266智能優化算法——基於生物行為模型的案例分析與設計
-
$708$673 -
$266分佈式智能算法及在大數據中的應用
-
$497$472 -
$534$507 -
$653客戶留存數據分析與預測
-
$588$559 -
$479$455 -
$454精通推薦算法:核心模塊 + 經典模型 + 代碼詳解
-
$354$336 -
$509圖神經網絡前沿
-
$509Python量子計算實踐:基於Qiskit和IBM Quantum Experience平臺
相關主題
商品描述
本書介紹了深度學習的基本理論、工程實踐及其在產業界的部署和應用。在深度學習框架的介紹中,書中結合代碼詳細講解了經典的捲積神經網絡、循環神經網絡和基於自註意力機制的Transformer網絡及其變體。還介紹了這些模型在圖像分類、目標檢測、語義分割、欺詐檢測和語音識別等領域的應用。此外,書中還涵蓋了深度強化學習和生成對抗網絡的前沿進展。在系統工程和產業實踐方面,書中解釋瞭如何使用分佈式系統訓練和部署模型以處理大規模數據。本書系統介紹了構建深度學習推理系統的過程,並結合代碼講解了分佈式深度學習推理系統需要考慮的工程化因素,例如分佈式問題和消息隊列,以及從工程化角度出發的解決方法。本書提供了每個經典模型和應用實例的TensorFlow和PyTorch版本代碼,為深度學習初學者和算法開發者提供理論學習、代碼實踐和工程落地的指導與幫助。 本書既適合電腦、自動化、電子、通信、數學、物理等相關專業背景的研究生和高年級本科生,也適合那些希望從事或準備轉向人工智能領域的專業技術人員。
作者簡介
王書浩,清華大學博士,清華大學交叉信息研究院博士後,現為透徹未來聯合創始人與首席技術官,曾先後於百度、異構智能(NovuMind)、京東從事數據科學與人工智能研究,擁有國家發明專利20余項,並於Nature Communications、Modern Pathology、ICCV等頂級期刊/會議發表十余篇學術論文。曾獲得2019年烏鎮互聯網峰會“30位新生代數字經濟人才”精英獎、Year 2022 Fall Asia-Pacific Signal and Information Processing Association Industrial Distinguished Leaders、阿里雲“看見新力量”2022年度人物。
徐罡,清華大學博士,現任覆旦大學覆雜體系多尺度研究院青年副研究員,以第一作者身份在ICCV、Briefings in Bioinformatics、Bioinformatics、Journal of Chemical Theory and Computation與Journal of Chemical Information and Modeling等知名期刊/會議中發表多篇文章。主要研究方向為人工智能在醫療圖像及計算生物學領域中的應用,提出了弱監督框架CAMEL,並使用深度學習框架TensorFlow建立了蛋白質折疊和對接框架,為人工智能和傳統計算生物學領域的結合提供了橋梁。
目錄大綱
本書源代碼
第
1
章神經網絡深入 ...................................................................................................................
1
1.1 打開深度學習之門 ..........................................................................................................
1
1.2 從優化問題講起 ..............................................................................................................
6
1.2.1 牛頓與開普勒的對話 ..........................................................................................
6
1.2.2 擬合與分類的數學模型 ......................................................................................
6
1.2.3 通過訓練數據優化模型參數 ..............................................................................
8
1.2.4 優化方法 ........................................................................................................... 13
1.3 深度神經網絡 ................................................................................................................ 16
1.3.1 誰來做特徵提取 ............................................................................................... 16
1.3.2 人工神經元與激活函數 .................................................................................... 17
1.3.3 神經網絡及其數學本質 .................................................................................... 21
1.4 正則化方法 .................................................................................................................... 29
1.4.1 欠擬合與過擬合 ............................................................................................... 29
1.4.2 正則化方法 ....................................................................................................... 31
1.4.3 一些訓練技巧 ................................................................................................... 35
1.5 模型評價 ........................................................................................................................ 36
1.5.1 評價指標的重要性............................................................................................ 36
1.5.2 混淆矩陣 ........................................................................................................... 36
1.5.3 典型評價指標 ................................................................................................... 38
1.6 深度學習能力的邊界 .................................................................................................... 39
1.6.1 深度學習各領域的發展階段 ............................................................................ 39
1.6.2 不適用現有深度學習技術的任務 .................................................................... 39
1.6.3 深度學習的未來 ............................................................................................... 40
本章習題 ............................................................................................................................... 41
第
2
章捲積神經網絡——圖像分類與目標檢測 ..................................................................... 42
2.1 捲積的基本概念 ............................................................................................................ 42
VIII
2.1.1 捲積的定義 ....................................................................................................... 42
2.1.2 捲積的本質 ....................................................................................................... 43
2.1.3 捲積的重要參數 ............................................................................................... 43
2.1.4 池化層 ............................................................................................................... 45
2.2 捲積神經網絡 ................................................................................................................ 46
2.2.1 典型的捲積神經網絡 ........................................................................................ 47
2.2.2 LeNet ................................................................................................................. 50
2.2.3 AlexNet .............................................................................................................. 53
2.2.4 VGGNet ............................................................................................................. 57
2.2.5 ResNet ................................................................................................................ 63
2.2.6 能力對比 ........................................................................................................... 75
2.3 目標檢測 ........................................................................................................................ 76
2.3.1 R-CNN ............................................................................................................... 76
2.3.2 Fast R-CNN ....................................................................................................... 78
2.3.3 Faster R-CNN .................................................................................................... 79
2.3.4 YOLO ................................................................................................................ 79
本章習題 ............................................................................................................................... 81
第
3
章捲積神經網絡——語義分割 ......................................................................................... 82
3.1 語義分割基礎 ................................................................................................................ 82
3.1.1 語義分割的應用領域 ........................................................................................ 82
3.1.2 全捲積神經網絡 ............................................................................................... 83
3.1.3 反捲積與空洞捲積............................................................................................ 83
3.1.4 U-Net ................................................................................................................. 85
3.1.5 DeepLab v1 和v2 ............................................................................................. 90
3.1.6 DeepLab v3 ....................................................................................................... 95
3.1.7 兩種架構的融合——DeepLab v3+................................................................ 101
3.2 模型可視化 .................................................................................................................. 108
3.2.1 捲積核可視化 ................................................................................................. 109
3.2.2 特徵圖可視化 ................................................................................................. 109
3.2.3 表徵向量可視化 ............................................................................................. 109
3.2.4 遮蓋分析與顯著梯度分析 .............................................................................. 109
3.3 病理影像分割初探 .......................................................................................................110
3.3.1 病理——醫學診斷的“金標準” ...................................................................110
3.3.2 病理人工智能的挑戰 ....................................................................................... 111
3.3.3 真實模型訓練流程...........................................................................................112
IX
3.4 自監督學習 ...................................................................................................................117
3.4.1 方法概述 ..........................................................................................................117
3.4.2 自監督學習算法介紹 .......................................................................................118
3.5 模型訓練流程 .............................................................................................................. 123
3.5.1 成本函數 ......................................................................................................... 123
3.5.2 自動調節學習速率.......................................................................................... 123
3.5.3 模型保存與加載 ............................................................................................. 123
本章習題 .............................................................................................................................. 124
第
4
章高級循環神經網絡 ....................................................................................................... 125
4.1 自然語言處理基礎 ...................................................................................................... 125
4.1.1 時間維度的重要性.......................................................................................... 125
4.1.2 自然語言處理 ................................................................................................. 125
4.1.3 詞袋法 ............................................................................................................. 126
4.1.4 詞嵌入 ............................................................................................................. 127
4.2 循環神經網絡 .............................................................................................................. 128
4.2.1 時序數據建模的模式 ...................................................................................... 128
4.2.2 循環神經網絡基本結構 .................................................................................. 128
4.2.3 LSTM ............................................................................................................... 131
4.2.4 GRU................................................................................................................. 134
4.3 基於會話的欺詐檢測 .................................................................................................. 137
4.3.1 欺詐的模式 ..................................................................................................... 137
4.3.2 技術挑戰 ......................................................................................................... 138
4.3.3 數據預處理 ..................................................................................................... 138
4.3.4 實踐循環神經網絡.......................................................................................... 140
4.4 語音識別與語音評測 .................................................................................................. 148
4.4.1 特徵提取 ......................................................................................................... 148
4.4.2 模型結構 ......................................................................................................... 149
4.4.3 CTC 損失函數 ................................................................................................. 151
本章習題 .............................................................................................................................. 152
第
5
章分佈式深度學習系統 ................................................................................................... 153
5.1 分佈式系統 .................................................................................................................. 153
5.1.1 挑戰與應對 ..................................................................................................... 153
5.1.2 主從架構 ......................................................................................................... 154
5.1.3 Hadoop 與Spark ............................................................................................. 154
X
5.2 分佈式深度學習系統 .................................................................................................. 157
5.2.1 CPU 與GPU .................................................................................................... 157
5.2.2 分佈式深度學習 ............................................................................................. 160
5.2.3 通信——對參數進行同步 .............................................................................. 164
5.3 微服務架構 .................................................................................................................. 165
5.3.1 微服務的基本概念.......................................................................................... 166
5.3.2 消息隊列 ......................................................................................................... 167
5.4 分佈式推理系統 .......................................................................................................... 167
5.4.1 深度學習推理框架.......................................................................................... 167
5.4.2 推理系統架構 ................................................................................................. 169
本章習題 .............................................................................................................................. 171
第
6
章深度學習前沿 ............................................................................................................... 173
6.1 深度強化學習 .............................................................................................................. 173
6.1.1 強化學習概述 ................................................................................................. 173
6.1.2 深度強化學習概述.......................................................................................... 174
6.1.3 任天堂游戲的深度強化學習 .......................................................................... 175
6.2 AlphaGo ....................................................................................................................... 176
6.2.1 為什麽圍棋這麽困難 ...................................................................................... 176
6.2.2 AlphaGo 系統架構 .......................................................................................... 177
6.2.3 AlphaGo Zero .................................................................................................. 181
6.3 生成對抗網絡 .............................................................................................................. 182
6.3.1 生成對抗網絡概述.......................................................................................... 182
6.3.2 典型的生成對抗網絡 ...................................................................................... 182
6.4 未來在哪裡 .................................................................................................................. 207
本章習題 .............................................................................................................................. 210
第
7
章專題講座 ........................................................................................................................211
7.1 DenseNet .......................................................................................................................211
7.2 Inception ...................................................................................................................... 216
7.3 Xception ....................................................................................................................... 230
7.4 ResNeXt ....................................................................................................................... 236
7.5 Transformer .................................................................................................................. 240
本章習題 .............................................................................................................................. 242
第
8
章Transformer
和它的朋友們 ........................................................................................ 243
8.1 註意力模型 .................................................................................................................. 243
XI
8.1.1 看圖說話 ......................................................................................................... 243
8.1.2 語言翻譯 ......................................................................................................... 245
8.1.3 幾種不同的註意力機制 .................................................................................. 246
8.2 Transformer .................................................................................................................. 250
8.2.1 自註意力機制和Transformer ......................................................................... 250
8.2.2 Transformer 在視覺領域的應用 ..................................................................... 278
本章習題 .............................................................................................................................. 293
第
9
章核心實戰 ....................................................................................................................... 294
9.1 圖像分類 ...................................................................................................................... 295
9.1.1 ImageNet 數據集概述 ..................................................................................... 295
9.1.2 ImageNet 數據探索與預處理 ......................................................................... 295
9.1.3 模型訓練 ......................................................................................................... 299
9.1.4 模型測試 ......................................................................................................... 304
9.1.5 模型評價 ......................................................................................................... 307
9.1.6 貓狗大戰數據集 ............................................................................................. 309
9.1.7 模型導出 ......................................................................................................... 310
9.2 語義分割 .......................................................................................................................311
9.2.1 數字病理切片介紹...........................................................................................311
9.2.2 數字病理切片預處理 ...................................................................................... 314
9.2.3 樣本均衡性處理 ............................................................................................. 317
9.2.4 模型訓練 ......................................................................................................... 319
9.2.5 模型測試 ......................................................................................................... 324
9.2.6 模型導出 ......................................................................................................... 331
本章習題 .............................................................................................................................. 332
第10
章深度學習推理系統 ..................................................................................................... 333
10.1 整體架構 .................................................................................................................... 333
10.2 調度器模塊 ................................................................................................................ 334
10.3 工作節點模塊 ............................................................................................................ 340
10.4 日誌模塊 .................................................................................................................... 347
本章習題 .............................................................................................................................. 349
參考文獻 ..................................................................................................................................... 350
擴展資源二維碼........................................................................................................................... 351