深度學習——從算法本質、系統工程到產業實踐

王書浩、徐罡

  • 出版商: 清華大學
  • 出版日期: 2024-04-01
  • 售價: $534
  • 貴賓價: 9.5$507
  • 語言: 簡體中文
  • ISBN: 7302657491
  • ISBN-13: 9787302657491
  • 相關分類: DeepLearning
  • 立即出貨 (庫存=1)

  • 深度學習——從算法本質、系統工程到產業實踐-preview-1
  • 深度學習——從算法本質、系統工程到產業實踐-preview-2
  • 深度學習——從算法本質、系統工程到產業實踐-preview-3
深度學習——從算法本質、系統工程到產業實踐-preview-1

買這商品的人也買了...

相關主題

商品描述

本書介紹了深度學習的基本理論、工程實踐及其在產業界的部署和應用。在深度學習框架的介紹中,書中結合代碼詳細講解了經典的捲積神經網絡、循環神經網絡和基於自註意力機制的Transformer網絡及其變體。還介紹了這些模型在圖像分類、目標檢測、語義分割、欺詐檢測和語音識別等領域的應用。此外,書中還涵蓋了深度強化學習和生成對抗網絡的前沿進展。在系統工程和產業實踐方面,書中解釋瞭如何使用分佈式系統訓練和部署模型以處理大規模數據。本書系統介紹了構建深度學習推理系統的過程,並結合代碼講解了分佈式深度學習推理系統需要考慮的工程化因素,例如分佈式問題和消息隊列,以及從工程化角度出發的解決方法。本書提供了每個經典模型和應用實例的TensorFlow和PyTorch版本代碼,為深度學習初學者和算法開發者提供理論學習、代碼實踐和工程落地的指導與幫助。 本書既適合電腦、自動化、電子、通信、數學、物理等相關專業背景的研究生和高年級本科生,也適合那些希望從事或準備轉向人工智能領域的專業技術人員。

作者簡介

王書浩,清華大學博士,清華大學交叉信息研究院博士後,現為透徹未來聯合創始人與首席技術官,曾先後於百度、異構智能(NovuMind)、京東從事數據科學與人工智能研究,擁有國家發明專利20余項,並於Nature Communications、Modern Pathology、ICCV等頂級期刊/會議發表十余篇學術論文。曾獲得2019年烏鎮互聯網峰會“30位新生代數字經濟人才”精英獎、Year 2022 Fall Asia-Pacific Signal and Information Processing Association Industrial Distinguished Leaders、阿里雲“看見新力量”2022年度人物。
徐罡,清華大學博士,現任覆旦大學覆雜體系多尺度研究院青年副研究員,以第一作者身份在ICCV、Briefings in Bioinformatics、Bioinformatics、Journal of Chemical Theory and Computation與Journal of Chemical Information and Modeling等知名期刊/會議中發表多篇文章。主要研究方向為人工智能在醫療圖像及計算生物學領域中的應用,提出了弱監督框架CAMEL,並使用深度學習框架TensorFlow建立了蛋白質折疊和對接框架,為人工智能和傳統計算生物學領域的結合提供了橋梁。

目錄大綱

本書源代碼 

章神經網絡深入 ................................................................................................................... 

 

 

1.1 打開深度學習之門 .......................................................................................................... 

1

 

 

1.2 從優化問題講起 .............................................................................................................. 

6

 

 

1.2.1 牛頓與開普勒的對話 .......................................................................................... 

6

 

 

1.2.2 擬合與分類的數學模型 ...................................................................................... 

6

 

 

1.2.3 通過訓練數據優化模型參數 .............................................................................. 

8

 

 

1.2.4 優化方法 ........................................................................................................... 13

 

 

1.3 深度神經網絡 ................................................................................................................ 16

 

 

1.3.1 誰來做特徵提取 ............................................................................................... 16 

 

 

1.3.2 人工神經元與激活函數 .................................................................................... 17 

 

 

1.3.3 神經網絡及其數學本質 .................................................................................... 21 

 

 

1.4 正則化方法 .................................................................................................................... 29

 

 

1.4.1 欠擬合與過擬合 ............................................................................................... 29 

 

 

1.4.2 正則化方法 ....................................................................................................... 31 

 

 

1.4.3 一些訓練技巧 ................................................................................................... 35 

 

 

1.5 模型評價 ........................................................................................................................ 36

 

 

1.5.1 評價指標的重要性............................................................................................ 36 

 

 

1.5.2 混淆矩陣 ........................................................................................................... 36 

 

 

1.5.3 典型評價指標 ................................................................................................... 38 

 

 

1.6 深度學習能力的邊界 .................................................................................................... 39

 

 

1.6.1 深度學習各領域的發展階段 ............................................................................ 39 

 

 

1.6.2 不適用現有深度學習技術的任務 .................................................................... 39 

 

 

1.6.3 深度學習的未來 ............................................................................................... 40 

本章習題 ............................................................................................................................... 41

 

 

章捲積神經網絡——圖像分類與目標檢測 ..................................................................... 42 

 

 

2.1 捲積的基本概念 ............................................................................................................ 42

 

 

 

VIII

 

 

2.1.1 捲積的定義 ....................................................................................................... 42 

 

 

2.1.2 捲積的本質 ....................................................................................................... 43 

 

 

2.1.3 捲積的重要參數 ............................................................................................... 43 

 

 

2.1.4 池化層 ............................................................................................................... 45 

 

 

2.2 捲積神經網絡 ................................................................................................................ 46

 

 

2.2.1 典型的捲積神經網絡 ........................................................................................ 47 

 

 

2.2.2 LeNet ................................................................................................................. 50

 

 

2.2.3 AlexNet .............................................................................................................. 53 

 

 

2.2.4 VGGNet ............................................................................................................. 57 

 

 

2.2.5 ResNet ................................................................................................................ 63

 

 

2.2.6 能力對比 ........................................................................................................... 75 

 

 

2.3 目標檢測 ........................................................................................................................ 76

 

 

2.3.1 R-CNN ............................................................................................................... 76

 

 

2.3.2 Fast R-CNN ....................................................................................................... 78 

 

 

2.3.3 Faster R-CNN .................................................................................................... 79 

 

 

2.3.4 YOLO ................................................................................................................ 79

本章習題 ............................................................................................................................... 81

 

 

章捲積神經網絡——語義分割 ......................................................................................... 82 

 

 

3.1 語義分割基礎 ................................................................................................................ 82

 

 

3.1.1 語義分割的應用領域 ........................................................................................ 82 

 

 

3.1.2 全捲積神經網絡 ............................................................................................... 83 

 

 

3.1.3 反捲積與空洞捲積............................................................................................ 83 

 

 

3.1.4 U-Net ................................................................................................................. 85

 

 

3.1.5 DeepLab v1 和v2 ............................................................................................. 90 

 

 

3.1.6 DeepLab v3 ....................................................................................................... 95 

 

 

3.1.7 兩種架構的融合——DeepLab v3+................................................................ 101 

 

 

3.2 模型可視化 .................................................................................................................. 108

 

 

3.2.1 捲積核可視化 ................................................................................................. 109 

 

 

3.2.2 特徵圖可視化 ................................................................................................. 109 

 

 

3.2.3 表徵向量可視化 ............................................................................................. 109 

 

 

3.2.4 遮蓋分析與顯著梯度分析 .............................................................................. 109 

 

 

3.3 病理影像分割初探 .......................................................................................................110

 

 

3.3.1 病理——醫學診斷的“金標準” ...................................................................110 

 

 

3.3.2 病理人工智能的挑戰 ....................................................................................... 111 

 

 

3.3.3 真實模型訓練流程...........................................................................................112 

 

 

 

IX

3.4 自監督學習 ...................................................................................................................117

 

 

3.4.1 方法概述 ..........................................................................................................117 

 

 

3.4.2 自監督學習算法介紹 .......................................................................................118 

 

 

3.5 模型訓練流程 .............................................................................................................. 123

 

 

3.5.1 成本函數 ......................................................................................................... 123 

 

 

3.5.2 自動調節學習速率.......................................................................................... 123 

 

 

3.5.3 模型保存與加載 ............................................................................................. 123 

本章習題 .............................................................................................................................. 124

 

 

章高級循環神經網絡 ....................................................................................................... 125 

 

 

4.1 自然語言處理基礎 ...................................................................................................... 125

 

 

4.1.1 時間維度的重要性.......................................................................................... 125 

 

 

4.1.2 自然語言處理 ................................................................................................. 125 

 

 

4.1.3 詞袋法 ............................................................................................................. 126 

 

 

4.1.4 詞嵌入 ............................................................................................................. 127 

 

 

4.2 循環神經網絡 .............................................................................................................. 128

 

 

4.2.1 時序數據建模的模式 ...................................................................................... 128 

 

 

4.2.2 循環神經網絡基本結構 .................................................................................. 128 

 

 

4.2.3 LSTM ............................................................................................................... 131

 

 

4.2.4 GRU................................................................................................................. 134 

 

 

4.3 基於會話的欺詐檢測 .................................................................................................. 137

 

 

4.3.1 欺詐的模式 ..................................................................................................... 137 

 

 

4.3.2 技術挑戰 ......................................................................................................... 138 

 

 

4.3.3 數據預處理 ..................................................................................................... 138 

 

 

4.3.4 實踐循環神經網絡.......................................................................................... 140 

 

 

4.4 語音識別與語音評測 .................................................................................................. 148

 

 

4.4.1 特徵提取 ......................................................................................................... 148 

 

 

4.4.2 模型結構 ......................................................................................................... 149 

 

 

4.4.3 CTC 損失函數 ................................................................................................. 151 

本章習題 .............................................................................................................................. 152

 

 

章分佈式深度學習系統 ................................................................................................... 153 

 

 

5.1 分佈式系統 .................................................................................................................. 153

 

 

5.1.1 挑戰與應對 ..................................................................................................... 153 

 

 

5.1.2 主從架構 ......................................................................................................... 154 

 

 

5.1.3 Hadoop 與Spark ............................................................................................. 154 

 

 

 

 

 

5.2 分佈式深度學習系統 .................................................................................................. 157

 

 

5.2.1 CPU 與GPU .................................................................................................... 157 

 

 

5.2.2 分佈式深度學習 ............................................................................................. 160 

 

 

5.2.3 通信——對參數進行同步 .............................................................................. 164 

 

 

5.3 微服務架構 .................................................................................................................. 165

 

 

5.3.1 微服務的基本概念.......................................................................................... 166 

 

 

5.3.2 消息隊列 ......................................................................................................... 167 

 

 

5.4 分佈式推理系統 .......................................................................................................... 167

 

 

5.4.1 深度學習推理框架.......................................................................................... 167 

 

 

5.4.2 推理系統架構 ................................................................................................. 169 

本章習題 .............................................................................................................................. 171

 

 

章深度學習前沿 ............................................................................................................... 173 

 

 

6.1 深度強化學習 .............................................................................................................. 173

 

 

6.1.1 強化學習概述 ................................................................................................. 173 

 

 

6.1.2 深度強化學習概述.......................................................................................... 174 

 

 

6.1.3 任天堂游戲的深度強化學習 .......................................................................... 175 

 

 

6.2 AlphaGo ....................................................................................................................... 176

 

 

6.2.1 為什麽圍棋這麽困難 ...................................................................................... 176 

 

 

6.2.2 AlphaGo 系統架構 .......................................................................................... 177 

 

 

6.2.3 AlphaGo Zero .................................................................................................. 181 

 

 

6.3 生成對抗網絡 .............................................................................................................. 182

 

 

6.3.1 生成對抗網絡概述.......................................................................................... 182 

 

 

6.3.2 典型的生成對抗網絡 ...................................................................................... 182 

 

 

6.4 未來在哪裡 .................................................................................................................. 207

本章習題 .............................................................................................................................. 210

 

 

章專題講座 ........................................................................................................................211

 

 

7.1 DenseNet .......................................................................................................................211

 

 

7.2 Inception ...................................................................................................................... 216

 

 

7.3 Xception ....................................................................................................................... 230

 

 

7.4 ResNeXt ....................................................................................................................... 236

 

 

7.5 Transformer .................................................................................................................. 240

本章習題 .............................................................................................................................. 242

 

 

章Transformer 

和它的朋友們 ........................................................................................ 243 

 

 

8.1 註意力模型 .................................................................................................................. 243

 

 

 

XI

8.1.1 看圖說話 ......................................................................................................... 243 

 

 

8.1.2 語言翻譯 ......................................................................................................... 245 

 

 

8.1.3 幾種不同的註意力機制 .................................................................................. 246 

 

 

8.2 Transformer .................................................................................................................. 250

 

 

8.2.1 自註意力機制和Transformer ......................................................................... 250 

 

 

8.2.2 Transformer 在視覺領域的應用 ..................................................................... 278 

本章習題 .............................................................................................................................. 293

 

 

章核心實戰 ....................................................................................................................... 294 

 

 

9.1 圖像分類 ...................................................................................................................... 295

 

 

9.1.1 ImageNet 數據集概述 ..................................................................................... 295 

 

 

9.1.2 ImageNet 數據探索與預處理 ......................................................................... 295 

 

 

9.1.3 模型訓練 ......................................................................................................... 299 

 

 

9.1.4 模型測試 ......................................................................................................... 304 

 

 

9.1.5 模型評價 ......................................................................................................... 307 

 

 

9.1.6 貓狗大戰數據集 ............................................................................................. 309 

 

 

9.1.7 模型導出 ......................................................................................................... 310 

 

 

9.2 語義分割 .......................................................................................................................311

 

 

9.2.1 數字病理切片介紹...........................................................................................311

 

 

9.2.2 數字病理切片預處理 ...................................................................................... 314 

 

 

9.2.3 樣本均衡性處理 ............................................................................................. 317 

 

 

9.2.4 模型訓練 ......................................................................................................... 319 

 

 

9.2.5 模型測試 ......................................................................................................... 324 

 

 

9.2.6 模型導出 ......................................................................................................... 331 

本章習題 .............................................................................................................................. 332

 

 

第10 

章深度學習推理系統 ..................................................................................................... 333 

 

 

10.1 整體架構 .................................................................................................................... 333

 

 

10.2 調度器模塊 ................................................................................................................ 334

 

 

10.3 工作節點模塊 ............................................................................................................ 340

 

 

10.4 日誌模塊 .................................................................................................................... 347

本章習題 .............................................................................................................................. 349

 

 

參考文獻 ..................................................................................................................................... 350 

 

 

擴展資源二維碼........................................................................................................................... 351