深度學習系統設計:理論與實踐

人工智能系統小組

  • 出版商: 機械工業
  • 出版日期: 2024-10-01
  • 定價: $894
  • 售價: 8.5$760
  • 語言: 簡體中文
  • 頁數: 479
  • ISBN: 7111759362
  • ISBN-13: 9787111759362
  • 相關分類: DeepLearning
  • 下單後立即進貨 (約4週~6週)

商品描述

近年來人工智能特別是深度學習技術得到了飛速發展,這背後離不開計算機硬件和軟件系統的不斷進步。在可見的未來,人工智能技術的發展仍將依賴於計算機系統和人工智能相結合的共同創新模式。本書介紹了前沿的系統和人工智能相結合的研究工作,包括AI for Systems和Systems for AI,以幫助讀者更好地尋找和定義有意義的研究問題。同時,本書從系統研究的角度出發設計實驗課程,通過操作和應用主流及最新的框架、平臺和工具來鼓勵讀者動手實現和優化系統模塊,以提高解決實際問題的能力,而不僅僅是瞭解工具使用。 本書主要面向相關領域的本科生、研究生、教師、工程師和研究員,幫助他們完整地瞭解支持深度學習的計算機系統架構,並通過解決實際問題來學習深度學習完整生命周期下的系統設計。

目錄大綱

推薦序一
推薦序二
推薦序三
前言
致謝
第1章 人工智能系統概述
本章簡介
內容概覽
1.1 深度學習的歷史、現狀與發展
1.1.1 深度學習的廣泛應用
1.1.2 深度學習方法
1.1.3 神經網絡基本理論的奠定
1.1.4 深度學習算法、模型的現狀和趨勢
1.1.5 小結與討論
1.1.6 參考文獻
1.2 算法、框架、體系結構與算力的進步
1.2.1 大數據和分佈式系統
1.2.2 深度學習算法的進步
1.2.3 計算機體系結構和計算能力的進步
1.2.4 計算框架的進步
1.2.5 小結與討論
1.2.6 參考文獻
1.3 深度學習系統的組成與生態
1.3.1 深度學習系統的設計目標
1.3.2 深度學習系統的大致組成
1.3.3 深度學習系統的生態
1.3.4 小結與討論
1.3.5 參考文獻
1.4 深度學習樣例背後的系統問題
1.4.1 一個深度學習樣例與其中的系統問題
1.4.2 模型算子實現中的系統問題
1.4.3 框架執行深度學習模型的生命周期
1.4.4 更廣泛的人工智能系統生態
1.4.5 深度學習框架及工具入門實驗
1.4.6 小結與討論
1.4.7 參考文獻
1.5 影響深度學習系統設計的理論、原則與假設
1.5.1 抽象層次化表示與解釋
1.5.2 摩爾定律與算力發展趨勢
1.5.3 局部性原則與內存層次結構
1.5.4 線性代數計算與模型缺陷容忍特性
1.5.5 並行加速與阿姆達爾定律優化上限
1.5.6 冗餘與可靠性
1.5.7 小結與討論
1.5.8 參考文獻
第2章 神經網絡基礎
本章簡介
內容概覽
2.1 神經網絡的基本概念
2.1.1 神經元的數學模型
2.1.2 神經網絡的主要功能
2.1.3 激活函數
2.1.4 小結與討論
2.2 神經網絡訓練
2.2.1 基本訓練流程
2.2.2 損失函數
2.2.3 梯度下降
2.2.4 反向傳播
2.2.5 小結與討論
2.3 解決回歸問題
2.3.1 提出問題
2.3.2 萬能近似定理
2.3.3 定義神經網絡結構
2.3.4 前向計算
2.3.5 反向傳播
2.3.6 運行結果
2.3.7 小結與討論
2.4 解決分類問題
2.4.1 提出問題
2.4.2 定義神經網絡結構
2.4.3 前向計算
2.4.4 反向傳播
2.4.5 運行結果
2.4.6 小結與討論
2.5 深度神經網絡
2.5.1 抽象與設計
2.5.2 權重矩陣初始化
2.5.3 批量歸一化
2.5.4 過擬合
2.5.5 小結與討論
2.6 梯度下降優化算法
2.6.1 隨機梯度下降算法
2.6.2 動量算法
2.6.3 Adam算法
2.6.4 小結與討論
2.7 捲積神經網絡
2.7.1 捲積神經網絡的能力
2.7.2 捲積神經網絡的典型結構
2.7.3 捲積核的作用
2.7.4 捲積後續的運算
2.7.5 捲積神經網絡的特性
2.7.6 捲積類型
2.7.7 小結與討論
2.8 循環神經網絡
2.8.1 循環神經網絡的發展簡史
2.8.2 循環神經網絡的結構和典型用途
2.8.3 小結與討論
2.9 Transformer模型
2.9.1 序列到序列模型
2.9.2 註意力機制
2.9.3 Transformer
2.9.4 小結與討論
第3章 深度學習框架基礎
本章簡介
內容概覽
3.1 基於數據流圖的深度學習框架
3.1.1 深度學習框架發展概述
3.1.2 編程範式:聲明式和命令式
3.1.3 數據流圖
3.1.4 張量和張量操作
3.1.5 自動微分基礎
3.1.6 數據流圖上的自動微分
3.1.7 數據流圖的調度與執行
3.1.8 單設備算子間調度
3.1.9 圖切分與多設備執行
3.1.10 小結與討論
3.1.11 參考文獻
3.2 神經網絡計算中的控制流
3.2.1 背景
3.2.2 靜態圖:向數據流圖中添加控制流原語
3.2.3 動態圖:覆用宿主語言控制流語句
3.2.4 動態圖轉換為靜態圖
3.2.5 小結與討論
3.2.6 參考文獻
第4章 矩陣運算與計算機體系結構
本章簡介
內容概覽
4.1 深度學習的歷史、現狀與發展
4.1.1 全連接層
4.1.2 捲積層
4.1.3 循環網絡層
4.1.4 註意力機制層
4.1.5 小結與討論
4.1.6 參考文獻
4.2 計算機體系結構與矩陣運算
4.2.1 CPU體系結構
4.2.2 CPU實現高效計算矩陣乘
4.2.3 在CPU上實現一個矩陣乘法算子實驗
4.2.4 小結與討論
4.3 GPU體系結構與矩陣運算
4.3.1 GPU體系結構
4.3.2 GPU編程模型
4.3.3 GPU實現一個簡單的計算
4.3.4 在GPU上實現一個矩陣乘法算子實驗
4.3.5 小結與討論
4.4 面向深度學習的專有硬件加速器與矩陣運算
4.4.1 深度學習計算的特點與硬件優化方向
4.4.2 脈動陣列與矩陣計算
4.4.3 小結與討論
第5章 深度學習的編譯與優化
本章簡