深度神經網絡高效計算：大模型輕量化原理與關鍵技術

程健

出版商: 電子工業
出版日期: 2024-08-01
售價: $594
貴賓價: 9.5 折 $564
語言: 簡體中文
頁數: 332
裝訂: 平裝
ISBN: 7121484013
ISBN-13: 9787121484018
相關分類: LangChain

立即出貨

買這商品的人也買了...

~~$336~~ $319

虛擬化與網絡存儲技術
~~$414~~ $393

對抗機器學習：機器學習系統中的攻擊和防禦
$403

奇妙量子世界人人都能看懂的量子科學漫畫
~~$1,194~~ $1,134

基於模型的系統工程有效方法
~~$354~~ $336

光波導原理與器件
~~$539~~ $512

動手打造深度學習框架
~~$420~~ $378

量子科技入門
$500

雷達輻射式模擬信號分析與處理
~~$600~~ $510

零基礎學會 Python 程式交易：一本讀懂 Python 實作金融資產配置
~~$594~~ $564

雷達電子戰系統模擬與評估
~~$479~~ $455

AIGC 自動化編程：基於 ChatGPT 和 GitHub Copilot
~~$750~~ $593

最強 AI 投資分析：打造自己的股市顧問機器人，股票趨勢分析×年報解讀×選股推薦×風險管理
~~$880~~ $695

邊緣AI｜使用嵌入式機器學習解決真實世界的問題 (AI at the Edge: Solving Real-World Problems with Embedded Machine Learning)
~~$414~~ $393

PyTorch 語音識別實戰
$607

多模態大模型：新一代人工智能技術範式
~~$1,200~~ $948

AI 時代 Math 元年 - 用 Python 全精通統計及機率
~~$650~~ $507

LLM 大型語言模型的絕世祕笈：27路獨步劍法，帶你闖蕩生成式 AI 的五湖四海（iThome鐵人賽系列書）
~~$594~~ $564

動手學 PyTorch 建模與應用：從深度學習到大模型
~~$650~~ $514

「演算法×數學」全彩圖解學習全指南：從基礎開始，一次學會24種必學演算法與背後的關鍵數學知識及應用
~~$600~~ $570

多模態人工智能：大模型核心原理與關鍵技術
~~$680~~ $476

營養師不開菜單後的 Next.js 全端轉職攻略：從專案規劃、畫面設計、資安到 SEO，挑戰一人 Side Project (iThome鐵人賽系列書)
$602

大語言模型開發：用開源模型開發本地系統
~~$834~~ $792

外輻射源雷達目標探測工程及應用
~~$714~~ $678

多智能體自主協同技術
~~$534~~ $507

深度學習編譯器設計

商品描述

近年來，在深度學習的推動下，人工智能步入新的發展階段。
然而，隨著深度學習模型效能的提升，其運算複雜度也不斷增加，深度學習模型的運作效率面臨巨大挑戰。
在這種情況下，深度學習高效計算成為在更大範圍內應用人工智能的重要環節。
本書圍繞深度學習模型計算，重點從深度學習模型最佳化、演算法軟件加速、硬件架構設計等方面展開介紹深度學習高效計算，
主要包括低秩分解、剪枝、量化、知識蒸餾、精簡網絡設計與搜尋、深度神經網絡高效訓練、
捲積神經網絡高效計算、大模型高效計算、神經網絡加速器設計等內容。
本書既適合大學相關專業學生，也可作為從業人員的案頭參考。

作者簡介

程健，中國科學院自動化研究所研究員、博士生導師，中國科學院大學崗位教授，國家高層次領軍人才，中科南京人工智能創新研究院常務副院長。研究興趣包括深度學習、芯片架構設計、圖像與視頻分析等。近幾年帶領團隊提出了系列基於量化學習的模型壓縮和加速算法，並研發了量化神經處理器（QNPU）芯片架構。相關成果曾先後獲得中科院盧嘉錫青年人才獎、中國電子學會科技一等獎、中國圖象圖形學學會科技二等獎、江蘇省科技一等獎等。

目錄大綱

1 概述
1.1 深度學習與人工智能
1.2 深度學習高效計算
1.2.1 深度學習計算面臨困難
1.2.2 主要研究方向
1.3 本章小結
2 神經網絡與深度學習基礎
2.1 神經網絡
2.1.1 感知機
2.1.2 多層感知機
2.1.3 深度學習
2.2 神經網絡訓練
2.2.1 梯度下降
2.2.2 損失函數
2.2.3 過擬合與正規化
2.3 典型深度神經網絡
2.3.1 捲積神經網絡
2.3.2 循環神經網絡
2.3.3 圖神經網絡
2.3.4 自註意力神經網絡
2.4 本章小結
3 深度學習框架介紹
3.1 什麼是深度學習框架
3.2 深度學習架構的基本組成
3.2.1 張量
3.2.2 算子
3.2.3 計算圖
3.2.4 自動微分支持
3.2.5 並行計算支持
3.3 深度學習訓練框架
3.3.1 TensorFlow
3.3.2 PyTorch
3.3.3 Caffe
3.3.4 MXNet
3.3.5 PaddlePaddle
3.3.6 MindSpore
3.4 深度學習推理框架
3.4.1 TensorFlow Lite
3.4.2 MNN
3.4.3 NCNN
3.4.4 MACE
3.4.5 SNPE
3.4.6 華為HiAI
3.4.7 TensorRT
3.4.8 QNN
3.5 本章小結
4 低秩分解
4.1 張量基礎
4.1.1 張量定義
4.1.2 張量運算
4.1.3 特殊型張量
4.2 矩陣SVD分解
4.2.1 特徵值與特徵向量
4.2.2 特徵值分解
4.2.3 SVD分解
4.2.4 全連接層SVD分解
4.2.5 捲積層SVD分解
4.3 張量低秩分解
4.3.1 Tucker分解
4.3.2 CP分解
4.3.3 BTD分解
4.4 本章小結
5 深度神經網絡剪枝
5.1 神經網絡剪枝簡介
5.1.1 剪枝的基本概念與定義
5.1.2 剪枝的作用與意義
5.1.3 神經網絡剪枝發展簡史
5.1.4 剪枝的基本類型
5.2 稀疏網絡儲存格式
5.2.1 非結構化剪枝儲存格式
5.2.2 結構化剪枝儲存格式
5.3 神經網絡剪枝演算法
5.3.1 基於重要性度量的剪枝
5.3.2 基於稀疏正規化的剪枝方法
5.3.3 基於逐層特徵重構的剪枝
5.3.4 運行時剪枝演算法
5.3.5 基於初始化的剪枝演算法
5.3.6 基於自動機器學習的剪枝演算法
5.4 本章小結
6 量化
6.1 量化基礎
6.1.1 量化函數
6.1.2 量化計算
6.1.3 量化粒度
6.2 訓練後量化
6.2.1 量化參數求解
6.2.2 量化誤差校正
6.2.3 訓練後量化經典方法
6.2.4 訓練後量化流程
6.3 量化感知訓練
6.3.1 QAT基礎
6.3.2 QAT經典方法
6.3.3 QAT流程
6.4 進階課題
6.4.1 混合精度量化
6.4.2 無數據量化
6.4.3 二值量化
6.5 本章小結
7 知識蒸餾
7.1 何為知識
7.2 如何蒸餾
7.2.1 軟標籤蒸餾
7.2.2 隱層特徵蒸餾
7.3 相關應用
7.3.1 魯棒訓練
7.3.2 語意分割
7.3.3 目標偵測
7.4 本章小結
8 精簡網頁設計與搜尋
8.1 手工設計神經網絡架構
8.1.1 Network In Network
8.1.2 ResNeXt
8.1.3 SqueezeNet
8.1.4 MobileNet
8.1.5 ShuffleNet
8.2 神經網絡架構搜尋
8.2.1 基於權重共享的神經網絡架構搜尋
8.2.2 基於預測器的神經網絡架構搜尋
8.2.3 基於先驗指標的神經網絡架構搜索
8.3 本章小結
9 深度神經網絡高效訓練方法
9.1 深度神經網絡高效訓練簡介
9.1.1 什麼是高效訓練方法
9.1.2 高效訓練方法基本型
9.1.3 高效訓練演算法的意義
9.2 深度神經網絡訓練基本流程
9.2.1 資料預處理
9.2.2 前向傳播
9.2.3 反向傳播
9.2.4 權重更新
9.3 深度神經網絡分佈式訓練
9.3.1 參數服務器模式
9.3.2 Ring All-Reduce模式
9.4 面向資料預處理的高效訓練方法
9.4.1 基於GPU的資料預處理
9.4.2 基於資料重複的資料預處理
9.5 基於梯度壓縮的高效分佈式訓練
9.5.1 梯度剪枝方法
9.5.2 梯度量化方法
9.5.3 本地殘差梯度積累
9.5.4 本地梯度截斷
9.6 面向顯存優化的高效訓練演算法
9.6.1 網絡訓練內存構成
9.6.2 梯度檢查點
9.6.3 內存下放
9.6.4 激活壓縮的訓練
9.7 以運算過程為導向的網絡訓練加速
9.7.1 FP16混合精度訓練演算法
9.7.2 基於低位元量化的訓練加速演算法
9.7.3 稠密和稀疏網絡交替訓練演算法
9.7.4 基於稀疏反向傳播的訓練加速
9.8 本章小結
10 捲積神經網絡高效計算
10.1 im2col算法
10.1.1 一維捲積的im2col演算法
10.1.2 二維捲積的im2col演算法
10.1.3 多輸入通道的二維捲積的im2col演算法
10.1.4 多輸出通道的二維捲積的im2col演算法
10.2 矩陣乘演算法最佳化與實現
10.2.1 基礎實現

深度神經網絡高效計算：大模型輕量化原理與關鍵技術

程健

買這商品的人也買了...

相關主題

商品描述

作者簡介

目錄大綱

類似商品

最後瀏覽商品 (2)