買這商品的人也買了...
-
$719$683 -
$403深度學習 : 捲積神經網絡從入門到精通
-
$620$484 -
$474$450 -
$750$675 -
$580$493 -
$680$537 -
$602嵌入式 C語言自我修養 — 從芯片、編譯器到操作系統
-
$580$458 -
$600$540 -
$714$678 -
$340$333 -
$662二進制分析實戰
-
$509C++ 實戰筆記
-
$210$200 -
$1,200$948 -
$699$552 -
$474$450 -
$680$537 -
$659$626 -
$714$678 -
$980$774 -
$654$621 -
$450$351 -
$414$393
相關主題
商品描述
本書介紹機器學習推理算法在嵌入式系統中的底層實現技術與優化。
給出不同層級的優化方法,包括面向機器學習推理模型結構的優化;面向運算圖中各個算子計算優化;
面向二進制比特運算優化以及面向CPU硬件特性的優化。
內容結合了理論和實踐,
其中底層算法的優化方法涉及其背後的信號處理理論介紹,但同時通過應用例子和大量代碼說明其軟件實現方法。
所討論的內容能夠幫助讀者在嵌入式平台上實現機器學習算法,
另外也為進一步實現通用的嵌入式環境下機器學習算法自動優化和部署工具的開發提供基本知識。
本書內容面向電子信息及計算機專業本科教學,
也可供相關領域工程技術人員參考。
作者簡介
應忍冬
上海交通大學電子信恩與電氣工程學院副教授,碩士生導師。
研究領域包括嵌入式系統、數字信號處理及VLSI實現架構、
人工智能領域的機器思維原理和實現。
目錄大綱
目錄
前言
第1章 緒論
1.1 AI嵌入式系統的概念與特點
1.2 機器學習在嵌入式系統中的實現
1.3 本書內容概述
第2章 嵌入式軟件編程模式和優化
2.1 嵌入式軟件編程模式
2.1.1 基於週期調用的運行模式
2.1.2 基於中斷的前後台運行模式
2.1.3 基於事件隊列的運行模式
2.1.4 帶時間信息的事件隊列運行模式
2.1.5 計算圖運行模式
2.2 通用軟件優化方法
2.2.1 循環結構優化
2.2.2 時間空間平衡
2.2.3 運算精度和性能平衡
2.2.4 底層運算的快速實現算法
2.2.5 內存使用優化
2.3 小結
參考文獻
第3章 機器學習算法概述
3.1 高斯樸素貝葉斯分類器
3.1.1 原理概述
3.1.2 模型訓練和推理
3.2 感知器
3.2.1 原理概述
3.2.2 模型訓練和推理
3.3 SVM分類器
3.3.1 原理概述
3.3.2 模型訓練和推理
3.4 決策樹
3.4.1 原理概述
3.4.2 模型訓練和推理
3.4.3 決策樹分類器的代碼實現
3.5 線性數據降維
3.5.1 原理概述
3.5.2 模型訓練和推理
3.6 神經網絡
3.6.1 原理概述
3.6.2 模型訓練和推理
3.7 小結
參考文獻
第4章 數值的表示和運算
4.1 浮點數
4.1.1 單精度和雙精度浮點數
4.1.2 16位浮點數
4.2 定點數
4.2.1 定點數的二進製表示形式
4.2.2 定點數的運算
4.2.3 給定算法的定點化方法
4.3 仿射映射量化
4.3.1 量化數據表示
4.3.2 量化數據運算
4.3.3 基於量化數據的矩陣運算
4.4 常數整數乘法優化
4.4.1 基於正則有符號數的常數整數乘法優化
4.4.2 基於運算圖的常數整數乘法優化
4.4.3 多常數整數乘法優化
4.4.4 浮點數和整數常數乘法優化
4.4.5 常數整數乘法優化的應用
4.5 小結
參考文獻
第5章 卷積運算優化
5.1 卷積運算的定義
5.1.1 一維線性卷積
5.1.2 一維循環卷積
5.1.3 二維線性卷積
5.1.4 二維循環卷積
5.2 快速卷積算法
5.2.1 一維循環卷積頻域快速算法
5.2.2 短序列一維線性卷積快速算法
5.2.3 長序列一維線性卷積的構建
5.2.4 快速FIR濾波器算法
5.2.5 二維快速卷積算法
5.3 近似卷積算法
5.3.1 基於卷積核低秩分解的二維快速卷積
5.3.2 矩形卷積核近似卷積
5.3.3 分段線性卷積核近似
5.3.4 卷積核的分段近似
5.3.5 基於IIR濾波器的近似卷積
5.3.6 基於卷積核低秩近似的二維近似快速卷積
5.3.7 基於二維矩形卷積核的近似快速卷積
5.4 小結
參考文獻
第6章 矩陣乘法優化
6.1 機器學習算法中的矩陣乘法
6.2 Strassen矩陣相乘算法
6.3 Winograd矩陣相乘算法
6.4 低秩矩陣乘法
6.5 循環矩陣乘法
6.6 近似矩陣乘法
6.6.1 基於矩陣低秩近似的矩陣乘法
6.6.2 基於數據統計相關性的近似矩陣乘法
6.6.3 基於向量量化的近似矩陣乘法
6.7 小結
參考文獻
第7章 神經網絡的實現與優化
7.1 神經網絡基本運算及軟件實現
7.1.1 全連接層運算
7.1.2 卷積層運算
7.1.3 BN層運算
7.1.4 激活層運算
7.1.5 池化層運算
7.1.6 神經網絡示例
7.2 神經網絡的權重係數優化
7.2.1 權重係數二值化
7.2.2 權重係數的定點數量化
7.2.3 權重係數量化和神經網絡訓練結合
7.3 神經網絡結構優化
7.3.1 剪枝優化
7.3.2 卷積結構優化
7.3.3 知識蒸餾
7.4 小結
參考文獻
第8章 ARM平台上的機器學習編程
8.1 CMSIS軟件框架概述
8.2 CMSIS-DSP軟件框架和編程
8.2.1 矩陣運算
8.2.2 高斯樸素貝葉斯算法實現
8.2.3 SVM算法實現
8.2.4 數據降維
8.3 基於CMSIS-NN的神經網絡編程
8.3.1 基於卷積神經網絡的手寫數字識別算法
8.3.2 CMSIS-NN的捲積神經網絡實現
8.3.3 卷積神經網絡的定點化
8.3.4 數據存儲和格式轉換
8.4 ARM Compute Library軟件框架和編程
8.4.1 基於ACL庫的圖像處理編程
8.4.2 基於ACL庫的神經網絡編程
8.5 ARM NN軟件框架和編程
8.5.1 基於ARM NN運行神經網絡模型
8.5.2 基於ONNX格式的機器學習模型構建
8.6 ARM的SIMD指令編程
8.6.1 NEON編程的基本概念和數據寄存器
8.6.2 基於C語言的NEON編程
8.7 小結
附錄A 補充數據和列表
附錄B 技術術語表