AI 嵌入式系統：算法優化與實現

Name: AI 嵌入式系統：算法優化與實現
Price: 564 TWD
Availability: InStock
Author: 應忍冬//劉佩林
ISBN: 7111693256

應忍冬//劉佩林

出版商: 機械工業
出版日期: 2021-11-01
售價: $594
貴賓價: 9.5 折 $564
語言: 簡體中文
頁數: 348
裝訂: 平裝
ISBN: 7111693256
ISBN-13: 9787111693253
相關分類: 嵌入式系統

立即出貨 (庫存 < 4)

買這商品的人也買了...

~~$719~~ $683

嵌入式 Linux 基礎教程, 2/e (Embedded Linux Primer: A Practical Real-World Approach, 2/e)
$403

深度學習 : 捲積神經網絡從入門到精通
~~$620~~ $484

精通嵌入式 Linux 程式設計 (暢銷回饋版)
~~$474~~ $450

基於 GPU 加速的計算機視覺編程：使用 OpenCV 和 CUDA 實時處理複雜圖像數據
~~$750~~ $675

深度學習 -- 硬體設計
~~$580~~ $493

Effective Python 中文版｜寫出良好 Python 程式的 90個具體做法, 2/e (Effective Python: 90 Specific Ways to Write Better Python, 2/e)
~~$680~~ $537

軟體架構原理｜工程方法 (Fundamentals of Software Architecture: A Comprehensive Guide to Patterns, Characteristics, and Best Practices)
$673

嵌入式 C語言自我修養 — 從芯片、編譯器到操作系統
~~$580~~ $458

大規模重構｜奪回源碼庫的控制權 (Refactoring at Scale: Regaining Control of Your Codebase)
~~$600~~ $540

生物特徵辨識系統設計
$607

Linux 嵌入式系統開發從小白到大牛
~~$340~~ $333

嵌入式 Linux 作業系統實務
$199

嵌入式深度學習：算法和硬件實現技術
~~$779~~ $740

二進制分析實戰
$509

C++ 實戰筆記
~~$210~~ $200

深度神經網絡 FPGA 設計與實現
~~$1,200~~ $948

打下最紮實 AI 基礎不依賴套件：手刻機器學習神經網路穩健前進
~~$699~~ $594

Raspberry Pi 樹莓派：Python x AI 超應用聖經
~~$680~~ $537

強健的 Python｜撰寫潔淨且可維護的程式碼 (Robust Python: Write Clean and Maintainable Code)
~~$659~~ $626

計算機系統開發與優化實戰
~~$714~~ $678

AI 編譯器開發指南
~~$980~~ $718

最佳能效晶片平台 - ARM64 架構師高度之程式開發
$556

Linux 系統編程
~~$450~~ $338

精通嵌入式 Linux 程式設計, 3/e (下)
~~$414~~ $393

軟件優化技術

商品描述

本書介紹機器學習推理算法在嵌入式系統中的底層實現技術與優化。
給出不同層級的優化方法，包括面向機器學習推理模型結構的優化；面向運算圖中各個算子計算優化；
面向二進制比特運算優化以及面向CPU硬件特性的優化。
內容結合了理論和實踐，
其中底層算法的優化方法涉及其背後的信號處理理論介紹，但同時通過應用例子和大量代碼說明其軟件實現方法。
所討論的內容能夠幫助讀者在嵌入式平臺上實現機器學習算法，
另外也為進一步實現通用的嵌入式環境下機器學習算法自動優化和部署工具的開發提供基本知識。
本書內容面向電子信息及計算機專業本科教學，
也可供相關領域工程技術人員參考。

作者簡介

應忍冬

上海交通大學電子信恩與電氣工程學院副教授，碩士生導師。
研究領域包括嵌入式系統、數字信號處理及VLSI實現架構、
人工智能領域的機器思維原理和實現。

目錄大綱

目錄
前言
第1章緒論
1.1 AI嵌入式系統的概念與特點
1.2 機器學習在嵌入式系統中的實現
1.3 本書內容概述

第2章嵌入式軟件編程模式和優化
2.1 嵌入式軟件編程模式
2.1.1 基於週期調用的運行模式
2.1.2 基於中斷的前後台運行模式
2.1.3 基於事件隊列的運行模式
2.1.4 帶時間信息的事件隊列運行模式
2.1.5 計算圖運行模式
2.2 通用軟件優化方法
2.2.1 循環結構優化
2.2.2 時間空間平衡
2.2.3 運算精度和性能平衡
2.2.4 底層運算的快速實現算法
2.2.5 內存使用優化
2.3 小結
參考文獻

第3章機器學習算法概述
3.1 高斯樸素貝葉斯分類器
3.1.1 原理概述
3.1.2 模型訓練和推理
3.2 感知器
3.2.1 原理概述
3.2.2 模型訓練和推理
3.3 SVM分類器
3.3.1 原理概述
3.3.2 模型訓練和推理
3.4 決策樹
3.4.1 原理概述
3.4.2 模型訓練和推理
3.4.3 決策樹分類器的代碼實現
3.5 線性數據降維
3.5.1 原理概述
3.5.2 模型訓練和推理
3.6 神經網絡
3.6.1 原理概述
3.6.2 模型訓練和推理
3.7 小結
參考文獻

第4章數值的表示和運算
4.1 浮點數
4.1.1 單精度和雙精度浮點數
4.1.2 16位浮點數
4.2 定點數
4.2.1 定點數的二進製表示形式
4.2.2 定點數的運算
4.2.3 給定算法的定點化方法
4.3 仿射映射量化
4.3.1 量化數據表示
4.3.2 量化數據運算
4.3.3 基於量化數據的矩陣運算
4.4 常數整數乘法優化
4.4.1 基於正則有符號數的常數整數乘法優化
4.4.2 基於運算圖的常數整數乘法優化
4.4.3 多常數整數乘法優化
4.4.4 浮點數和整數常數乘法優化
4.4.5 常數整數乘法優化的應用
4.5 小結
參考文獻

第5章捲積運算優化
5.1 捲積運算的定義
5.1.1 一維線性捲積
5.1.2 一維循環捲積
5.1.3 二維線性捲積
5.1.4 二維循環捲積
5.2 快速捲積算法
5.2.1 一維循環捲積頻域快速算法
5.2.2 短序列一維線性捲積快速算法
5.2.3 長序列一維線性捲積的構建
5.2.4 快速FIR濾波器算法
5.2.5 二維快速捲積算法
5.3 近似捲積算法
5.3.1 基於捲積核低秩分解的二維快速捲積
5.3.2 矩形捲積核近似捲積
5.3.3 分段線性捲積核近似
5.3.4 捲積核的分段近似
5.3.5 基於IIR濾波器的近似捲積
5.3.6 基於捲積核低秩近似的二維近似快速捲積
5.3.7 基於二維矩形捲積核的近似快速捲積
5.4 小結
參考文獻

第6章矩陣乘法優化
6.1 機器學習算法中的矩陣乘法
6.2 Strassen矩陣相乘算法
6.3 Winograd矩陣相乘算法
6.4 低秩矩陣乘法
6.5 循環矩陣乘法
6.6 近似矩陣乘法
6.6.1 基於矩陣低秩近似的矩陣乘法
6.6.2 基於數據統計相關性的近似矩陣乘法
6.6.3 基於向量量化的近似矩陣乘法
6.7 小結
參考文獻

第7章神經網絡的實現與優化
7.1 神經網絡基本運算及軟件實現
7.1.1 全連接層運算
7.1.2 捲積層運算
7.1.3 BN層運算
7.1.4 激活層運算
7.1.5 池化層運算
7.1.6 神經網絡示例
7.2 神經網絡的權重係數優化
7.2.1 權重係數二值化
7.2.2 權重係數的定點數量化
7.2.3 權重係數量化和神經網絡訓練結合
7.3 神經網絡結構優化
7.3.1 剪枝優化
7.3.2 捲積結構優化
7.3.3 知識蒸餾
7.4 小結
參考文獻

第8章 ARM平臺上的機器學習編程
8.1 CMSIS軟件框架概述
8.2 CMSIS-DSP軟件框架和編程
8.2.1 矩陣運算
8.2.2 高斯樸素貝葉斯算法實現
8.2.3 SVM算法實現
8.2.4 數據降維
8.3 基於CMSIS-NN的神經網絡編程
8.3.1 基於捲積神經網絡的手寫數字識別算法
8.3.2 CMSIS-NN的捲積神經網絡實現
8.3.3 捲積神經網絡的定點化
8.3.4 數據存儲和格式轉換
8.4 ARM Compute Library軟件框架和編程
8.4.1 基於ACL庫的圖像處理編程
8.4.2 基於ACL庫的神經網絡編程
8.5 ARM NN軟件框架和編程
8.5.1 基於ARM NN運行神經網絡模型
8.5.2 基於ONNX格式的機器學習模型構建
8.6 ARM的SIMD指令編程
8.6.1 NEON編程的基本概念和數據寄存器
8.6.2 基於C語言的NEON編程
8.7 小結
附錄A 補充數據和列表
附錄B 技術術語表