PyTorch深度學習項目教程
宋桂嶺 劉軍偉 李克新
- 出版商: 機械工業
- 出版日期: 2024-10-23
- 定價: $354
- 售價: 8.5 折 $301
- 語言: 簡體中文
- 頁數: 354
- ISBN: 7111764331
- ISBN-13: 9787111764335
-
相關分類:
DeepLearning
下單後立即進貨 (約4週~6週)
相關主題
商品描述
《PyTorch深度學習項目教程》根據初學者的學習曲線和職業生涯成長規律,由淺入深設計了5個基礎項目和3個綜合項目。 基礎項目包括手寫數字識別、二維曲線擬合、貓狗圖像分類、提升貓狗圖像分類的準確率和文本翻譯,引導讀者使用PyTorch構建神經網絡算法框架,深入探討了深度學習數據集構建、神經網絡模型原理及實現、算法訓練與評價等內容;綜合項目包括食品加工人員異常行為檢測、工業檢測圖像分割和內容智能生成,介紹了深度學習的新技術,實現了目標檢測、圖像分割、超分辨率重建、智能問答、文生圖、圖生圖等應用。 《PyTorch深度學習項目教程》可作為高等職業院校人工智能技術專業相關課程的教材,也可作為工程人員的入門書籍。
作者簡介
宋桂嶺,博士,研究方向為計算機圖形學、視覺機器人和深度學習,畢業於北京郵電大學。現為無錫科技職業學院物聯網與人工智能學院教師,原北京郵電大學移動機器人與智能技術實驗室成員,北京郵電大學無錫研究院副院長,無錫北郵感知技術產業研究院有限公司副總經理兼總工程師,擁有二十年一線軟硬件產品研發經驗。2008年度江蘇省信息產業廳先進工作者,參與國家級項目5項(前三),主持省級科技項目1項,教研項目1項,市級科技項目4項。擁有軟件著作權22項,發明專利5項,發表SCI、EI、中文核心等論文12篇。研發成果包括工業CT算法庫平台(日聯科技)、計算攝影相關國際標準(傳音股份)、移動機器人智能平台(博士畢業課題、173課題)、智能交通集成管控平台(中國智能交通集團)、北郵異地協同辦公平台、長春市智慧信訪系統(三維通信集團)、上海食品安全異常行為抓拍系統(上海澳潤)、“智慧眼”系列智能安防系統、感知工地系統、違章停車全自動抓拍系統,以及博物館AR虛擬漫遊系統等。
目錄大綱
前言
項目1 手寫數字識別項目背景
任務1.1 初識深度學習
任務1.2 配置PyTorch開發環境
1.2.1 PyTorch概述及硬件要求
1.2.2 Anaconda的下載及安裝
1.2.3 CUDA工具包的下載及安裝
1.2.4 PyTorch的安裝及配置
1.2.5 PyCharm的下載及安裝
任務1.3 快速完成手寫數字識別功能
1.3.1 MNIST手寫數字識別數據庫概述
1.3.2 手寫數字識別實現
1.3.3 手寫數字識別測試
習題
項目2 二維曲線擬合項目背景
任務2.1 理解曲線擬合需求
任務2.2 掌握PyTorch的基本語法
2.2.1 Tensor的創建
2.2.2 Tensor索引操作
2.2.3 Tensor形狀變換
2.2.4 PyTorch的數學運算
2.2.5 廣播機制
2.2.6 Tensor和NumPy的轉換
2.2.7 在GPU上操作
任務2.3 搭建二維曲線數據集
任務2.4 搭建網絡結構
2.4.1 神經網絡概述
2.4.2 激活函數
2.4.3 多層感知機
任務2.5 訓練神經網絡模型
2.5.1 正向傳播
2.5.2 損失函數
2.5.3 訓練叠代與反向傳播
2.5.4 訓練叠代過程
任務2.6 網絡推理
任務2.7 模型結構分析
任務2.8 擬合更多的二維曲線
習題
項目3 貓狗圖像分類項目背景
任務3.1 準備貓狗數據集
3.1.1 創建貓狗分類數據集
3.1.2 數據集的讀取與預處理
任務3.2 設計圖像分類全連接網絡
任務3.3 訓練圖像分類網絡
3.3.1 訓練日志記錄
3.3.2 訓練初始化
3.3.3 配置數據集
3.3.4 加載網絡模型
3.3.5 配置訓練策略
3.3.6 叠代訓練
任務3.4 應用分類網絡推理更多圖片
任務3.5 認識深度學習的主要任務:回歸與分類
3.5.1 線性回歸
3.5.2 二分類與邏輯回歸
3.5.3 多分類問題處理
習題
項目4 提升貓狗圖像分類的準確率項目背景
任務4.1 多層感知機問題分析
任務4.2 卷積神經網絡的引入
4.2.1 卷積的概念
4.2.2 添加步長
4.2.3 填充邊緣
4.2.4 卷積神經網絡結構
任務4.3 卷積網絡結構編程實現
任務4.4 網絡訓練及結果評估
任務4.5 認識更多網絡結構
4.5.1 AlexNet網絡模型
4.5.2 VGGNet網絡模型
4.5.3 ResNet網絡模型
4.5.4 MobileNet網絡模型
習題
項目5 文本翻譯項目背景
任務5.1 認知自然語言處理及相關技術
5.1.1 自然語言處理的概念
5.1.2 圖靈測試
5.1.3 自然語言處理技術的發展
任務5.2 構建中英文翻譯數據集
任務5.3 搭建Transformer神經網絡
5.3.1 輸入序列向量化
5.3.2 位置編碼
5.3.3 編碼器、解碼器和輸出序列化
任務5.4 訓練Transformer網絡
任務5.5 完成文本翻譯推理
任務5.6 理解Transformer網絡模型
5.6.1 Transformer模型結構
5.6.2 Transformer的輸入和輸出
5.6.3 Transformer的推理過程
5.6.4 Transformer的訓練過程
5.6.5 nn.Transformer的構造參數
5.6.6 nn.Transformer的forward參數
習題
項目6 食品加工人員異常行為檢測項目背景
任務6.1 理解目標檢測需求
任務6.2 數據采集及標注
6.2.1 數據采集
6.2.2 數據標注
6.2.3 數據集構建
任務6.3 訓練YOLO模型
6.3.1YOLO 工具包的安裝
6.3.2 配置文件修改
6.3.3 訓練模型
任務6.4 采用YOLO進行異常行為推理
任務6.5 掌握目標檢測流程
習題
項目7 工業檢測圖像分割項目背景
任務7.1 了解圖像分割需求
任務7.2 數據集構建
7.2.1 數據標注
7.2.2 數據格式轉換及數據集劃分
任務7.3 圖像分割網絡訓練
7.3.1 UNet網絡概述
7.3.2 UNet網絡的建立
7.3.3 創建Dataset類
7.3.4 進行網絡訓練
任務7.4 網絡推理及結果評價
習題
項目8 內容智能生成項目背景
任務8.1 了解人工智能內容生成相關概念
任務8.2 實現圖像超分辨率重建
8.2.1 圖像超分辨率技術
8.2.2 生成對抗網絡技術
8.2.3 Real-ESRGAN應用
任務8.3 實現自動問答
8.3.1 ChatGPT技術概述
8.3.2 類ChatGPT本地化應用
8.3.3 問答提詞器的設計技巧
任務8.4 實現AI繪畫
8.4.1 擴散模型技術概述
8.4.2 Stable Diffusion UI安裝
8.4.3 AI繪圖實現
習題
參考文獻