電腦視覺與PyTorch項目實戰:基於深度學習框架的端到端產品級模型設計與開發
[印] 阿克謝·庫爾卡尼(Akshay Kulkarni)、阿達沙·希瓦南達(Adarsha Shivananda)、尼廷·奈傑·夏爾馬(Nitin Ranjan Sha
- 出版商: 清華大學
- 出版日期: 2024-04-01
- 定價: $594
- 售價: 7.9 折 $469 (限時優惠至 2025-03-31)
- 語言: 簡體中文
- 頁數: 221
- 裝訂: 平裝
- ISBN: 7302657424
- ISBN-13: 9787302657422
-
相關分類:
DeepLearning
立即出貨
買這商品的人也買了...
-
$980$833 -
$580$458 -
$458ASP.NET 項目開發全程實錄, 4/e
-
$474$450 -
$534$507 -
$806$758 -
$505AI 源碼解讀:捲積神經網絡(CNN)深度學習案例 (Python版)
-
$449R在語言科學研究中的應用
-
$474$450 -
$654$621 -
$680$537 -
$505R語言資料分析:基礎、演算法與實戰
-
$359$341 -
$354$336 -
$779$740 -
$469動手學自然語言處理
-
$419$398 -
$599$569 -
$588$559 -
$403電腦演算法基礎 第2版
-
$521推薦系統:算法、案例與大模型 (腰封定製版)
商品描述
《電腦視覺與PyTorch專案實戰:基於深度學習框架的端到端產品級模型設計與開發》使用PyTorch 框架來討論電腦視覺演算法及其應用。首先介紹電腦視覺基礎,主題涉及捲積神經網絡、ResNet、YOLO、資料增強和其他業界使用的常規技術。隨後簡要概述PyTorch 庫。接下來探討影像分類問題、物件偵測技術以及如何在訓練和運行推理的同時實現遷移學習。最後透過一個完整的建模過程來闡述深度學習架構PyTorch 是如何運用最佳化技巧和模型AI 可解釋性的。 《電腦視覺與PyTorch專案實戰:基於深度學習框架的端對端產品級模型設計與開發》適合具有一定基礎的中高級讀者閱讀和參考,可以幫助他們使用遷移學習和PyTorch 來建構產品級的電腦視覺模型。
作者簡介
尼廷·奈傑·夏爾馬(Nitin Ranjan Sharma),諾華制藥產品經理,主要帶領團隊使用多模型技術來開發產品。此外也為財富500強公司提供咨詢服務,運用機器學習和深度學習框架來幫助他們解決覆雜的業務問題。同時也是一名活躍的開源貢獻者。
目錄大綱
第1章 計算機視覺的基本構成
1.1 什麽是計算機視覺
1.1.1 應用
1.1.2 通道
1.1.3 捲積神經網絡
1.1.4 瞭解CNN架構類型
1.1.5 掌握深度學習模型
1.1.6 PyTorch簡介
1.2 小結
第2章 圖像分類
2.1 本章所涵蓋的主題
2.2 方法概述
2.3 創建圖像分類流程
2.3.1 第一個基本模型
2.3.2 數據
2.3.3 數據探索
2.3.4 數據加載器
2.3.5 定義模型
2.3.6 訓練過程
2.3.7 基本模型的第二種變體
2.3.8 基本模型的第三種變體
2.3.9 基本模型的第四種變體
2.7 小結
第3章 構建目標檢測模型
3.1 使用 Boosted Cascade進行目標檢測
3.2 R-CNN
3.2.1 區域候選網絡
3.2.2 快速區域捲積神經網絡
3.2.3 候選區域網絡的工作原理
3.2.4 錨框生成層
3.2.5 候選區域層
3.3 Mask R-CNN
3.4 YOLO
3.5 YOLO V2/V3
3.6 項目代碼片段
3.7 小結
第4章 構建圖像分割模型
4.1 圖像分割
4.2 PyTorch預訓練支持
4.2.1 語義分割
4.2.2 實例分割
4.3 模型優化
4.4 小結
第5章 基於圖的搜索和推薦系統
5.1 問題陳述
5.2 方法和方法論
5.3 實現
5.3.1 數據集
5.3.2 安裝和導入庫
5.3.3 導入和理解數據
5.3.4 特徵工程
5.3.5 計算相似度和排名
5.3.6 可視化推薦結果
5.3.7 從用戶處接收圖輸入並推薦相似產品
5.4 小結
第6章 姿態估計
6.1 自頂向下的方法
6.2 自底向上的方法
6.3 OpenPose
6.3.1 分支1
6.3.2 分支2
6.4 HRNet
6.5 Higher HRNet
6.6 PoseNet
6.6.1 PoseNet工作機制
6.6.2 PoseNet的優點和缺點
6.6.3 姿態估計的應用
6.6.4 在雜貨店視頻上進行的測試用例
6.7 實現
6.8 小結
第7章 圖像異常檢測
7.1 異常檢測
7.2 方法1:使用預訓練的分類模型
7.3 方法2:使用自編碼器
7.4 小結
第8章 圖像超分辨率
8.1 利用最近鄰概念放大圖像
8.2 理解雙線性插值
8.3 變分自編碼器
8.4 生成式對抗網絡
8.5 模型代碼
8.6 模型開發
8.7 運行應用程序
8.8 小結
第9章 視頻分析
9.1 問題陳述
9.2 方法
9.3 實現
9.3.1 數據
9.3.2 把視頻上傳到Google Colab
9.3.3 將視頻轉換為一系列圖像
9.3.4 圖像提取
9.3.5 數據預處理
9.3.6 確定雜貨店中的熱點
9.3.7 導入圖像
9.3.8 獲取人群計數
9.3.9 安保與監控
9.3.10 確定人口統計學特徵(年齡和性別)
9.4 小結
第10章 計算機視覺的可解釋AI
10.1 Grad-CAM
10.2 Grad-CAM
10.3 NBDT
10.4 Grad-CAM和Grad-CAM++的實現
10.4.1 在單個圖像上的Grad-CAM和Grad-CAM++實現
10.4.2 在單個圖像上的NBDT實現
10.5 小結