基於深度學習的圖像處理與實踐
王卓、劉德民
- 出版商: 清華大學
- 出版日期: 2024-07-01
- 售價: $594
- 貴賓價: 9.5 折 $564
- 語言: 簡體中文
- ISBN: 7302664668
- ISBN-13: 9787302664666
-
相關分類:
DeepLearning
立即出貨
買這商品的人也買了...
-
$550$495 -
$1,000$790 -
$880$695 -
$720$569 -
$474$450 -
$658數據科學:基本概念、技術及應用
-
$719$683 -
$714$678 -
$250矩陣論及其應用
-
$359$341 -
$305大模型入門:技術原理與實戰應用
-
$414$393 -
$594$564 -
$594$564 -
$534$507 -
$774$735 -
$419$398 -
$774$735 -
$594$564 -
$509基於機器學習的個性化推薦算法及應用
-
$607多模態大模型:算法、應用與微調
-
$768$730 -
$474$450 -
$534$507 -
$419$398
相關主題
商品描述
目錄大綱
目錄
第1章 圖像識別技術基礎 1
1.1 圖像識別概述 2
1.1.1 什麽是圖像識別 2
1.1.2 圖像識別的發展階段 2
1.1.3 圖像識別的應用 3
1.2 圖像識別的過程 4
1.3 圖像識別技術 4
1.3.1 人工智能 5
1.3.2 機器學習 5
1.3.3 深度學習 6
1.3.4 基於神經網絡的圖像識別 6
1.3.5 基於非線性降維的圖像識別 7
第2章 scikit-image數字圖像處理 9
2.1 scikit-image基礎 10
2.1.1 安裝scikit-image 10
2.1.2 scikit-image中的模塊 10
2.2 顯示圖像 11
2.2.1 使用skimage讀入並顯示外部圖像 11
2.2.2 讀取並顯示外部灰度圖像 12
2.2.3 讀取並顯示內置星空圖片 13
2.2.4 讀取並保存內置星空圖片 14
2.3 常見的圖像操作 14
2.3.1 對內置圖片進行二值化操作 15
2.3.2 對內置圖片進行裁剪處理 16
2.3.3 將RGB圖轉換為灰度圖 17
2.3.4 使用skimage實現繪制圖片功能 18
2.3.5 使用subplot()函數繪制多視圖窗口 19
2.3.6 改變指定圖片的大小 21
2.3.7 使用函數rescale()縮放圖片 22
2.3.8 使用函數rotate()旋轉圖片 22
第3章 OpenCV圖像視覺處理 25
3.1 OpenCV基礎 26
3.1.1 OpenCV和OpenCV-Python介紹 26
3.1.2 安裝OpenCV-Python 26
3.2 OpenCV-Python圖像操作 27
3.2.1 讀取並顯示圖像 27
3.2.2 保存圖像 29
3.2.3 在Matplotlib中顯示圖像 30
3.2.4 繪圖 31
3.2.5 將鼠標作為畫筆 34
3.2.6 調色板程序 36
3.2.7 基本的屬性操作 37
3.3 OpenCV-Python視頻操作 40
3.3.1 讀取視頻 40
3.3.2 播放視頻 41
3.3.3 保存視頻 42
3.3.4 改變顏色空間 43
3.3.5 視頻的背景分離 45
第4章 dlib機器學習和圖像處理 49
4.1 dlib介紹 50
4.2 dlib基本的人臉檢測 50
4.2.1 人臉檢測 50
4.2.2 使用命令行進行人臉識別 52
4.2.3 檢測人臉關鍵點 54
4.2.4 基於CNN的人臉檢測器 56
4.2.5 在攝像頭中識別人臉 58
4.2.6 人臉識別驗證 59
4.2.7 全局優化 60
4.2.8 人臉聚類 62
4.2.9 抖動採樣和增強 64
4.2.10 人臉和姿勢採集 65
4.2.11 物體追蹤 66
4.3 SVM分類算法 67
4.3.1 二進制SVM分類器 68
4.3.2 Ranking SVM算法 69
4.3.3 Struct SVM多分類器 72
4.4 自訓練模型 75
4.4.1 訓練自己的模型 75
4.4.2 自製對象檢測器 78
第5章 face_recognition人臉識別 83
5.1 安裝face_recognition 84
5.2 實現基本的人臉檢測 84
5.2.1 輸出顯示指定人像人臉特徵 84
5.2.2 在指定照片中識別標記出人臉 86
5.2.3 識別出照片中的所有人臉 88
5.2.4 判斷照片中是否包含某個人 91
5.2.5 識別出照片中的人是誰 92
5.2.6 攝像頭實時識別 93
5.3 深入face_recognition人臉檢測 98
5.3.1 檢測用戶眼睛的狀態 99
5.3.2 模糊處理人臉 101
5.3.3 檢測兩個人臉是否匹配 102
5.3.4 識別視頻中的人臉 103
5.3.5 網頁版人臉識別器 106
第6章 採樣、變換和捲積處理 109
6.1 採樣 110
6.1.1 最近鄰插值採樣 110
6.1.2 雙線性插值 112
6.1.3 雙立方插值 116
6.1.4 Lanczos插值 118
6.2 離散傅里葉變換 119
6.2.1 為什麽使用DFT 119
6.2.2 用庫NumPy實現DFT 120
6.2.3 用庫SciPy實現DFT 121
6.2.4 用快速傅里葉變換算法計算DFT 122
6.3 捲積 124
6.3.1 為什麽需要捲積圖像 124
6.3.2 使用庫SciPy中的函數
convolve2d()進行捲積 124
6.3.3 使用庫SciPy中的函數ndimage.convolve()進行捲積 126
6.4 頻域濾波 128
6.4.1 什麽是濾波器 128
6.4.2 高通濾波器 128
6.4.3 低通濾波器 130
6.4.4 DoG 帶通濾波器 130
6.4.5 帶阻濾波器 132
第7章 圖像增強 135
7.1 對比度增強 136
7.1.1 直方圖均衡化 136
7.1.2 自適應直方圖均衡化 138
7.1.3 對比度拉伸 140
7.1.4 非線性對比度增強 142
7.2 銳化 144
7.2.1 銳化濾波 145
7.2.2 高頻強調濾波 148
7.2.3 基於梯度的銳化 152
7.3 減少噪聲 156
7.3.1 均值濾波器 156
7.3.2 中值濾波器 158
7.3.3 高斯濾波器 158
7.3.4 雙邊濾波器 159
7.3.5 小波降噪 160
7.4 色彩平衡 161
7.4.1 白平衡 161
7.4.2 顏色校正 163
7.4.3 調整色調和飽和度 164
7.5 超分辨率 165
7.6 去除運動模糊 167
7.6.1 邊緣 167
7.6.2 逆濾波 169
7.6.3 統計方法 170
7.6.4 盲去捲積 171
第8章 圖像特徵提取 173
8.1 圖像特徵提取方法 174
8.2 顏色特徵 174
8.2.1 顏色直方圖 174
8.2.2 其他顏色特徵提取方法 176
8.3 紋理特徵 178
8.3.1 灰度共生矩陣 178
8.3.2 方向梯度直方圖 180
8.3.3 尺度不變特徵變換 181
8.3.4 小波變換 182
8.4 形狀特徵 184
8.4.1 邊界描述子 184
8.4.2 預處理後的輪廓特徵 188
8.4.3 模型擬合方法 190
8.4.4 形狀上的變換 193
8.5 基於LoG、DoG和DoH的斑點檢測器 196
8.5.1 LoG濾波器 197
8.5.2 DoG濾波器 198
8.5.3 DoH算法 200
第9章 圖像分割 203
9.1 圖像分割的重要性 204
9.2 基於閾值的分割 204
9.2.1 灰度閾值分割 205
9.2.2 彩色閾值分割 206
9.3 基於邊緣的分割 207
9.3.1 Canny邊緣檢測 207
9.3.2 邊緣連接方法 208
9.4 基於區域的分割 209
9.4.1 區域生長算法 209
9.4.2 圖割算法 212
9.4.3 基於聚類的分割算法 213
9.5 基於圖論的分割 215
9.5.1 圖割算法 215
9.5.2 最小生成樹算法 215
9.6 基於深度學習的分割 217
9.6.1 FCN 217
9.6.2 U-Net 219
9.6.3 DeepLab 220
9.6.4 Mask R-CNN 220
第10章 目標檢測 223
10.1 目標檢測概述 224
10.1.1 目標檢測的步驟 224
10.1.2 目標檢測的方法 224
10.2 YOLO v5 225
10.2.1 YOLO v5的改進 225
10.2.2 基於YOLO v5的訓練、驗證和預測 226
10.3 語義分割 242
10.3.1 什麽是語義分割 242
10.3.2 DeepLab語義分割 244
10.4 SSD目標檢測 245
10.4.1 攝像頭目標檢測 246
10.4.2 基於圖像的目標檢測 247
第11章 圖像分類 249
11.1 圖像分類介紹 250
11.2 基於特徵提取和機器學習的圖像分類 250
11.2.1 圖像分類的基本流程 250
11.2.2 基於scikit-learn機器學習的圖像分類 251
11.2.3 分類算法 254
11.2.4 聚類算法 257
11.3 基於捲積神經網絡的圖像分類 259
11.3.1 捲積神經網絡的基本結構 259
11.3.2 第一個捲積神經網絡程序 262
11.3.3 使用捲積神經網絡進行圖像分類 267
11.4 基於遷移學習的圖像分類 279
11.4.1 遷移學習介紹 279
11.4.2 基於遷移學習的圖片分類器 280
11.5 基於循環神經網絡的圖像分類 284
11.5.1 循環神經網絡介紹 284
11.5.2 實戰演練 285
11.6 基於捲積循環神經網絡的圖像分類 286
11.6.1 捲積循環神經網絡介紹 286
11.6.2 CRNN圖像識別器 287
第12章 國內常用的第三方人臉識別平臺 291
12.1 百度AI開放平臺 292
12.1.1 百度AI開放平臺介紹 292
12.1.2 使用百度AI之前的準備工作 292
12.1.3 基於百度AI平臺的人臉識別 296
12.2 科大訊飛AI開放平臺 301
12.2.1 科大訊飛AI開放平臺介紹 301
12.2.2 申請試用 301
12.2.3 基於科大訊飛AI的人臉識別 302
第13章 鬥轉星移換圖系統 311
13.1 背景介紹 312
13.1.1 CycleGAN的作用 312
13.1.2 CycleGAN的原理 312
13.2 系統模塊架構 313
13.3 設置數據集 313
13.4 訓練數據 315
13.4.1 加載圖像 315
13.4.2 輔助功能 316
13.4.3 生成對抗網絡模型 319
13.4.4 訓練CycleGAN模型 322
13.5 圖像轉換 326
13.6 調試運行 328
第14章 智能OCR文本檢測識別系統 333
14.1 OCR系統介紹 334
14.1.1 OCR的基本原理和方式 334
14.1.2 深度學習對OCR的影響 335
14.1.3 與OCR相關的深度學習技術 335
14.2 OCR項目介紹 336
14.3 準備模型 337
14.3.1 文本檢測模型 337
14.3.2 文本識別模型 337
14.4 創建工程 337
14.4.1 工程配置 338
14.4.2 配置應用程序 338
14.4.3 導入模型 338
14.5 具體實現 339
14.5.1 頁面佈局 339
14.5.2 實現主Activity 339
14.5.3 圖像操作 343
14.5.4 運行OCR模型 347
14.6 調試運行 354