電腦視覺基礎

魯鵬、朱新山

  • 出版商: 清華大學
  • 出版日期: 2025-03-01
  • 定價: $299
  • 售價: 8.5$254
  • 語言: 簡體中文
  • ISBN: 7302684316
  • ISBN-13: 9787302684312
  • 相關分類: Computer Vision
  • 下單後立即進貨 (約4週~6週)

  • 電腦視覺基礎-preview-1
  • 電腦視覺基礎-preview-2
  • 電腦視覺基礎-preview-3
電腦視覺基礎-preview-1

商品描述

"本書圍繞電腦視覺的五大核心任務: 圖像分類、圖像分割、目標檢測、目標跟蹤、三維場景重建,將內容劃分為三部分: 基礎篇、識別篇與重建篇。其中,基礎篇(第1~5章)講述電腦視覺任務的共性知識與算法,涵蓋線性濾波器、圖像邊緣提取、紋理表示、角點特徵提取、尺度不變特徵;識別篇(第6~9章)關註機器如何理解圖像內容,重點介紹圖像分類、目標檢測、圖像分割、目標跟蹤四個視覺識別任務的難點、解決思路及對應的識別算法與模型;重建篇(第10~15章)聚焦如何從圖像中進行三維場景的結構重建,內容涵蓋攝像機幾何、攝像機標定、單視圖幾何、三角化與極幾何、雙目立體視覺、運動恢復結構等基本概念與算法。 本書適合作為高等院校人工智能、智能科學與技術專業高年級本科生、研究生的教材,也可供對電腦視覺比較熟悉的開發人員、廣大科技工作者和研究人員參考。"

目錄大綱

目錄

第1章線性濾波器1

1.1捲積1

1.1.1數字圖像基礎1

1.1.2捲積的定義2

1.1.3捲積的性質4

1.1.4捲積的用例4

1.2圖像去噪6

1.2.1噪聲分析6

1.2.2中值濾波7

1.2.3高斯捲積核8

小結13

習題13

第2章圖像邊緣提取14

2.1圖像邊緣與圖像求導14

2.1.1圖像邊緣的含義14

2.1.2邊緣位置的特點15

2.1.3圖像導數與梯度15

2.1.4高斯一階偏導核17

2.2Canny邊緣檢測算法19

2.3擬合21

2.3.1最小二乘法22

2.3.2RANSAC算法25

2.3.3Hough變換28

小結32

習題32

第3章紋理表示34

3.1圖像紋理的概念34

3.1.1理解圖像紋理34

3.1.2圖像紋理的作用36

3.2圖像紋理的表示37

3.2.1紋理的表示方法37

3.2.2構建捲積核組37

3.2.3紋理統計分析38

3.3LeungMalik捲積核組39

3.3.1LeungMalik捲積核組的組成39

3.3.2LeungMalik捲積核組的構建40

小結42

習題42

第4章角點特徵提取43

4.1局部特徵43

4.1.1圖像拼接問題43

4.1.2局部特徵概念44

4.2角點檢測46

4.2.1角點特性分析46

4.2.2Harris角點檢測器46

4.2.3Harris角點檢測效果51

小結52

習題52

第5章尺度不變特徵54

5.1尺度不變理論基礎54

5.1.1尺度不變思路54

5.1.2高斯拉普拉斯算子56

5.1.3HarrisLaplace檢測器60

5.2SIFT60

5.2.1高斯差分尺度空間60

5.2.2SIFT特徵點檢測63

5.2.3SIFT特徵描述子64

5.3ORB特徵66

5.3.1Oriented FAST66

5.3.2BRIEF特徵描述子67

5.3.3ORB特徵68

小結68

習題69

第6章圖像分類70

6.1圖像分類任務概述70

6.2數據驅動的圖像分類範式74

6.2.1機器學習的分類74

6.2.2機器學習三要素75

6.2.3模型評估與選擇77

6.2.4過擬合、欠擬合與模型正則化78

6.2.5基於有監督學習的圖像分類範式79

6.2.6圖像分類模型的精度評價80

6.3基於詞袋模型的圖像表示81

6.3.1基於詞袋模型的文本表示81

6.3.2TFIDF加權82

6.3.3詞袋模型在圖像表示中的應用83

6.4基於線性多類支持向量機的圖像分類85

6.4.1線性分類模型85

6.4.2學習策略與多類支持向量機損失86

6.4.3梯度下降算法87

小結88

習題88

第7章目標檢測90

7.1目標檢測概述90

7.1.1任務難點90

7.1.2評價指標91

7.1.3滑動窗口法91

7.2基於AdaBoost的人臉檢測93

7.2.1AdaBoost算法94

7.2.2類Haar特徵95

7.2.3基於級聯結構的人臉檢測模型97

7.3基於HOG特徵的行人檢測99

7.3.1HOG特徵100

7.3.2利用HOG特徵實現行人檢測100

小結102

習題102

第8章圖像分割103

8.1圖像分割概述103

8.2人類視覺分組與格式塔規則104

8.3基於像素聚類的圖像分割105

8.3.1基於Kmeans的圖像分割105

8.3.2基於均值漂移的圖像分割107

8.4基於圖的圖像分割111

8.4.1基於特徵向量的圖像分割算法111

8.4.2基於歸一化割的圖像分割算法112

小結114

習題114

第9章目標跟蹤116

9.1基於光流的運動跟蹤116

9.1.1光流計算基本等式117

9.1.2LucasKanade光流算法118

9.2卡爾曼濾波121

9.2.1貝葉斯濾波器121

9.2.2動態模型122

9.2.3卡爾曼濾波122

9.3粒子濾波124

9.3.1非線性模型125

9.3.2重要性採樣125

9.3.3SIS粒子濾波器126

9.3.4重採樣127

9.3.5SIR粒子濾波器128

小結128

習題129

第10章攝像機幾何130

10.1針孔模型與透鏡130

10.1.1針孔攝像機130

10.1.2透鏡成像133

10.2一般攝像機模型137

10.2.1齊次坐標137

10.2.2坐標系變換和剛體變換139

10.2.3一般攝像機的幾何模型143

10.2.4透視投影矩陣的性質146

10.3其他攝像機模型147

10.3.1規範化攝像機模型147

10.3.2弱透視投影攝像機147

10.3.3正交投影攝像機148

小結149

習題149

第11章攝像機標定150

11.1針孔模型與攝像機標定問題150

11.1.1最小二乘參數估計150

11.1.2投影矩陣求解155

11.1.3攝像機內外參數求解156

11.1.4退化情況159

11.2徑向畸變的攝像機標定160

11.2.1徑向畸變模型160

11.2.2徑向畸變標定161

小結163

習題163

第12章單視圖幾何165

12.1射影幾何基礎165

12.1.1直線的齊次坐標165

12.1.2平面上的無窮遠點與無窮遠線166

12.1.3平面上的變換167

12.1.4平面上的無窮遠點與無窮遠線的變換169

12.2單視圖重構170

12.2.1消影點與消影線170

12.2.2單視重構172

小結173

習題174

第13章三角化與極幾何175

13.1三維重建的基礎175

13.1.1三角化的概念175

13.1.2三角化的線性解法176

13.1.3三角化的非線性解法177

13.2極幾何與基礎矩陣178

13.2.1極幾何178

13.2.2本質矩陣與基礎矩陣179

13.3基礎矩陣估計181

13.3.1八點法181

13.3.2歸一化八點法183

13.4單應矩陣184

13.4.1單應矩陣概念184

13.4.2單應矩陣估計185

小結186

習題186

第14章雙目立體視覺188

14.1基於平行視圖的雙目立體視覺188

14.1.1平行視圖的基礎矩陣與極幾何188

14.1.2平行視圖的三角測量與視差190

14.2圖像校正191

14.3對應點搜索194

14.3.1相關匹配算法194

14.3.2相關法存在的問題196

小結198

習題198

第15章運動恢復結構200

15.1問題概述200

15.2歐氏運動恢復結構201

15.2.1兩視圖的歐氏運動恢復結構201

15.2.2基於捆綁調整的歐氏運動恢復結構204

15.3基於增量法的歐氏運動恢復結構系統設計205

15.3.1PnP問題與P3P方法205

15.3.2增量式SfM系統208

小結210

習題211

參考文獻212