深度學習與目標檢測
杜鵬,諶明,蘇統華
- 出版商: 電子工業
- 出版日期: 2020-03-01
- 定價: $534
- 售價: 8.5 折 $454
- 語言: 簡體中文
- ISBN: 7121367858
- ISBN-13: 9787121367854
-
相關分類:
DeepLearning
-
其他版本:
深度學習與目標檢測, 2/e
買這商品的人也買了...
-
$474$450 -
$1,000$790 -
$650$514 -
$352昇騰AI處理器架構與編程 — 深入理解 CANN 技術原理及應用
-
$780$616 -
$556電腦視覺與深度學習實戰:以 MATLAB、Python 為工具
-
$1,200$948 -
$1,000$850 -
$556程序員的AI書:從代碼開始
-
$505深度強化學習:學術前沿與實戰應用
-
$500$390 -
$454深度學習圖像識別技術:基於 TensorFlow Object Detection API 和 OpenVINO™ 工具套件
-
$594$564 -
$505人臉識別與美顏算法實戰:基於 Python、機器學習與深度學習
-
$505知識圖譜與深度學習
-
$230TensorFlow 強化學習快速入門指南使用 Python 動手搭建自學習的智能體 (Tensorflow Reinforcement Learning Quick Start Guide)
-
$500$390 -
$750$638 -
$620$484 -
$470計算機視覺中的深度學習
-
$715深度學習實戰:基於 TensorFlow 2 和 Keras, 2/e (Deep Learning with TensorFlow 2 and Keras, 2/e)
-
$658Python 深度學習:模型、方法與實現
-
$2,170$2,062 -
$534$507 -
$1,200$792
相關主題
商品描述
本書的寫作初衷是,從學者的角度,用一種通俗易懂的方式,把與基於深度學習的目標檢測的相關論文中的理論和方法呈現給讀者,同時針對作者在深度學習教學過程中遇到的難點,進行深入的分析和講解。本書側重對捲積神經網絡的介紹,而深度學習的內容不止於此。所以,作者將深度學習分為有監督學習、無監督學習和強化學習三類,將圖像分類、目標檢測、語音識別、人臉識別、對抗生成網絡和AlphaGo圍棋等應用場景歸入不同的類別,並分別對其原理進行了概括性的講解。本書適合有一定深度學習或目標檢測學習基礎的學生、研究者、從業者閱讀。
作者簡介
杜鵬,博士,現任職於華為。2014年起在韓國科學技術學院和新加坡南洋理工大學從事博士後研究。回國後,曾任杭州電子科技大學副教授、浙江核新同花順網絡信息股份有限公司算法研究員。2018年被NVIDIA深度學習學院評為優秀校園大使,在SIGGRAPH、PG等國際著名學術會議發表論文10餘篇。
諶明,博士。2004年加入美國道富集團,2011年加入浙江核新同花順網絡信息股份有限公司並任首席技術官,推動了包括計算機視覺、語音技術、自然語言處理、機器學習等技術在金融、醫療等領域的商業化落地。
蘇統華,博士,哈爾濱工業大學副教授,自然手寫中文文本識別的開拓者。曾出版手寫漢字識別領域的首本英文專著,以及7本GPU計算和大數據分析方面的譯作,所領導的NVIDIA GPU教育中心連續4年被NVIDIA評為中國區優秀GPU教育中心。
目錄大綱
基礎篇
第1章深度學習概述2
1.1深度學習發展簡史2
1.2有監督學習4
1.2.1圖像分類4
1.2.2目標檢測6
1.2.3人臉識別10
1.2.4語音識別13
1.3無監督學習18
1.3.1無監督學習概述18
1.3.2生成對抗網絡18
1.4強化學習21
1.4.1 AlphaGo 21
1.4.2 AlphaGo Zero 23
1.5小結25
參考文獻25
第2章深度神經網絡27
2.1神經元27
2.2感知機30
2.3前向傳遞32
2.3.1前向傳遞的流程32
2.3.2激活函數33
2.3.3損失函數37
2.4後向傳遞40
2.4.1後向傳遞的流程40
2.4.2梯度下降40
2.4.3參數修正42
2.5防止過擬合44
2.5.1 dropout 44
2.5.2正則化45
2.6小結46
第3章卷積神經網絡47
3.1卷積層48
3.1.1 valid卷積48
3.1.2 full卷積50
3.1.3 same卷積51
3.2池化層52
3.3反捲積53
3.4感受野55
3.5卷積網絡實例56
3.5.1 Lenet-5 56
3.5.2 AlexNet 59
3.5. 3 VGGNet 62
3.5.4 GoogLeNet 64
3.5.5 ResNet 72
3.5.6 MobileNet 73
3.6小結76
進階篇
第4章兩階段目標檢測方法78
4.1 R-CNN 78
4.1.1算法流程79
4.1.2訓練過程80
4.2 SPP-Net 83
4.2.1網絡結構84
4.2.2空間金字塔池化84
4.3 Fast R-CNN 86
4.3.1感興趣區域池化層86
4.3.2網絡結構88
4.3.3全連接層計算加速89
4.3.4目標分類90
4.3.5邊界框回歸91
4.3.6訓練過程93
4.4 Faster R-CNN 96
4.4.1網絡結構97
4.4. 2 RPN 98
4.4.3訓練過程104
4.5 R-FCN 106
4.5.1 R-FCN網絡結構107
4.5.2位置敏感的分數圖108
4.5.3位置敏感的RoI池化109
4.5.4 R-FCN損失函數110
4.5.5 Caffe網絡模型解析111
4.6 Mask R-CNN 115
4.6.1實例分割簡介115
4.6.2 COCO數據集的像素級標註116
4.6.3網絡結構117
4.6.4 U-Net 121
4.6.5 SegNet 122
4.7小結123
第5章單階段目標檢測方法124
5.1 SSD 124
5.1.1 default box 125
5.1.2網絡結構125
5.1.3 Caffe網絡模型解析126
5.1.4訓練過程134
5.2 RetinaNet 136
5.2.1 FPN 136
5.2 .2聚焦損失函數138
5.3 RefineDet 139
5.3.1網絡模型140
5.3.2 Caffe網絡模型解析142
5.3.3訓練過程151
5.4 YOLO 152
5.4.1 YOLO v1 152
5.4.2 YOLO v2 155
5.4.3 YOLO v3 157
5.5目標檢測算法應用159
5.5.1高速公路坑洞檢測159
5.5.2息肉檢測160
5.6小結162
應用篇
第6章肋骨骨折檢測164
6.1國內外研究現狀165
6.2解決方案166
6.3預處理166
6.4肋骨骨折檢測167
6.5實驗結果分析168
6.6小結170
參考文獻171
第7章肺結節檢測172
7.1國內外研究現狀172
7.1.1肺結節可疑位置推薦算法173
7.1.2假陽性肺結節抑制算法173
7.2總體框架174
7.2.1肺結節數據集174
7.2.2肺結節檢測難點175
7.2.3算法框架175
7.3肺結節可疑位置推薦算法176
7.3.1 CT圖像的預處理177
7.3.2肺結節分割算法178
7.3.3優化方法180
7.3.4推斷方法182
7.4可疑肺結節定位算法183
7.5實驗結果與分析184
7.5.1實驗結果184
7.5.2改進點效果分析184
7.6假陽性肺結節抑制算法186
7.6.1假陽性肺結節抑製網絡186
7.6.2優化策略190
7.6 .3推斷策略192
7.7實驗結果與分析192
7.7.1實驗結果193
7.7.2改進點效果分析193
7.7.3可疑位置推薦與假陽抑制算法整合194
7.8小結195
參考文獻195
第8章車道線檢測198
8.1國內外研究現狀198
8.2主要研究內容200
8.2.1總體解決方案200
8.2.2各階段概述201
8.3車道線檢測系統的設計與實現204
8.3.1車道線圖像數據標註與篩選205
8.3.2車道線圖片預處理206
8.3 .3車道線分割模型訓練211
8.3.4車道線檢測220
8.3.5車道線檢測結果224
8.4車道線檢測系統的性能測試224
8.4.1車道線檢測質量測試224
8.4.2車道線檢測時間測試226
8.5小結227
參考文獻227
第9章交通視頻分析229
9.1國內外研究現狀230
9.2主要研究內容231
9.2.1總體設計231
9.2.2精度和性能要求232
9.3交通視頻分析232
9.3.1車輛檢測和車牌檢測233
9.3.2車牌識別功能設計詳解235
9.3.3車輛品牌及顏色的識別243
9.3.4目標跟踪設計詳解244
9.4系統測試247
9.4.1車輛檢測248
9.4.2車牌檢測251
9.4.3車牌識別253
9.4.4車輛品牌識別256
9.4.5目標跟踪259
9.5小結259
參考文獻260