深度學習與目標檢測 : 工具、原理與算法

塗銘,金智勇

  • 出版商: 機械工業
  • 出版日期: 2021-09-01
  • 售價: $534
  • 貴賓價: 9.5$507
  • 語言: 簡體中文
  • 頁數: 236
  • 裝訂: 平裝
  • ISBN: 7111690346
  • ISBN-13: 9787111690344
  • 相關分類: DeepLearning
  • 立即出貨

買這商品的人也買了...

相關主題

商品描述

這是一本從工具、原理、算法3個維度指導讀者零基礎快速掌握目標檢測技術及其應用的入門書。
兩位作者是資深的AI技術專家和計算機視覺算法專家,在阿里、騰訊、百度、三星等大企業從事計算機視覺相關的工作多年,
不僅理論功底紮實、實踐經驗豐富,而且知道初學者進入計算機視覺領域的痛點和難點。
據此,兩位作者編寫了這本針對目標檢測初學者的入門書,
從知識體系和工程實踐的角度幫助讀者少走彎路。
第1~2章是目標檢測的準備工作,主要介紹了目標檢測的常識、
深度學習框架的選型、開發環境的搭建以及數據處理工具的使用。
第3~5章是目標檢測的技術基礎,主要講解了數據預處理和卷積神經網絡等圖像分類技術的基礎知識。
第6章比較詳細地介紹了香港中文大學的開源算法庫mmdetection。
第7~10章詳細地講解了目標檢測的概念、原理、一階段算法、二階段算法以及提升算法性能的常用方法。
第11章簡單介紹了目標檢測的相關案例(以工業為背景),以幫助讀者構建一個更完整的知識體系。

作者簡介

塗銘
資深數據架構師和人工智能技術專家,現就職於騰訊,曾就職於阿里。對大數據、自然語言處理、圖像識別、Python、Java等相關技術有深入的研究,積累了豐富的實踐經驗。
在工業領域曾參與了燃煤優化、設備故障診斷以及正泰光伏電池片和組件EL圖像檢測項目;在自然語言處理方面,曾擔任導購機器人項目的架構師,主導開發機器人的語義理解、短文本相似度匹配、上下文理解,以及通過自然語言檢索產品庫,在項目中構建了NoSQL+文本檢索等大數據架構,同時負責問答對的整理和商品屬性的提取,帶領NLP團隊構建了語義解析層。
合著有暢銷書《Python自然語言處理實戰:核心技術與算法》《深度學習與圖像識別:原理與實踐》《會話式AI:自然語言處理與人機交互》。


金智勇
計算機視覺算法專家,在計算機視覺領域深耕1□年。現就職於百度,曾就職於阿里和三星等知名高新技術企業。業務領域涵蓋增強現實、人臉識別、圖像美化、智能交通、工業質檢等多個方向,具有豐富的算法研究與落地經驗。

目錄大綱

前言
第1章 目標檢測概述  1
1.1 什麼是目標檢測  1
1.2 典型的應用場景  2
1.2.1 人臉識別  2
1.2.2 智慧交通  2
1.2.3 工業檢測  3
1.3 目標檢測技術發展簡史  3
1.3.1 傳統算法  4
1.3.2 深度學習算法  5
1.4 目標檢測領域重要的公開評測集  8
1.5 本章小結  11

第2章 目標檢測前置技術  12
2.1 深度學習框架  12
2.1.1 Theano  12
2.1.2 TensorFlow  13
2.1.3 MXNet  14
2.1.4 Keras  15
2.1.5 PyTorch  15
2.1.6 Caffe  16
2.2 搭建開發環境  17
2.2.1 Anaconda  17
2.2.2 Conda  19
2.2.3 PyTorch的下載與安裝  21
2.3 NumPy使用詳解  22
2.3.1 創建數組  22
2.3.2 創建NumPy數組  24
2.3.3 獲取NumPy屬性  27
2.3.4 NumPy數組索引  28
2.3.5 切片  28
2.3.6 NumPy中的矩陣運算  29
2.3.7 數據類型轉換  31
2.3.8 NumPy的統計計算方法  31
2.3.9 NumPy中的arg運算  32
2.3.10 FancyIndexing  33
2.3.11 NumPy數組比較  33
2.4 本章小結  35

第3章 卷積神經網絡  36
3.1 卷積神經網絡基礎  36
3.1.1 全連接層  36
3.1.2 卷積層  37
3.1.3 池化層  42
3.1.4 三維數據的捲積運算  44
3.1.5 批規範化層  45
3.1.6 Dropout層  47
3.2 本章小結  48

第4章 數據預處理  49
4.1 數據增強  49
4.1.1 resize操作  50
4.1.2 crop操作  51
4.1.3 隨機的水平和豎直翻轉  52
4.1.4 隨機角度的旋轉  53
4.1.5 亮度、對比度和顏色的隨機變化  54
4.1.6 彩色圖轉灰度圖  55
4.2 數據的探索—Kaggle貓狗大戰  56
4.3 本章小結  64

第5章 常見卷積神經網絡結構  65
5.1 LeNet神經網絡  65
5.2 AlexNet神經網絡  70
5.3 VGGNet神經網絡  77
5.4 GoogLeNet神經網絡  81
5.4.1 inception模塊  83
5.4.2 GoogLeNet的實現  85
5.4.3 GoogLeNet的演變  88
5.5 ResNet  89
5.5.1 殘差模塊  90
5.5.2 ResNet模型  92
5.6 DenseNet  92
5.7 其他網絡結構  95
5.8 實戰案例  96
5.9 計算圖像數據集的RGB均值和方差  98
5.10 本章小結  99

第6章 mmdetection工具包介紹  100
6.1 mmdetection概要  100
6.2 mmdetection支持的檢測框架和算法實現  101
6.3 搭建mmdetection開發環境  102
6.4 使用入門  103
6.4.1 使用預訓練模型進行推理  103
6.4.2 訓練模型  105
6.4.3 有用的工具  106
6.4.4 如何使用mmdetection  108
6.5 標註圖像  110
6.6 實戰案例  112
6.6.1 檢測人體  113
6.6.2 檢測貓和狗  115
6.7 本章小結  120

第7章 目標檢測的基本概念  121
7.1 概念詳解  121
7.1.1 IoU計算  122
7.1.2 NMS操作  122
7.1.3 感受野  124
7.1.4 空洞卷積  128
7.1.5 評價指標mAP  129
7.2 本章小結  131

第8章 兩階段檢測方法  132
8.1 R-CNN算法  132
8.1.1 生成候選區域  132
8.1.2 類別判定  133
8.1.3 位置修正  136
8.1.4 檢測過程  137
8.1.5 R-CNN算法的重要意義  138
8.2 SPP-Net算法  139
8.2.1 空間金字塔採樣  139
8.2.2 網絡訓練  141
8.2.3 測試過程  142
8.3 Fast R-CNN算法及訓練過程  143
8.3.1 ROI池化層  144
8.3.2 模型訓練  144
8.3.3 測試過程  147
8.4 Faster R-CNN算法及訓練過程  147
8.4.1 候選框提取網絡  148
8.4.2 RPN和Fast R-CNN共享特徵的方法  152
8.5 Faster R-CNN代碼解析  153
8.5.1 代碼整體結構  153
8.5.2 數據加載  158
8.5.3 構建主幹網絡  160
8.5.4 候選框提取網絡  161
8.5.5 對候選框進行分類和位置校正  163
8.5.6 算法模型架構圖  165
8.6 本章小結  165

第9章 檢測算法的進一步改進  167
9.1 特徵金字塔  167
9.1.1 特徵金字塔結構  167
9.1.2 FPN代碼解析  170
9.2 焦點損失函數  174
9.3 本章小結  175

第10章 一階段檢測算法  176
10.1 YOLO算法  176
10.1.1 YOLO第一版  176
10.1.2 YOLO第二版  182
10.1.3 YOLO第三版  185
10.2 SSD算法  196
10.2.1 SSD算法原理  197
10.2.2 訓練方法  197
10.2.3 SSD代碼解析  201
10.3 FCOS算法  208
10.3.1 FCOS算法原理  208
10.3.2 FCOS源碼解析  213
10.4 本章小結  217

第11章 工業AI的發展  218
11.1 工業AI的概念和互聯網  218
11.2 工業AI落地應用  219
11.2.1 工業AI的典型場景  220
11.2.2 工業AI落地背後的本質  221
11.2.3 展望  221
11.3 工業生產中的缺陷檢測問題  221
11.3.1 視覺檢測系統  221
11.3.2 光學識別軟件  222
11.3.3 視覺質檢典型需求場景  222
11.4 目標檢測在工業中的案例:面板行業ADC解決方案  223
11.4.1 面板行業生產質檢的特點  223
11.4.2 ADC解決方案  223
11.4.3 系統效果與價值總結  225
11.5 本章小結  226