深度學習與電腦視覺實戰
彭小紅,張良均
- 出版商: 人民郵電
- 出版日期: 2022-11-01
- 定價: $299
- 售價: 8.5 折 $254
- 語言: 簡體中文
- 頁數: 213
- ISBN: 7115602549
- ISBN-13: 9787115602541
-
相關分類:
DeepLearning、Computer Vision
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
$760HTML5 + CSS3 炫酷應用實例集錦
-
$505深度學習與圍棋
-
$534$507 -
$534$507 -
$305機器學習入門與實戰 — 基於 scikit-learn 和 Keras
-
$403Python 項目開發實戰
-
$575DevOps 權威指南 : IT 效能新基建
-
$356集成學習入門與實戰:原理、算法與應用
-
$454Vue.js 3 應用開發與核心源碼解析
-
$356深度學習預訓練語言模型(案例篇)
-
$203敏捷史話(作者包銷定製版)
-
$630$599 -
$621AI 編譯器開發指南
-
$454人工智能語音測試原理與實踐
-
$454人工智能安全基礎
-
$356業務敏捷 打造數智時代的高適應力組織
-
$383ChatGPT : 智能對話開創新時代
-
$439從 ChatGPT 到 AIGC:智能創作與應用賦能
-
$779$740 -
$594$564 -
$658高級 Python 核心編程開啟精通 Python 編程世界之旅
-
$505python核心編程:從入門到實踐:學與練
-
$659$626 -
$659$626 -
$607前端工程化 : 基於 Vue.js 3.0 的設計與實踐
商品描述
本書以深度學習在電腦視覺領域的常用技術與案例相結合的方式,深入淺出地介紹電腦視覺的常見任務及實現技術。全書共7章,內容包含概述、圖像處理基本操作、深度學習視覺基礎任務、基於FaceNet的人臉識別實戰、基於 Faster R-CNN 的目標檢測實戰、基於 U-Net 的城市道路場景分割實戰、基於SRGAN 的圖像超分辨率技術實戰等。本書大部分章包含操作實踐代碼和課後習題,希望能夠幫助讀者在電腦視覺基礎任務中應用算法,鞏固所學內容。
本書可以作為高校人工智能相關專業教材,也可以作為從事電腦視覺技術研究的從業者和科技人員的參考用書。對於有一定基礎和經驗的讀者,本書也能幫助他們查漏補缺,深入理解和掌握相關原理及方法,提升解決實際問題的能力。
作者簡介
彭小紅,女,廣東海洋大學數學與電腦學院教授,院長,碩士生導師,國家級一流專業建設點(電腦科學與技術)負責人、廣東省“電腦科學與技術專業”教學團隊負責人、廣東省“電腦科學與技術專業綜合改革試點”負責人、廣東省一流課程“電腦組成與結構”負責人、南粵優秀教師。 研究方向:智能系統及其智能信息處理、智能水下機器人。先後主持廣東省科技計劃、南方海洋科學與工程廣東省實驗室(湛江)、廣東省高校創新強校工程等課題10餘項,發表學術論文30餘篇(其中SCI/EI收錄16篇),譯著1部;以第一完成人獲得專利6項、電腦軟件著作權22項,獲湛江市科學技術進步獎二等獎1項、三等獎2項。 主講本科專業課程:《電腦組成與結構》、《電腦接口技術》、《微機原理及接口》、《匯編語言與接口技術》、《生產實習》,研究生課程:《電腦體系結構》、《人工智能導論》;近五年,主持省部級以上協同育人、質量工程、教學改革項目9項,廣東省研究生教育創新計劃項目1項,發表教改論文8篇;獲得廣東海洋大學教學成果特等獎和一等獎、廣東海洋大學教學質量優秀獎。指導學生參加學科競賽獲國家級和省部級獎勵26項,榮獲得因特網+大學生創新創業大賽、挑戰杯大賽、中國軟件杯、中國電腦設計大賽優秀指導教師稱號。
張良均 資深大數據專家,廣東泰迪智能科技股份有限公司董事長,國家科技部入庫技術專家,教育部全國專業學位水平評估專家,工信部教育與考試中心入庫專家,中國工業與應用數學學會理事,廣東省工業與應用數學學會副理事長,廣東省高等職業教育教學指導委員會委員,華南師範大學、中南財經政法大學等40餘所高校校外碩導或兼職教授,泰迪杯全國數據挖掘挑戰賽發起人。 曾在國內外重要學術刊物上發表學術論文10餘篇,主導編寫圖書專著60餘部,其中獲普通高等教育“十一五”規劃教材一部,“十三五”職業教育國家規劃教材一部;參與標準建設4項,主持國家級課題1項、省部級課題4項。獲得SAS、SPSS數據挖掘認證及Hadoop開發工程師證書,具有信訪、電力、電信、銀行、製造企業、電子商務和電子政務的項目經驗和行業背景,並榮獲中國產學研合作促進獎、中國南方電網公司發明專利一等獎、廣東省農業技術推廣二等獎、廣州市荔灣區科學技術進步獎。
目錄大綱
第 1章 概述 1
1.1 電腦視覺與深度學習 1
1.1.1 電腦視覺 2
1.1.2 深度學習 3
1.2 深度學習的電腦視覺應用 4
1.2.1 人臉識別 5
1.2.2 圖像分類 5
1.2.3 目標檢測 6
1.2.4 圖像分割 6
1.2.5 姿態估計 7
1.2.6 場景識別 7
1.2.7 目標跟蹤 8
1.2.8 動作識別 8
1.2.9 黑白照片自動著色 9
1.2.10 圖像風格轉移 9
1.3 相關Python庫 10
1.3.1 深度學習框架 10
1.3.2 圖像處理庫 12
小結 13
課後習題 13
第 2章 圖像處理基本操作 15
2.1 讀寫圖像 15
2.1.1 常用圖像類型 16
2.1.2 讀取圖像 17
2.1.3 顯示圖像 18
2.1.4 保存圖像 20
2.2 圖像顏色空間 20
2.2.1 常用顏色空間簡介 20
2.2.2 顏色空間轉換 22
2.3 圖像幾何變換 24
2.3.1 圖像平移 24
2.3.2 圖像縮放 25
2.3.3 圖像旋轉 32
2.3.4 圖像仿射 34
2.4 圖像增強 38
2.4.1 灰度級修正 39
2.4.2 圖像平滑 47
2.4.3 圖像銳化 51
小結 56
課後習題 57
第3章 深度學習視覺基礎任務 59
3.1 深度神經網絡 59
3.2 捲積神經網絡 61
3.2.1 捲積層 63
3.2.2 池化層 64
3.2.3 全連接層 64
3.2.4 捲積神經網絡訓練過程 65
3.3 圖像分類 67
3.3.1 圖像分類簡介 67
3.3.2 圖像分類經典算法 68
3.3.3 訓練圖像分類網絡 83
3.4 目標檢測 86
3.4.1 目標檢測簡介 86
3.4.2 目標檢測經典算法 88
3.4.3 訓練目標檢測網絡 104
3.5 圖像分割 111
3.5.1 圖像分割簡介 111
3.5.2 圖像分割經典算法 113
3.5.3 訓練圖像分割網絡 127
3.6 圖像生成 132
3.6.1 圖像生成簡介 133
3.6.2 圖像生成經典算法 134
3.6.3 訓練圖像生成器網絡 144
小結 149
課後習題 149
第4章 基於FaceNet的人臉識別實戰 152
4.1 背景與目標 152
4.1.1 背景 152
4.1.2 目標 154
4.1.3 項目工程結構 154
4.2 流程與步驟 155
4.2.1 人臉檢測 156
4.2.2 人臉對齊 160
4.2.3 人臉特徵提取 161
4.2.4 人臉特徵匹配 164
4.3 結果分析 165
小結 167
課後習題 168
第5章 基於Faster R-CNN的目標檢測實戰 170
5.1 背景與目標 170
5.1.1 背景 170
5.1.2 目標 171
5.1.3 項目工程結構 171
5.2 流程與步驟 172
5.2.1 數據準備 172
5.2.2 定義Faster R-CNN配置信息類 174
5.2.3 生成先驗錨框 174
5.2.4 定義損失函數 176
5.2.5 訓練網絡 180
5.3 結果分析 181
小結 183
課後習題 184
第6章 基於U-Net的城市道路場景分割實戰 186
6.1 背景與目標 186
6.1.1 背景 186
6.1.2 目標 187
6.1.3 項目工程結構 188
6.2 流程與步驟 188
6.2.1 數據準備 189
6.2.2 搭建U-Net 191
6.2.3 定義損失函數 194
6.2.4 訓練網絡 195
6.3 結果分析 197
小結 199
課後習題 199
第7章 基於SRGAN的圖像超分辨率技術實戰 201
7.1 背景與目標 201
7.1.1 背景 201
7.1.2 目標 203
7.1.3 項目工程結構 203
7.2 流程與步驟 204
7.2.1 數據準備 204
7.2.2 搭建SRGAN 206
7.2.3 定義SRGAN損失函數 209
7.2.4 訓練網絡 210
7.3 結果分析 211
小結 213
課後習題 213