解剖深度學習原理：從0編寫深度學習庫

董洪偉

出版商: 電子工業
出版日期: 2021-07-01
定價: $948
售價: 8.5 折 $806
語言: 簡體中文
頁數: 628
裝訂: 平裝
ISBN: 712141449X
ISBN-13: 9787121414497
相關分類: DeepLearning
相關翻譯: 打下最紮實 AI 基礎不依賴套件：手刻機器學習神經網路穩健前進 (繁中版)

已絕版

前往其他有現貨版本↗️

買這商品的人也買了...

~~$490~~ $417

數位轉型 IT大健診 -- 全面性能測試方案 -- 系統效能穩定的必備良藥 (舊名: 獨家揭密：那些大型企業確保IT系統正常運作的奧密)
~~$1,900~~ $1,805

Grokking Deep Reinforcement Learning (Paperback)
~~$480~~ $379

圖解 Fintech 的知識與技術
$1,010

Windows 內核編程
$356

機器人學和人工智能中的行為樹
~~$2,800~~ $2,660

Linear Algebra for Everyone (Hardcover)
~~$680~~ $537

必學！Python 資料科學‧機器學習最強套件－ NumPy、Pandas、Matplotlib、OpenCV、scikit-learn、tf.Keras
~~$779~~ $740

Windows 編程調試技術內幕 (Inside Windows Debugging: A Practical Guide to Debugging and Tracing Strategies in Windows)
$475

Python 機器學習中的數學修煉
~~$620~~ $484

大話 AWS 雲端架構：雲端應用架構圖解輕鬆學, 2/e
~~$550~~ $435

JavaScript 第一次學就上手
~~$680~~ $537

資料科學家的實用統計學 : 運用 R 和 Python 學習 50+個必學統計概念, 2/e (Practical Statistics for Data Scientists: 50+ Essential Concepts Using R and Python, 2/e)
$403

Python 商業數據分析：零售和電子商務案例詳解
$352

TensorFlow 語音識別實戰
$301

TensorFlow 人臉識別實戰
$2,546

Learning Deep Learning: Theory and Practice of Neural Networks, Computer Vision, Nlp, and Transformers Using Tensorflow (Paperback)
~~$720~~ $562

刷題實戰筆記：演算法工程師求職加分的祕笈
$454

AI 源碼解讀：循環神經網絡(RNN)深度學習案例 (Python版)
$607

實用推薦系統
$811

移動機器人控制導論
~~$680~~ $537

精通資料視覺化 : 用試算表與程式說故事 (Hands-On Data Visualization: Interactive Storytelling from Spreadsheets to Code)
$607

視覺：對人類如何表示和處理視覺信息的計算研究
~~$894~~ $849

機器人 SLAM 導航：核心技術與實戰
~~$420~~ $332

電力電子學圖鑑：電的原理、運作機制、生活應用……從零開始看懂推動世界的科技！
~~$600~~ $468

從零開始的 3D設計之旅：Blender 3D 入門教材

商品描述

本書深入淺出地介紹了深度學習的基本原理和實現過程，帶領讀者用Python的NumPy庫從底層而不是借助現有的深度學習庫，從0開始構建屬於自己的深度學習庫。本書在介紹基本的Python編程、微積分、概率、統計知識的基礎上，按照深度學習的發展脈絡介紹了回歸模型、神經網絡、捲積神經網絡、循環神經網絡、生成對抗網絡等深度學習的核心知識，在深入淺出地剖析原理的同時，給出了詳細的代碼實現過程。本書既適合沒有任何深度學習基礎的初學者閱讀，也適合具有深度學習庫使用經驗、想瞭解其底層實現原理的從業人員參考。同時，本書特別適合作為高等院校的深度學習教材。

作者簡介

哈爾濱工業大學數學力學系應用數學本科、基礎數學碩士，南京航空航天大學航空宇航製造工程專業博士。
2008-2009年德州農工大學tamu訪問學者，2016年休斯敦大學訪問研究。
從事過曲面造型、特徵造型的算法研究和系統實現，開發過數控玻璃切割系統。
在高校從事過高等數學、線性代數、概率統計、數據結構、C++編程語言、圖形學、計算機網絡等課程教學，目前主要研究方向：計算機圖形學與計算機視覺、深度學習人工智能等。
編著了《C++17從入門到精通》《Python 3從入門到實戰》等書。

目錄大綱

第1章　程式設計和數學基礎 1
1.1　Python快速入門 1
1.1.1　快速安裝Python 1
1.1.2　Python基礎 2
1.1.3　Python中的常見運算 5
1.1.4　Python控制語句 7
1.1.5　Python常用容器類型 10
1.1.6　Python常用函數 16
1.1.7　類和對象 22
1.1.8　Matplotlib入門 24
1.2　張量庫NumPy 33
1.2.1　什麼是張量 33
1.2.2　創建ndarray對象 37
1.2.3　ndarray陣列的索引和切片 53
1.2.4　張量的計算 57
1.3　微積分 63
1.3.1　函數 64
1.3.2　四則運算和複合運算 66
1.3.3　極限和導數 69
1.3.4　導數的四則運算和鏈式法則 72
1.3.5　計算圖、正向計算和反向傳播求導 74
1.3.6　多變量函數的偏導數與梯度 75
1.3.7　向量值函數的導數與Jacobian矩陣 78
1.3.8　積分 83
1.4　概率基礎 84
1.4.1　概率 84
1.4.2　條件概率、聯合概率、全概率公式、貝葉斯公式 86
1.4.3　隨機變量 88
1.4.4　離散型隨機變量的概率分佈 89
1.4.5　連續型隨機變量的概率密度 91
1.4.6　隨機變量的分佈函數 93
1.4.7　期望、方差、協方差、協變矩陣 95

第2章　梯度下降法 99
2.1　函數極值的必要條件 99
2.2　梯度下降法基礎 101
2.3　梯度下降法的參數優化策略 108
2.3.1　Momentum法 108
2.3.2　AdaGrad法 110
2.3.3　AdaDelta法 112
2.3.4　RMSprop法 114
2.3.5　Adam法 115
2.4　梯度驗證 117
2.4.1　比較數值梯度和分析梯度 117
2.4.2　通用的數值梯度 118
2.5　分離梯度下降法與參數優化策略 119
2.5.1　參數優化器 119
2.5.2　接受參數優化器的梯度下降法 120

第3章　線性回歸、邏輯回歸和softmax回歸 122
3.1　線性回歸 122
3.1.1　餐車利潤問題 122
3.1.2　機器學習與人工智能 123
3.1.3　什麼是線性回歸 126
3.1.4　用正規方程法求解線性回歸問題 127
3.1.5　用梯度下降法求解線性回歸問題 129
3.1.6　調試學習率 133
3.1.7　梯度驗證 135
3.1.8　預測 135
3.1.9　多特徵線性回歸 136
3.2　資料的規範化 143
3.2.1　預測大壩出水量 143
3.2.2　資料的規範化過程 147
3.3　模型的評估 149
3.3.1　欠擬合和過擬合 149
3.3.2　驗證集和測試集 153
3.3.3　學習曲線 155
3.3.4　偏差和方差 160
3.4　正則化 165
3.5　邏輯回歸 168
3.5.1　邏輯回歸基礎 169
3.5.2　邏輯回歸的NumPy實現 173
3.5.3　實戰：鳶尾花分類的NumPy實現 178
3.6　softmax回歸 180
3.6.1　spiral資料集 180
3.6.2　softmax函數 181
3.6.3　softmax回歸模型 186
3.6.4　多分類交叉熵損失 188
3.6.5　通過加權和計算交叉熵損失 191
3.6.6　softmax回歸的梯度計算 191
3.6.7　softmax回歸的梯度下降法的實現 197
3.6.8　spiral資料集的softmax回歸模型 197
3.7　批梯度下降法和隨機梯度下降法 199
3.7.1　MNIST手寫數字集 199
3.7.2　用部分訓練樣本訓練邏輯回歸模型 201
3.7.3　批梯度下降法 202
3.7.4　隨機梯度下降法 207

第4章　神經網絡 209
4.1　神經網絡概述 209
4.1.1　感知機和神經元 209
4.1.2　啟動函數 213
4.1.3　神經網絡與深度學習 216
4.1.4　多個樣本的正向計算 221
4.1.5　輸出 224
4.1.6　損失函數 224
4.1.7　基於數值梯度的神經網絡訓練 229
4.2　反向求導 235
4.2.1　正向計算和反向求導 235
4.2.2　計算圖 237
4.2.3　損失函數關於輸出的梯度 239
4.2.4　2層神經網絡的反向求導 242
4.2.5　2層神經網絡的Python實現 247
4.2.6　任意層神經網絡的反向求導 252
4.3　實現一個簡單的深度學習框架 256
4.3.1　神經網絡的訓練過程 256
4.3.2　網絡層的代碼實現 257
4.3.3　網絡層的梯度檢驗 260
4.3.4　神經網絡的類 261
4.3.5　神經網絡的梯度檢驗 263
4.3.6　基於深度學習框架的MNIST手寫數碼識別 266
4.3.7　改進的通用神經網絡框架：分離加權和與啟動函數 268
4.3.8　獨立的參數優化器 276
4.3.9　fashion-mnist的分類訓練 279
4.3.10　讀寫模型參數 282

第5章　改進神經網絡性能的基本技巧 285
5.1　資料處理 285
5.1.1　資料增強 285
5.1.2　規範化 289
5.1.3　特徵工程 289
5.2　參數調試 296
5.2.1　權重初始化 296
5.2.2　優化參數 301
5.3　批規範化 301
5.3.1　什麼是批規範化 301
5.3.2　批規範化的反向求導 303
5.3.3　批規範化的代碼實現 304
5.4　正則化 310
5.4.1　權重正則化 310
5.4.2　Dropout 312
5.4.3　早停法 316
5.5　梯度爆炸和梯度消失 317

第6章　捲積神經網絡 318
6.1　捲積入門 319
6.1.1　什麼是捲積 319
6.1.2　一維捲積 325
6.1.3　二維捲積 326
6.1.4　多通道輸入和多通道輸出 338
6.1.5　池化 341
6.2　捲積神經網絡概述 344
6.2.1　全連接神經元和捲積神經元 345
6.2.2　捲積層和捲積神經網絡 346
6.2.3　捲積層和池化層的反向求導及代碼實現 349
6.2.4　捲積神經網絡的代碼實現 361
6.3　捲積的矩陣乘法 364
6.3.1　一維捲積的矩陣乘法 364
6.3.2　二維捲積的矩陣乘法 365
6.3.3　一維捲積反向求導的矩陣乘法 371
6.3.4　二維捲積反向求導的矩陣乘法 373
6.4　基於座標索引的快速捲積 377
6.5　典型捲積神經網絡結構 393
6.5.1　LeNet-5 393
6.5.2　AlexNet 394
6.5.3　VGG 395
6.5.4　殘差網絡 396
6.5.5　Inception網絡 398
6.5.6　NiN 399

第7章　循環神經網絡 403
7.1　序列問題和模型 403
7.1.1　股票價格預測問題 404
7.1.2　概率序列模型和語言模型 405
7.1.3　自回歸模型 406
7.1.4　生成自回歸資料 406
7.1.5　時間窗方法 408
7.1.6　時間窗採樣 409
7.1.7　時間窗方法的建模和訓練 409
7.1.8　長期預測和短期預測 410
7.1.9　股票價格預測的代碼實現 412
7.1.10　k-gram語言模型 415
7.2　循環神經網絡基礎 416
7.2.1　無記憶功能的非循環神經網絡 417
7.2.2　具有記憶功能的循環神經網絡 418
7.3　穿過時間的反向傳播 421
7.4　單層循環神經網絡的實現 425
7.4.1　初始化模型參數 425
7.4.2　正向計算 425
7.4.3　損失函數 427
7.4.4　反向求導 427
7.4.5　梯度驗證 429
7.4.6　梯度下降訓練 432
7.4.7　序列資料的採樣 433
7.4.8　序列資料的循環神經網絡訓練和預測 441
7.5　循環神經網絡語言模型和文本的生成 448
7.5.1　字符表 448
7.5.2　字符序列樣本的採樣 450
7.5.3　模型的訓練和預測 452
7.6　循環神經網絡中的梯度爆炸和梯度消失 455
7.7　長短期記憶網絡 456
7.7.1　LSTM的神經元 457
7.7.2　LSTM的反向求導 460
7.7.3　LSTM的代碼實現 461
7.7.4　LSTM的變種 469
7.8　門控循環單元 470
7.8.1　門控循環單元的工作原理 470
7.8.2　門控循環單元的代碼實現 472
7.9　循環神經網絡的類及其實現 475
7.9.1　用類實現循環神經網絡 475
7.9.2　循環神經網絡單元的類實現 483
7.10　多層循環神經網絡和雙向循環神經網絡 491
7.10.1　多層循環神經網絡 491
7.10.2　多層循環神經網絡的訓練和預測 497
7.10.3　雙向循環神經網絡 500
7.11　Seq2Seq模型 506
7.11.1　機器翻譯概述 507
7.11.2　Seq2Seq模型的實現 508
7.11.3　字符級的Seq2Seq模型 516
7.11.4　基於Word2Vec的Seq2Seq模型 522
7.11.5　基於詞嵌入層的Seq2Seq模型 533
7.11.6　註意力機制 541

第8章　生成模型 552
8.1　生成模型概述 552
8.2　自動編碼器 556
8.2.1　什麼是自動編碼器 557
8.2.2　稀疏編碼器 559
8.2.3　自動編碼器的代碼實現 560
8.3　變分自動編碼器 563
8.3.1　什麼是變分自動編碼器 563
8.3.2　變分自動編碼器的損失函數 564
8.3.3　變分自動編碼器的參數重採樣 565
8.3.4　變分自動編碼器的反向求導 565
8.3.5　變分自動編碼器的代碼實現 566
8.4　生成對抗網絡 571
8.4.1　生成對抗網絡的原理 573
8.4.2　生成對抗網絡訓練過程的代碼實現 577
8.5　生成對抗網絡建模實例 579
8.5.1　一組實數的生成對抗網絡建模 579
8.5.2　二維座標點的生成對抗網絡建模 585
8.5.3　MNIST手寫數碼集的生成對抗網絡建模 590
8.5.4　生成對抗網絡的訓練技巧 594
8.6　生成對抗網絡的損失函數及其概率解釋 594
8.6.1　生成對抗網絡的損失函數的全域最優解 594
8.6.2　Kullback-Leibler散度和Jensen-Shannon散度 595
8.6.3　生成對抗網絡的最大似然解釋 598
8.7　改進的損失函數——Wasserstein GAN 599
8.7.1　Wasserstein GAN的原理 599
8.7.2　Wasserstein GAN的代碼實現 603
8.8　深度捲積對抗網絡 605
8.8.1　一維轉置捲積 606
8.8.2　二維轉置捲積 609
8.8.3　捲積對抗網絡的代碼實現 612
參考文獻 617

解剖深度學習原理：從0編寫深度學習庫

董洪偉

買這商品的人也買了...

商品描述

作者簡介

目錄大綱

類似商品

最後瀏覽商品 (20)