新一代人工智能:從深度學習到大模型

張重生 著

  • 出版商: 機械工業
  • 出版日期: 2025-02-01
  • 定價: $534
  • 售價: 8.5$454
  • 語言: 簡體中文
  • 裝訂: 平裝
  • ISBN: 7111770021
  • ISBN-13: 9787111770022
  • 相關分類: LangChainDeepLearning
  • 下單後立即進貨 (約4週~6週)

買這商品的人也買了...

商品描述

本書著重在新一代人工智能相關理論與技術進行深入的原理講解,共19 章,囊括了深度學習的基礎理論、深度學習的最佳化問題、
各種捲積操作、損失函數、經典的捲積神經網絡結構、目標辨識與度量學習演算法、深度學習目標偵測技術、影像分割演算法、
生成對抗網絡、蒸餾學習、長尾學習技術、影像增廣技術,以及大模型相關的Transformer技術、
預訓練技術、大語言模型、視覺-語言模型及視覺大模型等技術。

本書既可作為高等學校人工智能、智慧科學與科技、電腦科學與科技、資料科學與大數據科技等專業的教材,
也可作為人工智能領域的科學研究人員、業界人士、大學教師和愛好者的參考書,以系統化掌握新一代人工智能的相關理論和技術。

作者簡介

張重生,1982年9月生,博士,教授,碩士生導師,河南大學大數據團隊帶頭人。研究領域為大數據分析、深度學習、數據挖掘、數據庫、實時數據分析。 博士畢業於INRlA,France(法國國家信息與自動化研究所),獲得優秀博士論文榮譽。2010年08月至2011年3月,在美國加州大學洛杉磯分校(UCLA)計算機系,師從Carlo Zaniolo教授進行流數據挖掘方面的研究。十多年來,一直從事數據庫、數據挖掘、大數據分析相關的研究,發表SCI/EI論文20篇,含Information Sciences、Neurocornputinq、lEEE ICDM、PAKDD、SSDBM等著名國際期刊和會議論文。作為項目負責人主持4項科研項目,出版學術著作三部,作為第一發明人獲得3項國家發明專利,指導碩士研究生12名。

目錄大綱

第1章 緒論1
1.1 人工智能的概念及其發展現況1
1.2 人工智能的主要發展歷程4
1.3 深度學習/新一代人工智能的研究與應用領域5
1.4 結束語11
本章參考文獻12
第2章 數據思維13
2.1 新一代人工智能時代資料的重要性13
2.2 數據思維中常見的錯誤與陷阱15
2.3 深度學習/新一代人工智能研究的16個經典資料集介紹17
2.4 結束語38
第3章 人工神經網絡40
3.1 人工神經網絡的前向計算40
3.2 人工神經網絡的誤差反向傳播原理43
3.3 人工神經網絡實現47
第4章 捲積神經網絡50
4.1 捲積神經網絡原理51
4.2 經典的捲積神經網絡介紹56
4.3 捲積神經網絡的誤差反向傳播原理61
第5章 常見捲積操作與經典捲積神經網絡73
5.1 常見的捲積操作介紹73
5.2 經典的捲積神經網絡介紹84
第6章 神經網絡優化88
6.1 激活函數88
6.2 權值初始化93
6.3 神經網絡的神經元值歸一化與權值歸一化95
6.4 神經網絡的正則化100
6.5 梯度更新策略與超參優化101
本章參考文獻104
第7章 孿生神經網絡107
7.1 孿生神經網絡介紹107
7.2 孿生神經網絡結構108
7.3 孿生神經網絡實現109
7.4 Triplet Loss/FaceNet演算法111
7.5 SiamFC目標追蹤演算法113
第8章 蒸餾網118
8.1 蒸餾網介紹118
8.2 帶溫度的Softmax激活函數119
8.3 蒸餾網絡結構120
8.4 蒸餾學習過程121
8.5 總結122
本章參考文獻123
第9章 損失函數124
9.1 損失函數簡介124
9.1.3 損失函數的分類體系125
9.2 十種常見的損失函數126
9.3 最新損失函數136
9.4 KL散度與JS散度142
本章參考文獻143
第10章 深度學習常用的影像增廣技術144
10.1 影像增廣概述144
10.2 簡單的影像變換技術145
10.3 RandAugment影像增廣技術 146
10.4 MixUp影像合成技術147
10.5 CutMix影像合成技術148
10.6 AugMix影像合成技術149
第11章 YOLO系列目標偵測演算法153
11.1 深度學習目標檢測綜述153
11.2 YOLO目標偵測演算法原理155
11.3 YOLO系列目標偵測演算法的發展歷程166
第12章 Faster R-CNN系列目標偵測演算法168
12.1 R-CNN目標偵測演算法168
12.2 Fast R-CNN目標偵測演算法169
12.3 Faster R-CNN目標偵測演算法172
12.4 Mask R-CNN目標檢測/影像分割演算法182
第13章 基於深度學習的影像分割技術190
13.1 全捲積網190
13.2 U-Net200
13.3 DeepLabs等前緣分割演算法205
第14章 生成對抗網絡(GAN)210
14.1 原始GAN/樸素GAN211
14.2 DCGAN219
14.3 BEGAN223
14.4 基於GAN的關係型/表格型資料產生技術227
本章參考文獻230
第15章 長尾學習231
15.1 長尾分佈與長尾學習背景介紹231
15.2 代表性長尾學習演算法236
第16章 Transformer架構原理244
16.1 自註意力機制244
16.2 Transformer架構251
16.3 Transformer的基礎應用-BERT自然語言處理模式257
本章參考文獻258
第17章 大語言模型259
17.1 大模型發展現況及其影響與意義259
17.2 大模型的核心技術261
17.3 大模型的應用方法262
第18章 視覺Transformer模型265
18.1 視覺Transformer架構ViT265
18.2 Swin Transformer架構266
第19章 語言-視覺預訓練模型與視覺大模型271
19.1 語言-視覺預訓練模型—CLIP272
19.2 視覺預訓練技術(MAE)275