自然語言處理遷移學習實戰 Transfer Learning for Natural Language Processing

Name: 自然語言處理遷移學習實戰
Price: 455 TWD
Availability: InStock
Author: [加納] 保羅·阿祖雷（Paul Azunre）
ISBN: 7115615713

[加納] 保羅·阿祖雷（Paul Azunre）

預覽內頁

出版商: 人民郵電
出版日期: 2023-07-01
售價: $479
貴賓價: 9.5 折 $455
語言: 簡體中文
頁數: 207
ISBN: 7115615713
ISBN-13: 9787115615718
相關分類: Text-mining
此書翻譯自: Transfer Learning for Natural Language Processing (Paperback)

立即出貨 (庫存 < 3)

買這商品的人也買了...

~~$580~~ $452

機器學習的數學：用數學引領你走進 AI 的神秘世界
~~$594~~ $564

自然語言處理實戰 : 利用 Python 理解、分析和生成文本
~~$1,000~~ $790

Kaggle 競賽攻頂秘笈 -- 揭開 Grandmaster 的特徵工程心法，掌握制勝的關鍵技術
$491

深度學習圖像搜索與識別
~~$599~~ $473

資料科學的建模基礎 : 別急著 coding！你知道模型的陷阱嗎？
~~$890~~ $703

NLP 大神 RNN 網路：Python 原始程式碼手把手帶你寫
~~$750~~ $592

集成式學習：Python 實踐！整合全部技術，打造最強模型 (Hands-On Ensemble Learning with Python: Build highly optimized ensemble machine learning models using scikit-learn and Keras)
~~$880~~ $695

全中文自然語言處理：Pre-Trained Model 方法最新實戰
$500

知識圖譜建模與智能推理技術
$449

知識圖譜 — 面向科技文獻的構建技術與應用實踐
~~$414~~ $393

HuggingFace 自然語言處理詳解 — 基於 BERT 中文模型的任務實戰
~~$594~~ $564

精通 Transformer : 從零開始構建最先進的 NLP 模型
~~$768~~ $730

客戶留存數據分析與預測
$505

深度序列模型與自然語言處理：基於 TensorFlow 2 實踐
$407

深度學在自然語言處理中的應用 : 從詞表徵到 ChatGPT
$403

情感分析進階
~~$828~~ $787

Istio最佳實戰
~~$539~~ $512

Kafka 實戰
$1,367

自然語言處理導論
~~$600~~ $420

Python 程式設計與 OpenAI API 應用：零基礎建構非同步 GUI 的 AI聊天機器人
~~$650~~ $507

Notion 全方位管理術：任務管理 × 收支記帳 × 知識筆記 × ChatGPT × Notion AI（iThome鐵人賽系列書）【軟精裝】
~~$556~~ $523

大規模語言模型：從理論到實踐
$403

自然語言處理導論
~~$820~~ $647

最貼近現實生活 - 演算法筆記強人輕鬆練成
~~$720~~ $568

自己開發 ChatGPT - LLM 從頭開始動手實作

商品描述

遷移學習作為機器學習和人工智能領域的重要方法，在電腦視覺、自然語言處理（NLP）、語音識別等領域都得到廣泛應用。本書是遷移學習技術的實用入門圖書，能夠帶領讀者深入實踐自然語言處理模型。首先，本書回顧了機器學習中的關鍵概念，並介紹了機器學習的發展歷史，以及NLP遷移學習的進展；其次，深入探討了一些重要的NLP遷移學習方法—NLP淺層遷移學習和NLP深度遷移學習；最後，涵蓋NLP遷移學習領域中重要的子領域—以Transformer作為關鍵功能的深度遷移學習技術。讀者可以動手將現有的先進模型應用於現實世界的應用程序，包括垃圾電子郵件分類器、IMDb電影評論情感分類器、自動事實檢查器、問答系統和翻譯系統等。

本書文字簡潔、論述精闢、層次清晰，既適合擁有NLP基礎的機器學習和數據科學相關的開發人員閱讀，也適合作為高等院校電腦及相關專業的學生參考用書。

作者簡介

Paul Azunre擁有麻省理工學院電腦科學博士學位，曾擔任美國國防部高級研究計劃局（DARPA）的多個研究項目的主任研究員。由他創建的Algorine公司致力於推進AI/ML技術並讓這些技術產生重大社會影響。Paul還參與創建了Ghana NLP開源社區。該社區專註於NLP技術的應用，尤其是對加納語和其他低資源語言進行遷移學習。

目錄大綱

第一部分導論

第 1章遷移學習簡介 3

1.1 NLP領域典型任務概述 5

1.2 理解人工智能背景下的NLP技術 6

1.2.1 人工智能 7

1.2.2 機器學習 7

1.2.3 自然語言處理 11

1.3 NLP發展簡史 12

1.3.1 NLP簡介 12

1.3.2 遷移學習的進展 14

1.4 電腦視覺中的遷移學習 16

1.4.1 概述 16

1.4.2 ImageNet預訓練模型 17

1.4.3 ImageNet預訓練模型的微調 18

1.5 NLP遷移學習成為一個令人興奮的研究課題的原因 19

小結 20

第 2章從頭開始：數據預處理 21

2.1 垃圾電子郵件分類任務中示例數據的預處理 23

2.1.1 加載並檢視Enron電子郵件語料庫 24

2.1.2 加載並檢視欺詐電子郵件數據集 26

2.1.3 將電子郵件文本轉換為數值 30

2.2 電影評論情感分類任務中示例數據的預處理 32

2.3 廣義線性模型 35

2.3.1 邏輯斯諦回歸 36

2.3.2 支持向量機 38

小結 38

第3章從頭開始：基準測試和優化 41

3.1 基於決策樹的模型 41

3.1.1 隨機森林 42

3.1.2 梯度提升機 42

3.2 神經網絡模型 47

3.2.1 語言模型嵌入 47

3.2.2 BERT模型簡介 52

3.3 效果優化 56

3.3.1 手動超參調優 56

3.3.2 系統化超參調優 57

小結 58

第二部分基於循環神經網絡的淺層遷移學習和深度遷移學習

第4章 NLP淺層遷移學習 63

4.1 基於預訓練詞嵌入的半監督學習 65

4.2 基於高級表示的半監督學習 69

4.3 多任務學習 71

4.3.1 問題的提出以及淺層神經網絡單任務基線 72

4.3.2 雙任務實驗 74

4.4 領域適配 75

小結 78

第5章基於循環神經網絡的深度遷移學習實驗的數據預處理 79

5.1 表格分類數據的預處理 81

5.1.1 獲取並檢視表格數據 82

5.1.2 預處理表格數據 85

5.1.3 對預處理數據進行數字編碼 87

5.2 預處理示例數據的事實核查 87

5.2.1 特殊問題考量 88

5.2.2 加載並檢視事實核查數據 88

小結 89

第6章基於循環神經網絡的NLP深度遷移學習 91

6.1 SIMOn 91

6.1.1 通用神經網絡結構概述 92

6.1.2 表格數據建模 93

6.1.3 SIMOn在表格數據分類中的應用 93

6.2 ELMo 100

6.2.1 ELMo雙向語言建模 101

6.2.2 ELMo在虛假新聞檢測任務中的應用 102

6.3 ULMFiT 104

6.3.1 以語言模型為目標任務的微調 104

6.3.2 以分類為目標任務的微調 105

小結 105

第三部分基於Transformer的深度遷移學習以及適配策略

第7章基於Transformer的深度遷移學習和GPT 109

7.1 Transformer 110

7.1.1 transformers庫簡介與註意力可視化 113

7.1.2 自註意力 115

7.1.3 殘差連接、編碼器-解碼器註意力和位置編碼 117

7.1.4 預訓練的編碼器-解碼器在機器翻譯任務中的應用 120

7.2 GPT 121

7.2.1 模型結構概述 122

7.2.2 Transformer pipeline及其在文本生成任務中的應用 124

7.2.3 聊天機器人任務中的應用 126

小結 128

第8章基於BERT和mBERT的NLP深度遷移學習 129

8.1 BERT 130

8.1.1 BERT模型結構 131

8.1.2 在自動問答任務中的應用 134

8.1.3 在空白填寫和後續句預測任務中的應用 136

8.2 mBERT的跨語言學習 138

8.2.1 JW300數據集概述 139

8.2.2 用預訓練分詞器將mBERT遷移到Twi單語言數據 139

8.2.3 根據Twi單語言數據從頭訓練mBERT模型和分詞器 142

小結 143

第9章 ULMFiT與知識蒸餾的適配策略 145

9.1 逐步解凍和差別式微調 146

9.1.1 預訓練語言模型微調 147

9.1.2 以分類為目標任務的微調 149

9.2 知識蒸餾 151

小結 156

第 10章 ALBERT、適配器和多任務適配策略 157

10.1 嵌入因子分解與跨層參數共享 158

10.2 多任務微調 162

10.2.1 GLUE數據集 163

10.2.2 GLUE單任務微調 164

10.2.3 序列化適配 167

10.3 適配器 169

小結 171

第 11章總結 173

11.1 關鍵概念概述 174

11.2 其他新興研究趨勢 179

11.2.1 RoBERTa 180

11.2.2 GPT-3 180

11.2.3 XLNet 182

11.2.4 BigBird 182

11.2.5 Longformer 182

11.2.6 Reformer 183

11.2.7 T5 183

11.2.8 BART 184

11.2.9 XLM 185

11.2.10 TAPAS 185

11.3 NLP遷移學習的發展方向 186

11.4 倫理和環境因素 187

11.5 最新進展 189

11.5.1 Kaggle和Zindi比賽 189

11.5.2 arXiv 190

11.5.3 新聞與社交媒體 190

11.6 寫在最後 191

附錄A Kaggle入門 193

A.1 通過Kaggle Kernel免費使用GPU 193

A.2 競賽、討論區和博客 198

附錄B 深度學習的基礎工具簡介 201

B.1 隨機梯度下降 202

B.2 TensorFlow 203

B.3 PyTorch 206

B.4 Keras、fast.ai庫和Hugging Face的transformers庫 207