自然語言表示學習 — 文本語義向量化表示研究與應用
黃河燕,劉茜
- 出版商: 電子工業
- 出版日期: 2022-09-01
- 定價: $414
- 售價: 8.5 折 $352
- 語言: 簡體中文
- 頁數: 148
- ISBN: 7121437864
- ISBN-13: 9787121437861
-
相關分類:
Text-mining
立即出貨
買這商品的人也買了...
-
$480$379 -
$1,010自然語言處理綜論, 2/e (Speech and Language Processing, 2/e)
-
$704Python 和 NLTK 自然語言處理 (Natural Language Processing: Python and NLTK)
-
$403機器學習中的概率統計:Python 語言描述
-
$720$612 -
$403圖神經網絡:基礎與前沿
-
$1,000$850 -
$980$774 -
$680$578 -
$680$537 -
$305Python 中文自然語言處理基礎與實戰
-
$1,674$1,590 -
$1,200$792 -
$650$507 -
$551自然語言處理技術 — 文本信息抽取及應用研究
-
$1,200$948 -
$560與量子比特共舞
-
$505神經網絡與深度學習案例與實踐
-
$880$695 -
$779$740 -
$602因果推斷與機器學習
-
$449知識圖譜 — 面向科技文獻的構建技術與應用實踐
-
$454從零開始大模型開發與微調:基於 PyTorch 與 ChatGLM
-
$556大規模語言模型:從理論到實踐
-
$454ChatGLM3大模型本地化部署、應用開發與微調
相關主題
商品描述
文本語義向量化表示是指將自然語言編碼為電腦可處理的、蘊含語義特徵的向量的過程。在人工智能領域中,語義表示學習是實現機器理解自然語言的第一步,是機器處理文本數據和完成各種自然語言處理任務的基礎,其性能的優劣直接影響下游任務的效果。因此,語義表示學習具有重要的研究意義和實用價值。本文梳理了文本語義向量化表示的基礎理論,詳細介紹了分佈式表示方式、融合知識表示方法、任務導向的表示方法和預訓練語言模型等典型方法,並以機器閱讀理解任務為例,介紹了文本語義向量化表示在自然語言處理領域的實際應用。最後本文對文本語言向量化表示進行了總結和未來研究方向展望。
目錄大綱
第1章緒論 1
1.1 研究背景及意義 1
1.2 基本定義及問題描述 3
第2章語義表示學習的基礎信息 6
2.1 發展歷史 6
2.2 實際應用 8
第3章分佈表示方法 12
3.1 概述 12
3.2 基於矩陣分解的方法 15
3.3 基於神經網絡的方法 19
3.4 方法總結與對比 26
第4章預訓練語言模型 27
4.1 ELMo模型 27
4.2 GPT模型 28
4.3 BERT模型 29
4.4 RoBERTa模型 31
4.5 XLNet模型 32
4.6 方法總結與對比 33
第5章增強關聯模式的語義表示方法 35
5.1 引言 35
5.2 相關工作 37
5.3 預備知識 39
5.3.1 基於上下文信息的語義表示模型 39
5.3.2 關聯模式挖掘 40
5.4 增強關聯模式的語義表示模型 41
5.4.1 基於CBOW的APWE模型 42
5.4.2 基於Skip-gram的APWE模型 43
5.5 實驗 44
5.5.1 對比方法 45
5.5.2 實驗I:文本分類 45
5.5.3 實驗II:查詢詞擴展 48
5.5.4 參數分析 51
5.5.5 實例分析 52
5.6 本章小結 53
第6章基於知識的語義向量化表示 55
6.1 引言 55
6.2 相關工作 57
6.2.1 知識庫表示 57
6.2.2 知識與文本聯合表示 59
6.3 基於語義結構的語義表示模型 60
6.3.1 語義結構定義 60
6.3.2 SENSE模型 61
6.4 實驗 63
6.4.1 對比方法 64
6.4.2 參數設置 65
6.4.3 任務I:詞相似度測量 66
6.4.4 任務II:詞彙類比推理 67
6.4.5 任務III:文本分類 69
6.4.6 任務IV:查詢詞擴展 71
6.5 本章小結 73
第7章文本分類中任務導向的語義表示方法 74
7.1 引言 74
7.2 相關工作 76
7.3 任務導向的語義表示模型 78
7.3.1 語義特徵表示 78
7.3.2 任務特徵表示 78
7.3.3 聯合表示模型及優化 80
7.4 實驗 80
7.4.1 數據集 80
7.4.2 對比方法 82
7.4.3 實驗參數設置 82
7.4.4 整體評測效果 84
7.5 實例分析 87
7.6 本章小結 89
第8章文本語義向量化表示在機器閱讀理解任務中的應用 90
8.1 引言 90
8.2 機器閱讀理解 93
8.3 機器閱讀理解基礎方法 95
8.4 多粒度語義匹配的MGRC模型 96
8.4.1 多粒度語義表示 96
8.4.2 多粒度語義匹配 99
8.4.3 聯合模型及其優化 103
8.5 實驗 103
8.5.1 數據集 104
8.5.2 評測指標及對比方法 105
8.5.3 整體性能評測 106
8.5.4 參數分析 109
8.5.5 模塊有效性驗證 109
8.5.6 實例分析 113
8.6 本章小結 115
第9章總結與展望 116
9.1 本書總結 116
9.2 未來研究方向展望 117
參考文獻 119