自然語言表示學習 — 文本語義向量化表示研究與應用
黃河燕,劉茜
- 出版商: 電子工業
- 出版日期: 2022-09-01
- 定價: $414
- 售價: 8.5 折 $352
- 語言: 簡體中文
- 頁數: 148
- ISBN: 7121437864
- ISBN-13: 9787121437861
-
相關分類:
Natural Language Processing
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
初探機器學習|使用 Python (Thoughtful Machine Learning with Python)$480$379 -
自然語言處理綜論, 2/e (Speech and Language Processing, 2/e)$1,188$1,129 -
$704Python 和 NLTK 自然語言處理 (Natural Language Processing: Python and NLTK) -
$403機器學習中的概率統計:Python 語言描述 -
大數據淘金術:Python 機器學習高手實彈演練 (書況有些許瑕疵,不介意再下單)$720$504 -
$403圖神經網絡:基礎與前沿 -
深度強化式學習 (Deep Reinforcement Learning in Action)$1,000$790 -
資料密集型應用系統設計 (Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems)$980$774 -
自學機器學習 - 上 Kaggle 接軌世界,成為資料科學家$680$537 -
機器學習的統計基礎 : 深度學習背後的核心技術$680$537 -
$305Python 中文自然語言處理基礎與實戰 -
$1,423機器學習:貝葉斯和優化方法, 2/e (Machine Learning : A Bayesian and Optimization Perspective, 2/e) -
Google 翻譯實作:機器翻譯 NLP 基礎及模型親手打造$1,200$948 -
Solidity 實戰全書:完整掌握智能合約!成為獨立開發 Dapp 的區塊鏈工程師$650$507 -
$512自然語言處理技術 — 文本信息抽取及應用研究 -
AI 必須!從做中學貝氏統計 – 從事機器學習、深度學習、資料科學、大數據分析一定要懂的統計利器 (Bayesian Statistics for Beginners: A Step-By-Step Approach)$1,200$948 -
與量子比特共舞$659$626 -
Google 的軟體工程之道|從程式設計經驗中吸取教訓 (Software Engineering at Google)$880$695 -
深度強化學習$779$740 -
$449自然語言結構計算 GPF結構分析框架 -
$559因果推斷與機器學習 -
$528知識圖譜 — 面向科技文獻的構建技術與應用實踐 -
BERT 基礎教程:Transformer 大模型實戰$539$512 -
$417自然語言結構計算——BCC語料庫 -
$449自然語言結構計算——意合圖理論與技術
相關主題
商品描述
文本語義向量化表示是指將自然語言編碼為電腦可處理的、蘊含語義特徵的向量的過程。在人工智能領域中,語義表示學習是實現機器理解自然語言的第一步,是機器處理文本數據和完成各種自然語言處理任務的基礎,其性能的優劣直接影響下遊任務的效果。因此,語義表示學習具有重要的研究意義和實用價值。本文梳理了文本語義向量化表示的基礎理論,詳細介紹了分佈式表示方式、融合知識表示方法、任務導向的表示方法和預訓練語言模型等典型方法,並以機器閱讀理解任務為例,介紹了文本語義向量化表示在自然語言處理領域的實際應用。最後本文對文本語言向量化表示進行了總結和未來研究方向展望。
目錄大綱
第1章緒論 1
1.1 研究背景及意義 1
1.2 基本定義及問題描述 3
第2章語義表示學習的基礎信息 6
2.1 發展歷史 6
2.2 實際應用 8
第3章分佈表示方法 12
3.1 概述 12
3.2 基於矩陣分解的方法 15
3.3 基於神經網絡的方法 19
3.4 方法總結與對比 26
第4章預訓練語言模型 27
4.1 ELMo模型 27
4.2 GPT模型 28
4.3 BERT模型 29
4.4 RoBERTa模型 31
4.5 XLNet模型 32
4.6 方法總結與對比 33
第5章增強關聯模式的語義表示方法 35
5.1 引言 35
5.2 相關工作 37
5.3 預備知識 39
5.3.1 基於上下文信息的語義表示模型 39
5.3.2 關聯模式挖掘 40
5.4 增強關聯模式的語義表示模型 41
5.4.1 基於CBOW的APWE模型 42
5.4.2 基於Skip-gram的APWE模型 43
5.5 實驗 44
5.5.1 對比方法 45
5.5.2 實驗I:文本分類 45
5.5.3 實驗II:查詢詞擴展 48
5.5.4 參數分析 51
5.5.5 實例分析 52
5.6 本章小結 53
第6章基於知識的語義向量化表示 55
6.1 引言 55
6.2 相關工作 57
6.2.1 知識庫表示 57
6.2.2 知識與文本聯合表示 59
6.3 基於語義結構的語義表示模型 60
6.3.1 語義結構定義 60
6.3.2 SENSE模型 61
6.4 實驗 63
6.4.1 對比方法 64
6.4.2 參數設置 65
6.4.3 任務I:詞相似度測量 66
6.4.4 任務II:詞彙類比推理 67
6.4.5 任務III:文本分類 69
6.4.6 任務IV:查詢詞擴展 71
6.5 本章小結 73
第7章文本分類中任務導向的語義表示方法 74
7.1 引言 74
7.2 相關工作 76
7.3 任務導向的語義表示模型 78
7.3.1 語義特徵表示 78
7.3.2 任務特徵表示 78
7.3.3 聯合表示模型及優化 80
7.4 實驗 80
7.4.1 數據集 80
7.4.2 對比方法 82
7.4.3 實驗參數設置 82
7.4.4 整體評測效果 84
7.5 實例分析 87
7.6 本章小結 89
第8章文本語義向量化表示在機器閱讀理解任務中的應用 90
8.1 引言 90
8.2 機器閱讀理解 93
8.3 機器閱讀理解基礎方法 95
8.4 多粒度語義匹配的MGRC模型 96
8.4.1 多粒度語義表示 96
8.4.2 多粒度語義匹配 99
8.4.3 聯合模型及其優化 103
8.5 實驗 103
8.5.1 數據集 104
8.5.2 評測指標及對比方法 105
8.5.3 整體性能評測 106
8.5.4 參數分析 109
8.5.5 模塊有效性驗證 109
8.5.6 實例分析 113
8.6 本章小結 115
第9章總結與展望 116
9.1 本書總結 116
9.2 未來研究方向展望 117
參考文獻 119
