文本大數據分析方法及應用--基於主題模型與機器學習理論
呂曉玲
- 出版商: 機械工業
- 出版日期: 2025-02-01
- 售價: $294
- 貴賓價: 9.5 折 $279
- 語言: 簡體中文
- 頁數: 159
- ISBN: 7111769813
- ISBN-13: 9787111769811
-
相關分類:
大數據 Big-data、Data Science、Machine Learning
立即出貨 (庫存 < 4)
商品描述
本書是基於作者多年來對於文本大數據的研究成果創作完成,主要分為兩部分內容。第一部分包括前5章,基於主題模型,首先介紹了基礎的主題模型及其推論、評估方法,然後介紹了多語料聯合、動態稀疏等多角度的主題模型,以及主題模型的變點檢測方法。第二部分包括後3章,基於機器學習和深度學習模型,包括文本分層分類模型、異質圖新聞推薦模型以及基於多層級資訊的多模態屬性級情緒分析模型。書中每種方法均配有實際分析案例。本書對文本分析方法的理論研究與實務應用有重要參考價值,可作為大學相關專業高年級本科生或研究生的入門教材,也可作為從事相關技術研發的開發人員的參考書。
目錄大綱
前言
第1章 主題模型簡介
1.1 基本概念與符號
1.2 基礎主題模型
1.2.1 LDA模型
1.2.2 DTM模型
1.3 參數推斷方法
1.3.1 變分貝葉斯
1.3.2 Gibbs抽樣
1.4 評價指標
1.4.1 評價模型的泛化能力
1.4.2 評價主題內部的一致性
1.4.3 評價不同主題間的相似性
1.5 實例應用
1.6 模型拓展
1.6.1 短文本建模
1.6.2 有監督模型
1.6.3 詞向量主題模型
參考文獻
附錄:Dirichlet-Multinomial共軛結構
第2章 多語料聯合主題模型
2.1 基本概念與符號
2.2 多語料聯合主題模型
2.2.1 模型生成過程
2.2.2 最大熵模型
2.3 參數推斷方法
2.3.1 模型推斷
2.3.2 超參確定
2.4 實例應用
2.4.1 保養品資料集
2.4.2 連鎖日本餐廳資料集
2.5 討論
參考文獻
第3章 動態稀疏主題模型
3.1 基本概念與符號
3.2 動態稀疏主題模型
3.2.1 模型介紹
3.2.2 模型生成過程
3.3 參數推斷方法
3.3.1 零階坍塌變分貝葉斯推論演算法
3.3.2 參數估計
3.3.3 推斷演算法
3.4 實例應用
3.4.1 JASA資料集
3.4.2 研究生論文語料庫
3.5 討論
參考文獻
第4章 動態稀疏聯合主題模型
4.1 基本概念與符號
4.2 動態稀疏聯合主題模型
4.3 參數推斷方法
4.3.1 變分貝葉斯EM演算法
4.3.2 變分卡爾曼濾波演算法
4.3.3 推斷演算法
4.4 實例應用
4.5 討論
參考文獻
第5章 混合貝葉斯變點檢測模型
5.1 基本概念與符號
5.2 混合貝葉斯變點檢測模型
5.3 參數推斷方法
5.4 實例應用
5.4.1 亞馬遜評論資料集
5.4.2 期刊資料集
5.4.3 聯合國數據集
5.5 討論
參考文獻
第6章 文本分層分類模型
6.1 基本概念與符號
6.2 文本分層分類模型
6.2.1 H.S.性質
6.2.2 分層結構中節點間的不相似度
6.2.3 基於角的分層分類器
6.3 模型求解演算法
6.3.1 標籤嵌入法
6.3.2 線性損失
6.4 實例應用
6.4.1 評價指標
6.4.2 實證分析
6.5 討論
參考文獻
第7章 異質圖新聞推薦模型
7.1 基本概念與符號
7.2 異質圖新聞推薦模型
7.2.1 準備知識
7.2.2 模型簡介
7.2.3 節點特徵準備
7.2.4 異質鄰居採樣
7.2.5 資訊聚合與預測
7.3 實例應用
7.3.1 資料集與比較模型
7.3.2 實驗結果
7.4 討論
參考文獻
第8章 基於多層級資訊的多模態屬性級情緒分析模型
8.1 基本概念與符號
8.2 基於多層級資訊的多模態屬性層級情緒分析模型
8.2.1 基礎模型
8.2.2 多模態聯合模型
8.3 實例應用
8.3.1 資料集介紹
8.3.2 評估指標
8.3.3 基線模型
8.3.4 實驗結果
8.4 討論
參考文獻