個人化機器學習 Personalized Machine Learning

Julian McAuley 譯 陳小青//潘微科//明仲

  • 出版商: 機械工業
  • 出版日期: 2024-10-15
  • 定價: $594
  • 售價: 8.5$505
  • 語言: 簡體中文
  • 頁數: 219
  • 裝訂: 平裝
  • ISBN: 7111762274
  • ISBN-13: 9787111762270
  • 相關分類: Machine Learning
  • 此書翻譯自: Personalized Machine Learning
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

本書主要介紹支援各種設定和模態的個人化預測模型設計的通用原理和方法。
首先修訂「傳統」機器學習模型,重點關注如何使它們適應涉及用戶資料的設置,
接著介紹基於矩陣分解、深度學習和生成式建模等高階原理的技術,最後詳細研究部署個人化預測系統的影響和風險。

目錄大綱

譯者序
前言
常用數學符號
常用縮寫
第1章 引言 1
1.1 本書寫作目的 1
1.2 對於學習者:涵蓋的內容和未涵蓋的內容 2
1.3 對於講師:課程與內容大綱 3
1.4 線上資源 4
1.5 關於作者 5
1.6 日常生活中的個人化 5
1.6.1 推薦 5
1.6.2 個人化健康 6
1.6.3 計算社會科學 6
1.6.4 語言生成、個人化對話和互動式代理 7
1.7 個人化技術 7
1.7.1 作為流形的使用者表示 7
1.7.2 情境個人化與基於模型的個人化 8
1.8 個性化的倫理與影響 8
第一部 機器學習入門
第2章 回歸與特徵工程 12
2.1 線性迴歸 13
2.2 評估迴歸模型 16
2.2.1 均方誤差 16
2.2.2 為什麼是均方誤差 17
2.2.3 模型參數的極大似然估計 18
2.2.4 決定係數R2 19
2.2.5 如果誤差不是常態分佈該怎麼辦 20
2.3 特徵工程 21
2.3.1 簡單特徵變換 21
2.3.2 二元特徵與分類特徵:獨熱編碼 22
2.3.3 缺失特徵 24
2.3.4 時序特徵 25
2.3.5 輸出變數的轉換 26
2.4 解釋線性模型參數 27
2.5 梯度下降擬合模型 28
2.6 非線性迴歸 29
習題 30
項目1:計程車小費預測(第1部分) 31
第3章 分類與學習流程 32
3.1 對數幾率迴歸 32
3.1.1 擬合對數幾率迴歸器 34
3.1.2 小結 34
3.2 其他分類技術 34
3.3 評估分類模型 35
3.3.1 分類的平衡量測 36
3.3.2 優化平衡錯誤率 37
3.3.3 使用和評估用於排名的分類器 38
3.4 學習流程 41
3.4.1 泛化、過擬合與欠擬合 41
3.4.2 模型複雜度與正規化 43
3.4.3 模型流程準則 46
3.4.4 使用TensorFlow的迴歸與分類 47
3.5 實現學習流程 48
習題 51
項目2:計程車小費預測(第2部分) 52
第二部 個人化機器學習的
基礎知識
第4章 推薦系統簡介 54
4.1 基本設定與問題定義 54
4.2 交互資料的表示 56
4.3 基於記憶的推薦方法 57
4.3.1 定義相似度函數 57
4.3.2 杰卡德相似度 58
4.3.3 餘弦相似度 60
4.3.4 皮爾遜相似度 62
4.3.5 使用相似度測量法進行評分預測 64
4.4 隨機遊走法 65
4.5 案例研究:Amazon.com的推薦 67
習題 68
項目3:針對書籍的推薦系統
(第1部分) 69
第5章 基於模型的推薦方法 70
5.1 矩陣分解 71
5.1.1 擬合潛在因子模型 73
5.1.2 使用者特徵或物品特徵發生了什麼變化 75
5.2 隱式回饋與排序模型 76
5.2.1 樣本重加權方案 76
5.2.2 貝葉斯個人化排序 77
5.3 基於「無用戶」模型的方法 79
5.3.1 稀疏線性方法 80
5.3.2 分解的物品相似度模型 81
5.3.3 其他無使用者方法 81
5.4 評估推薦系統 82
5.4.1 精確率@K和召回率@K 83
5.4.2 平均倒數排名 83
5.4.3 累積增益和NDCG 84
5.4.4 模型準確率以外的評估指標 84
5.5 用於建議的深度學習 84
5.5.1 為什麼是內積 84
5.5.2 基於多層感知機的建議 85
5.5.3 基於自編碼器的推薦 87
5.5.4 卷積與循環網路 88
5.5.5 基於深度學習的推薦器能多有效 88
5.6 檢索 89
5.7 線上更新 90
5.8 Python中帶有Surprise庫和Implicit庫的推薦系統 90
5.8.1 潛在因子模型 91
5.8.2 貝葉斯個性化排序 91
5.8.3 在TensorFlow中實現潛在因子模型 92
5.8.4 TensorFlow中的貝葉斯個人化排序 92
5.8.5 基於批次的高效優化 93
5.9 超越推薦的「黑盒子」觀點 94
5.10 歷史與新興方向 94
習題 95
項目4:針對書籍的推薦系統
(第2部分) 96
第6章 推薦系統中的內容與結構 97
6.1 分解機 98
6.1.1 神經因子分解機 99
6.1.2 在Python中使用FastFM的分解機 99
6.2 冷啟動推薦 100
6.2.1 用邊資訊解決冷啟動問題 101
6.2.2 透過問卷解決冷啟動問題 101
6.3 多邊推薦 102
6.3.1 線上交友 102
6.3.2 易貨平台 103
6.4 群體感知推薦與社交感知推薦 104
6.4.1 社交感知推薦 104
6.4.2 社交貝葉斯個人化排序 106
6.4.3 群體感知推薦 107
6.4.4 群體貝葉斯個性化排序 108
6.5 推薦系統中的價格動態 109
6.5.1 分離價格與偏好 109
6.5.2 在會話中估計願意支付的價格 110
6.5.3 價格敏感度與價格彈性 111
6.6 推薦中的其他上下文特徵 112
6.6.1 音樂與音頻 112
6.6.2 基於位置的網路中的推薦 113
6.6.3 時序、文本與視覺特徵 114
6.7 網路廣告 114
6.7.1 匹配問題 115
6.7.2 AdWords 115
習題 117
項目5:Amazon上的冷啟動推薦 118
第7章 時序與序列模型 119
7.1 時間序列迴歸簡介 119
7.2 推薦系統中的時序動態 121
7.2.1 時序推薦方法 122
7.2.2 個案研究:時序推薦與Netflix競賽 123
7.2.3 關於時序模型Netflix能教我們什麼 126
7.3 時序動態的其他方法 126
7.3.1 意見的長期動態 127
7.3.2 短期動態與基於會話的建議 127
7.3.3 使用者層面的時間演變 128
7.4 個性化馬可夫鏈 129
7.5 案例研究:用於推薦的馬可夫鏈模型 130
7.5.1 分解的個人化馬可夫鏈 130
7.5.2 社交感知的序列推薦 131
7.5.3 基於局部性的序列推薦 132
7.5.4 基於平移的推薦 133
7.5.5 TensorFlow實現FPMC 134
7.6 循環網路 135
7.7 基於神經網路的序列推薦 137
7.7.1 基於循環網路的推薦 139
7.7.2 注意力機制 139
7.7.3 小結 140
7.8 案例研究:個人化心率建模 141
7.9 個性化時序模型的歷史 142
習題 142
項目6:商業評論中的時序和
序列動態 143
第三部分 個人化機器學習的
新興方向
第8章 文本個人化模型 146
8.1 文本建模基礎:詞袋模型 146
8.1.1 情感分析 146
8.1.2 N-gram 149
8.1.3 詞相關性與文件相似度 151
8.1.4 使用tf-idf進行搜尋與檢索 153
8.2 分佈式字詞及物品表示 153
8.2.1 item2vec 155
8.2.2 使用Gensim實作word2vec和item2vec 155
8.3 個人化情感與推薦 156
8.4 個人化文本生成 158
8.4.1 基於RNN的評論生成 160
8.4.2 案例研究:個人化食譜生成 161
8.4.3 基於文本的解釋與證明 162
8.4.4 對話式推薦 163
8.5 案例研究:Google Smart Reply 165
習題 166
項目7:個人化文件檢索 167
第9章 視覺資料個人化模型 168
9.1 個人化影像搜尋與檢索 168
9.2 視覺感知推薦與個人化排序 169
9.3 案例研究:視覺和時尚相容性 171
9.3.1 從共同購買估計相容性 171
9.3.2 在開放場景的圖像中學習相容性 173
9.3.3 生成時尚衣櫃 174
9.3.4 時尚以外的領域 175
9.3.5 可替代和互補產品推薦的其他技術 175
9.3.6 在TensorFlow中實作相容模型 177
9.4 影像的個人化生成模型 178
習題 179
項目8:生成相容的服裝搭配 180
第10章 個人化機器學習的影響 182
10.1 度量多樣性 183
10.2 過濾氣泡、多樣性和極端化 184
10.2.1 透過模擬探索多樣性 184
10.2.2 實證度量推薦多樣性 185
10.2.3 審核極端內容的途徑 185
10.3 多樣化技術 186
10.3.1 最大邊緣相關 186
10.3.2 多樣化推薦的其他重排序方法 187
10.3.3 行列式點過程 187
10.4 實作一個多樣化推薦器 189
10.5 關於推薦與消費多樣性的案例研究 191
10.5.1 Spotify上的多樣性 191
10.5.2 過濾氣泡與線上新聞消費 192
10.6 準確率以外的其他指標 194
10.6.1 驚喜度 194
10.6.2 意外度 195
10.6.3 校準 196
10.7 公平性 197
10.7.1 多方面公平性 198
10.7.2 在TensorFlow中實現公平性目標 199
10.8 關於推薦中性別偏置的案例研究 200
10.8.1 資料重採樣與流行度偏壓 200
10.8.2 書籍推薦中的偏置與作者性別 201
10.8.3 行銷中的性別偏置 201
習題 202
項目9:多元化和公平推薦 203
參考文獻 204