動手學圖機器學習 Graph-Powered Machine Learning

Alessandro Negro 郭濤 譯

  • 動手學圖機器學習-preview-1
  • 動手學圖機器學習-preview-2
  • 動手學圖機器學習-preview-3
動手學圖機器學習-preview-1

商品描述

識別關系是機器學習的基礎。通過識別和分析數據中的關系,以圖為核心的算法(如K-鄰近或PageRank)顯著提高了機器學習應用的效率。基於圖的機器學習技術以全新方式為社交網絡、欺詐檢測、自然語言處理和推薦系統等領域的機器學習提供了強有力的支持。   《動手學圖機器學習》是行業類的**書籍,旨在傾授如何利用面向圖的機器學習算法和工具,充分挖掘結構化和非結構化數據集中的自然關系,讀者可以從中吸收圖架構和圖設計實踐的精髓,並學會從容避開常見的陷阱。作者Alessandro Negro通過真實的應用示例,將GraphML(一種圖建模語言)概念與實際任務完美聯系起來,使讀者能夠更好地理解圖技術在機器學習中的價值,並熟練應用該技術。 ● 大數據平臺中的圖 ● 推薦、自然語言處理、欺詐檢測 ● 圖算法 ● 與Neo4j圖數據庫協作

目錄大綱

目 錄

第Ⅰ部分 導論

第1 章 機器學習和圖:介紹 3

1.1 機器學習項目生命周期   5

1.1.1 業務理解    6

1.1.2 數據理解    6

1.1.3 數據預處理     7

1.1.4 建模      7

1.1.5 評估      8

1.1.6 部署      8

1.2 機器學習挑戰  8

1.2.1 事實來源    8

1.2.2 性能      11

1.2.3 存儲模型    11

1.2.4 即時性    12

1.3 圖    12

1.3.1 什麽是圖   12

1.3.2 圖作為網絡模型  15

1.4 圖在機器學習中的作用  20

1.4.1 數據管理   21

1.4.2 數據分析   21

1.4.3 數據可視化    22

1.5 本書心智模型    22

1.6 本章小結    23

第2 章 圖數據工程  24

2.1 處理大數據   26

2.1.1 數量     27

2.1.2 速度     29

2.1.3 多樣性    31

2.1.4 真實性    32

2.2 大數據平臺中的圖  33

2.2.1 圖對於大數據很有價值   34

2.2.2 圖對於主數據管理意義重大   40

2.3 圖數據庫    44

2.3.1 圖數據庫管理    45

2.3.2 分片      47

2.3.3 復制      49

2.3.4 原生與非原生圖數據庫   51

2.3.5 標簽屬性圖     55

2.4 本章小結    56

第3 章 圖在機器學習應用中的作用 58

3.1 機器學習工作流中的圖  59

3.2 管理數據源   61

3.2.1 監控目標    64

3.2.2 檢測欺詐    67

3.2.3 識別供應鏈中的風險    69

3.2.4 推薦條目    70

3.3 算法    76

3.3.1 識別供應鏈中的風險    76

3.3.2 在文檔中查找關鍵詞    78

3.3.3 監控目標    80

3.4 存儲並訪問機器學習模型  81

3.4.1 推薦條目    82

3.4.2 監控目標    84

3.5 可視化     87

3.6 剩餘部分:深度學習和圖神經網絡    89

3.7 本章小結    91

第Ⅱ部分 推薦

第4 章 基於內容的推薦   97

4.1 表示條目特徵  99

4.2 對用戶進行建模   112

4.3 提供推薦   118

4.4 圖方法的優點   137

4.5 本章小結   137

第5 章 協同過濾   138

5.1 協同過濾推薦   141

5.2 為User-Item 數據集創建二部圖    142

5.3 計算最近鄰網絡   147

5.4 提供推薦   156

5.5 處理冷啟動問題   161

5.6 圖方法的優點   164

5.7 本章小結   165

第6 章 基於會話的推薦  166

6.1 基於會話的方法   166

6.2 事件鏈和會話圖   169

6.3 提供推薦   174

6.3.1 基於條目的k-NN    175

6.3.2 基於會話的k-NN    180

6.4 圖方法的優點   185

6.5 本章小結   185

第7 章 上下文感知和混合推薦  186

7.1 基於上下文的方法  186

7.1.1 表示上下文信息    189

7.1.2 提供推薦    193

7.1.3 圖方法的優點   208

7.2 混合推薦引擎   209

7.2.1 多模型,單圖   210

7.2.2 提供推薦    212

7.2.3 圖方法的優點   214

7.3 本章小結   214

第Ⅲ部分 打擊欺詐

第8 章 圖欺詐檢測的基本方法  217

8.1 欺詐預防和檢測   218

8.2 圖在打擊欺詐行為中的作用      222

8.3 鋪墊:基本方法   229

8.3.1 尋找信用卡詐騙的源頭    229

8.3.2 識別欺詐環     236

8.3.3 圖方法的優點    242

8.4 本章小結    242

第9 章 基於鄰近算法   243

9.1 基於鄰近算法:介紹    244

9.2 基於距離的方法   245

9.2.1 將交易存儲為圖     247

9.2.2 創建k 最近鄰圖     248

9.2.3 識別欺詐交易    255

9.2.4 圖方法的優點    263

9.3 本章小結    263

第10 章 社交網絡分析反欺詐  264

10.1 社交網絡分析概念  266

10.2 基於分數的方法   269

10.2.1 鄰域度量    272

10.2.2 中心性指標   278

10.2.3 集體推理算法    285

10.3 基於聚類的方法   289

10.4 圖的優點    293

10.5 本章小結    294

第Ⅳ部分 用圖訓練文本

第11 章 基於圖的自然語言處理 297

11.1 一個基本方法:存儲和訪問單詞序列    300

11.2 NLP 和圖    309

11.3 本章小結    322

第12 章 知識圖譜    323

12.1 知識圖譜:介紹   323

12.2 知識圖譜構建:實體   327

12.3 知識圖譜構建:關系   334

12.4 語義網絡    341

12.5 無監督關鍵字提取 346

12.5.1 關鍵字共現圖   353

12.5.2 聚類關鍵字和主題識別  354

12.6 圖方法的優點   357

12.7 本章小結   357

附錄A 機器學習算法分類  359

附錄B Neo4j     362

附錄C 處理圖模式和工作流  374

附錄D 表示圖   381