大數據分析的九堂數學課 Mathematical Foundations of Big Data Analytics

Vladimir Shikhman, David Müller 李澤宇 譯

  • 大數據分析的九堂數學課-preview-1
  • 大數據分析的九堂數學課-preview-2
  • 大數據分析的九堂數學課-preview-3
大數據分析的九堂數學課-preview-1

相關主題

商品描述

本書分為10章,其中第1~9章探討了排序、推薦系統、聚類、線性回歸等內容,每章都以一個具體的實際問題開始,其主要目的是激發對某一特定大數據分析技術的研究。接下來探討其背後的數學原理——包括重要的定義、輔助陳述和得出的結論。案例研究有助於將所學知識應用於跨學科的環境中,包括對逐步任務的描述和有用的提示。每章之後都配有習題,作為自學中不可缺少的一部分,有助於提高對基礎理論的理解。第10章提供了前9章的習題答案,以及Python代碼中的算法描述作為補充材料。本書適合作為大數據分析、應用數學及相關專業的研究生和高年級本科生。

目錄大綱

 

目   錄

第1章  排序  1

1.1  研究動因:谷歌問題  1

1.2  研究結果  4

1.2.1  Perron-Frobenius定理  4

1.2.2  PageRank  8

1.3  案例研究:品牌忠誠度  14

1.4  練習  17

第2章  在線學習  19

2.1  研究動因:投資組合選擇  19

2.2  研究結果  22

2.2.1  在線鏡像下降  22

2.2.2  熵設定  29

2.3  案例分析:專家建議  33

2.4  練習  34

第3章  推薦系統  37

3.1  研究動因:Netflix大賽  37

3.2  研究結果  38

3.2.1  基於近鄰的方法  38

3.2.2  基於模型的方法  41

3.3  案例分析:潛在語義分析  52

3.4  練習  54

第4章  分類  56

4.1  研究動因:信用調查  56

4.2  研究結果  57

4.2.1  Fisher判別規則  57

4.2.2  支持向量機  64

4.3  案例分析:質量控制  72

4.4  練習  74

第5章  聚類  77

5.1  研究動因:DNA測序  77

5.2  研究結果  79

5.2.1  k-均值算法  79

5.2.2  譜聚類  82

5.3  案例分析:主題抽取  88

5.4  練習  91

第6章  線性回歸  93

6.1  研究動因:計量經濟學分析  93

6.2  研究結果  95

6.2.1  最小二乘法  95

6.2.2  嶺回歸  102

6.3  案例分析:資本資產定價  107

6.4  練習  109

第7章  稀疏恢復  112

7.1  研究動因:變量選擇  112

7.2  研究結果  114

7.2.1  Lasso回歸  114

7.2.2  迭代閾值收縮算法  119

7.3  案例分析:壓縮感知  124

7.4  練習  126

第8章  神經網絡  127

8.1  研究動因:神經細胞  127

8.2  研究結果  129

8.2.1  邏輯回歸  129

8.2.2  感知機  135

8.3  案例分析:垃圾郵件過濾  140

8.4  練習  143

第9章  決策樹  145

9.1  研究動因:泰坦尼克號幸存率  145

9.2  研究結果  148

9.2.1  NP完全性  148

9.2.2  自上而下的和自下而上的啟發式算法  154

9.3  案例研究:國際象棋引擎  157

9.4  練習  160

第10章  練習題解  163

10.1  排序  163

10.2  在線學習  169

10.3  推薦系統  174

10.4  分類  182

10.5  聚類  189

10.6  線性回歸  198

10.7  稀疏恢復  205

10.8  神經網絡  210

10.9  決策樹  216  

參考文獻  228

索引  231

英文索引  236