Python監督學習 Supervised Learning with Python: Concepts and Practical Implementation Using Python

Vaibhav Verdhan 譯 梁平、譚穎

  • Python監督學習-preview-1
  • Python監督學習-preview-2
  • Python監督學習-preview-3
Python監督學習-preview-1

相關主題

商品描述

主要內容 ● 綜述使用Python完成監督學習的基本構造塊和概念 ● 為結構化數據以及文本和圖像開發監督學習的解決方案 ● 解決過擬合、特徵工程、數據清理和交叉驗證等問題,構建**擬合模型 ● 瞭解從業務問題定義到模型部署和模型維護的端到端模型開發周期 ● 使用Python創建監督學習模型時,避免常見的陷阱並遵循**實踐

目錄大綱

 

目錄

 

 

 

 

 

第1章  監督學習簡介   1

1.1  什麽是機器學習   2

1.1.1  數據分析、數據挖掘、機器學習和人工智能之間的關系   2

1.1.2  數據、數據類型和數據源   4

1.2  機器學習與軟件工程的差異   6

1.3  機器學習的統計和數學概念   9

1.4  監督學習算法   15

1.4.1  回歸與分類問題   17

1.4.2  監督學習算法步驟   18

1.5  無監督學習算法   20

1.5.1  聚類分析   20

1.5.2  PCA   21

1.6  半監督學習算法   22

1.7  技術棧   22

1.8  機器學習的普及性   23

1.9  機器學習使用案例   24

1.10  小結   26

第2章  回歸分析監督學習   28

2.1  所需技術工具包   29

2.2  回歸分析及案例   29

2.3  什麽是線性回歸   30

2.4  度量回歸問題的有效性   34

2.4.1  案例1:創建簡單線性回歸   40

2.4.2  案例2:住宅數據集簡單線性回歸   42

2.4.3  案例3:住宅數據集多元線性回歸   47

2.5  非線性回歸分析   52

2.6  識別非線性關系   55

2.7  回歸模型面臨的挑戰   57

2.8  回歸的基於樹方法   59

2.9  案例分析:使用決策樹解決油耗問題   61

2.10  回歸的集成方法   64

2.11  案例分析:使用隨機森林解決油耗問題   66

2.12  基於樹方法的特徵選擇   69

2.13  小結   71

第3章  分類問題監督學習   73

3.1  所需技術工具包   74

3.2  假設檢驗及p值   74

3.3  分類算法   76

3.4  評估解決方案準確度   81

3.5  案例分析:信用風險   84

3.6  分類的樸素貝葉斯方法   95

3.7  案例分析:人口普查數據的收入預測   97

3.8  分類的k最近鄰方法   104

3.9  案例分析:k最近鄰   107

3.9.1  數據集   108

3.9.2  業務目標   108

3.10  分類的基於樹算法   114

3.11  決策樹算法類型   117

3.12  小結   120

第4章  監督學習高級算法   123

4.1  所需技術工具   124

4.2  提升算法   124

4.3  支持向量機(SVM)   135

4.3.1  二維空間的SVM   136

4.3.2  KSVM   137

4.3.3  使用SVM的案例分析   139

4.4  非結構化數據的監督學習算法   144

4.5  文本數據   144

4.5.1  文本數據案例   145

4.5.2  文本數據面臨的挑戰   146

4.5.3  文本分析建模過程   147

4.5.4  文本數據提取及管理   149

4.5.5  文本數據預處理   150

4.5.6  從文本數據提取特徵   152

4.6  案例分析:採用自然語言處理的客戶投訴分析   156

4.7  案例分析:採用詞嵌入的客戶投訴分析   160

4.8  圖像數據   163

4.8.1  圖像數據案例   164

4.8.2  圖像數據面臨的挑戰   165

4.8.3  圖像數據管理過程   166

4.8.4  圖像數據建模過程   167

4.9  深度學習基礎   167

4.9.1  人工神經網絡   167

4.9.2  激活函數   169

4.9.3  神經網絡的損失函數   171

4.9.4  神經網絡優化   172

4.9.5  神經網絡訓練過程   173

4.10  案例分析1:在結構化數據上建立分類模型   176

4.11  案例分析2:圖像分類模型   180

4.12  小結   185

第5章  端到端模型開發   187

5.1  所需技術工具   188

5.2  機器學習模型開發   188

5.3  步驟1:定義業務問題   189

5.4  步驟2:數據發現階段   190

5.5  步驟3:數據清理和準備   193

5.5.1  數據集中的重復值   194

5.5.2  數據集的分類變量處理   195

5.5.3  數據集中存在的缺失值   197

5.6  數據集中的不平衡   202

5.7  數據集中的離群值   205

5.8  數據集中其他常見問題   207

5.9  步驟4:EDA   209

5.10  步驟5:機器學習模型構建   215

5.10.1  數據訓練/測試集分割   215

5.10.2  為分類算法找到最佳閾值   219

5.10.3  過擬合與欠擬合問題   219

5.10.4  關鍵利益相關人討論並迭代   223

5.10.5  提交最終模型   223

5.11  步驟6:模型部署   223

5.12  步驟7:文檔化   229

5.13  步驟8:模型更新和維護   229

5.14  小結   230