機器學習基礎(第2版·題庫·微課視頻版)

呂雲翔 王淥汀 袁琪 許麗華 王志鵬 任昌禹

  • 出版商: 清華大學
  • 出版日期: 2024-06-01
  • 定價: $354
  • 售價: 8.5$301
  • 語言: 簡體中文
  • ISBN: 7302664099
  • ISBN-13: 9787302664093
  • 相關分類: Machine Learning
  • 下單後立即進貨 (約4週~6週)

  • 機器學習基礎(第2版·題庫·微課視頻版)-preview-1
  • 機器學習基礎(第2版·題庫·微課視頻版)-preview-2
  • 機器學習基礎(第2版·題庫·微課視頻版)-preview-3
機器學習基礎(第2版·題庫·微課視頻版)-preview-1

相關主題

商品描述

本書以機器學習算法為主題,詳細介紹算法的理論細節與應用方法。全書共19章,分別介紹了邏輯回歸及**熵模型、k近鄰模型、決策樹模型、樸素貝葉斯分類器模型、支持向量機模型、集成學習框架、EM算法、降維算法、聚類算法、神經網絡模型等基礎模型或算法,以及8個綜合項目實例。本書重視理論與實踐相結合,希望為讀者提供全面而細致的學習指導。 本書適合機器學習初學者、相關行業從業人員以及高等院校電腦科學與技術、軟件工程等相關專業的師生閱讀。

目錄大綱

目錄

隨書資源

第1章機器學習概述

1.1機器學習的組成

1.2分類問題及回歸問題

1.3監督學習、半監督學習和無監督學習

1.4生成模型及判別模型

1.5模型評估

1.5.1訓練誤差及泛化誤差

1.5.2過擬合及欠擬合

1.6正則化

1.7Scikitlearn模塊

1.7.1數據集

1.7.2模型選擇

習題1

第2章邏輯回歸及最大熵模型

2.1線性回歸

2.1.1一元線性回歸

2.1.2多元線性回歸

2.2廣義線性回歸

2.2.1邏輯回歸

2.2.2多分類邏輯回歸

2.2.3交叉熵損失函數

2.3最大熵模型

2.3.1最大熵模型的導出

2.3.2最大熵模型與邏輯回歸之間的關系

2.4評價指標

2.4.1混淆矩陣

2.4.2準確率

2.4.3精確率與召回率

2.4.4PR曲線

2.4.5ROC曲線

2.5實例: 基於邏輯回歸實現乳腺癌預測

習題2

第3章k近鄰算法

3.1k值的選取

3.2距離的度量

3.3快速檢索 

3.4實例: 基於k近鄰算法實現鳶尾花分類

習題3

第4章決策樹

4.1特徵選擇

4.1.1信息增益

4.1.2信息增益比

4.2決策樹生成算法CART

4.3決策樹剪枝

4.3.1預剪枝

4.3.2後剪枝

4.4實例: 基於決策樹實現葡萄酒分類

習題4

第5章樸素貝葉斯分類器

5.1極大似然估計

5.2樸素貝葉斯分類

5.3拉普拉斯平滑

5.4樸素貝葉斯分類器的極大似然估計解釋

5.5實例: 基於樸素貝葉斯實現垃圾短信分類

習題5

第6章支持向量機

6.1最大間隔及超平面

6.2線性可分支持向量機

6.3線性支持向量機

6.4合頁損失函數

6.5核技巧

6.6二分類問題與多分類問題

6.6.1一對一

6.6.2一對多

6.6.3多對多

6.7實例: 基於支持向量機實現葡萄酒分類

習題6

第7章集成學習

7.1偏差與方差

7.2Bagging及隨機森林

7.2.1Bagging

7.2.2隨機森林

7.3Boosting及AdaBoost

7.3.1Boosting

7.3.2AdaBoost

7.4提升樹

7.4.1殘差提升樹

7.4.2GBDT

7.4.3XGBoost

7.5Stacking

7.6實例: 基於梯度下降樹實現波士頓房價預測

習題7

第8章EM算法及其應用

8.1Jensen不等式

8.2EM算法

8.3高斯混合模型(GMM)

8.4隱馬爾可夫模型

8.4.1計算觀測概率的輸出

8.4.2估計隱馬爾可夫模型的參數

8.4.3隱變量序列預測

8.5實例: 基於高斯混合模型實現鳶尾花分類

習題8

第9章降維

9.1主成分分析

9.1.1方差即協方差的無偏估計

9.1.2實例: 基於主成分分析實現鳶尾花數據降維

9.2奇異值分解

9.2.1奇異值分解的構造

9.2.2奇異值分解用於數據壓縮

9.2.3SVD與PCA的關系

9.2.4奇異值分解的幾何解釋

9.2.5實例: 基於奇異值分解實現圖片壓縮

習題9

第10章聚類

10.1距離度量

10.1.1閔可夫斯基距離

10.1.2餘弦相似度

10.1.3馬氏距離

10.1.4漢明距離

10.2層次聚類

10.3KMeans聚類

10.4KMedoids聚類

10.5DBSCAN

10.6實例: 基於KMeans實現鳶尾花聚類

習題10

第11章神經網絡與深度學習

11.1神經元模型

11.2多層感知機

11.3損失函數

11.4反向傳播算法

11.4.1梯度下降法

11.4.2梯度消失及梯度爆炸

11.5捲積神經網絡

11.5.1捲積

11.5.2池化

11.5.3網絡架構

11.6循環神經網絡

11.7生成對抗網絡

11.8圖捲積神經網絡

11.9深度學習發展

11.10實例: 基於捲積神經網絡實現手寫數字識別

11.10.1MNIST數據集

11.10.2基於捲積神經網絡的手寫數字識別

習題11

第12章案例: 用戶流失預警

12.1讀入數據

12.2數據預處理和自變量標準化

12.3五折交叉驗證

12.4代入三種模型

12.5調整prob閾值,輸出精度評估

第13章案例: 基於回歸問題和XGBoost模型的房價預測

13.1XGBoost模型介紹

13.2技術方案

13.2.1數據分析

13.2.2XGBoost模型參數

13.2.3調參過程

13.3完整代碼及結果展示

第14章案例: 基於KMeans算法的鳶尾花數據聚類和可視化

14.1數據及工具簡介

14.1.1Iris數據集(鳶尾花數據集)

14.1.2Tkinter

14.2案例分析

14.2.1模塊引入

14.2.2佈局圖形界面

14.2.3讀取數據文件

14.2.4聚類

14.2.5聚類結果可視化

14.2.6誤差分析及其可視化

14.2.7使用流程

第15章案例: 影評數據分析與電影推薦

15.1明確目標與準備數據

15.2工具選擇

15.3初步分析

15.3.1用戶角度分析

15.3.2電影角度分析

15.4電影推薦

第16章案例: 股價預測

16.1使用Tsfresh進行升維和特徵工程

16.2程序設計思路

16.3程序設計步驟

16.3.1讀入並分析數據

16.3.2移窗

16.3.3升維

16.3.4方差過濾

16.3.5使用AdaBoostRegressor模型進行回歸預測

16.3.6預測結果分析

第17章案例: 使用CRF實現命名實體識別

17.1模型定義

17.2數據預處理

17.3模型訓練

17.4模型預測

第18章案例: 利用手機的購物評論分析手機特徵

18.1數據準備

18.2數據分析

18.2.1模型介紹

18.2.2算法應用

18.2.3名詞提取

18.2.4情感分析

第19章案例: 基於CNN的手寫數字識別

19.1MINST數據集介紹與分析

19.2基於 CNN 的構建與訓練

參考文獻