Python機器學習實踐 Applied Machine Learning with Python

Andrea Giussani 余衛勇,劉強譯

  • 出版商: 機械工業
  • 出版日期: 2023-06-01
  • 定價: $534
  • 售價: 8.5$454
  • 語言: 簡體中文
  • 頁數: 164
  • 裝訂: 平裝
  • ISBN: 7111729862
  • ISBN-13: 9787111729860
  • 相關分類: Machine Learning
  • 立即出貨 (庫存 < 4)

相關主題

商品描述

本書提供了使用Python開發機器學習應用程序的基本原理。
主要內容包括:機器學習概念及其應用;數據預處理、降維;
各種線性模型、集成學習方法、隨機森林、提升方法;自然語言處理、深度學習等。
本書跟進了機器學習的最新研究成果,比如近幾年提出的著名算法XGBoost和CatBoost,以及SHAP值。
這些方法是機器學習領域中新穎且先進的模型。
本書目的是向讀者介紹從業人員採用的解決機器學習問題的主要現代算法,
跟踪機器學習領域研究前沿,並為初學者提供使用機器學習的方法。
本書覆蓋面廣,
對所有希望在數據科學和分析任務中使用機器學習的人來說,本書既是一本很好的學習資料,
同時也是一本實戰教程,其中介紹了多種統計模型,並提供了大量的相應代碼,以將這些概念一致地應用於實際問題。

目錄大綱

譯者的話
原書前言
第1章機器學習初步
1.1一個簡單的監督模型:最近鄰法
1.2數據預處理
1.2.1數據放縮
1.2.2數據高斯化:冪變換簡介
1.2.3類別變量的處理
1.2.4缺失值的處理
1.3不平衡數據的處理方法
1.3.1少數類的隨機過採樣
1.3.2多數類的隨機欠採樣
1.3.3合成少數類過採樣
1.4降維:主成分分析(PCA)
1.4.1使用PCA進行降維
1.4.2特徵提取
1.4.3非線性流形算法:t-SNE
第2章機器學習線性模型
2.1線性回歸
2.2收縮方法
2.2.1Ridge回歸(L2正則化)
2.2.2Lasso回歸(L1正則化)
2.2.3彈性網絡回歸
2.3穩健回歸
2.3.1Huber回歸
2.3.2RANSAC
2.4Logistic回歸
2.4.1Logistic回歸為什麼是線性的
2.4.2Logistic回歸預測(原始模型輸出)與概率(Sigmoid輸出)
2.4.3Python Logistic回歸
2.4.4模型性能評估
2.4.5正則化
2.5線性支持向量機
2.6逾越線性:核模型
2.6.1核技巧
2.6.2實際分類例子:人臉識別
第3章逾越線性:機器學習集成方法
3.1引言
3.2集成方法
3.2.1自舉聚合
3.2.2包外估計(Out-Of-Bag Estimation)
3.3隨機森林
3.3.1隨機森林分類
3.3.2隨機森林回歸
3.4提升(Boosting)方法
3.4.1AdaBoost算法
3.4.2梯度提升(Gradient Boosting)算法
3.4.3極端梯度提升(XGBoost)算法
3.4.4CatBoost算法
第4章現代機器學習技術
4.1自然語言處理初步
4.1.1文本數據預處理
4.1.2文本的數值表示:詞袋模型
4.1.3實際例子:使用IMDB電影評論數據集進行情感分析
4.1.4單詞頻率—逆文本頻率
4.1.5n-Grams模型
4.1.6詞嵌入
4.2深度學習初步
4.2.1用神經網絡處理複雜數據
4.2.2多分類
附錄
附錄APython速成教程
A.1Python構建塊
A.1.1變量
A.1.2方法與函數
A.2Python數據結構
A.2.1列表與元組
A.2.2集合
A.2.3字典
A.3Python循環
A.3.1for循環
A.3.2while循環
A.4Python高級數據結構
A.4.1列表推導式
A.4.2Lambda函數
A.5函數概念進階
A.5.1通配符在函數參數中的使用
A.5.2函數中的局部作用域與全局作用域
A.6面向對象編程簡介
A.6.1對象、類和屬性
A.6.2子類和繼承
附錄B詞袋模型的數學原理
參考文獻