機器學習 — 原理、算法與 Python 實戰 (微課視頻版)
姚捃、劉華春、侯向寧
- 出版商: 清華大學
- 出版日期: 2022-09-01
- 定價: $359
- 售價: 8.5 折 $305
- 語言: 簡體中文
- ISBN: 7302616604
- ISBN-13: 9787302616603
-
相關分類:
Machine Learning
下單後立即進貨 (約4週~6週)
買這商品的人也買了...
-
$203大數據分析 : 數據挖掘必備算法示例詳解
-
$420$328 -
$454區塊鏈財稅管理與 Corda 開發指南
-
$407Python 在機器學習中的應用
-
$356用數據提升人力資源管理效能 實戰案例版 第2版
-
$500一本書讀懂稅務籌劃與風險控制
-
$479$455 -
$600$570 -
$414$393 -
$299$284 -
$594$564 -
$534$507 -
$505數據產品經理:解決方案與案例分析
-
$630$599 -
$250文本挖掘與信息檢索概論
-
$594$564 -
$403$379 -
$1,000$850 -
$894$849 -
$505Python 機器學習:基礎、演算法與實戰
-
$594$564 -
$500裝備體系貢獻率評估 — 理論、方法與應用
-
$505元宇宙通論
-
$654$621 -
$479$455
相關主題
商品描述
本書以Python為開發語言,採用理論與實踐相結合的形式,系統全面地介紹了機器學習涉及的核心知識。本書共6章,其中第1章介紹機器學習的基礎知識,包括機器學習的概念、分類、研究範圍、開發環境等,介紹第一個機器學習案例; 第2、3章介紹機器學習的主要方法: 監督學習與無監督學習,涉及目前機器學習最為流行的經典算法和模型,如KNN、樸素貝葉斯、決策樹、線性回歸、邏輯回歸、SVM、神經網絡、PCA降維、KMeans,每個算法模型都配有代碼及可視化演示,讓讀者能更直觀形象地理解機器學習; 第4章介紹機器學習非常重要的數據處理方法: 特徵工程,特徵工程能進一步提高機器學習算法的性能; 第5章介紹機器學習模型的評估與優化,通過評估判斷模型優劣,評估後利用優化方法使其達到生產需求; 第6章介紹機器學習的應用案例,讓讀者更直觀地感受機器學習在生產生活中的實際用途。 本書附有配套教學課件、源代碼、習題,供讀者實踐,旨在通過邊學邊練的方式,鞏固所學知識,提升開發能力。 本書可作為高等學校電腦相關專業的教材,也可作為機器學習工程技術人員的參考用書。
目錄大綱
目錄
隨書資源
第1章機器學習基礎
1.1機器學習
1.1.1什麽是機器學習
1.1.2從數據中學習
1.1.3機器學習能夠解決的問題
1.2機器學習的分類
1.2.1學習方式
1.2.2算法的分類
1.3機器學習的範圍
1.4編程語言與開發環境
1.4.1選擇Python的原因
1.4.2安裝開發環境
1.4.3Scikitlearn
1.5第一個機器學習應用: 鳶尾花分類
1.5.1特徵數據與標簽數據
1.5.2訓練數據與測試數據
1.5.3構建機器學習模型
1.5.4預測與評估
1.6本章小結
習題
第2章監督學習
2.1監督學習概念與術語
2.1.1監督學習工作原理
2.1.2分類與回歸
2.1.3泛化
2.1.4欠擬合
2.1.5過擬合
2.1.6不收斂
2.2K近鄰算法
2.2.1K近鄰分類
2.2.2K近鄰回歸
2.3樸素貝葉斯
2.3.1貝葉斯定理
2.3.2樸素貝葉斯算法步驟
2.3.3在Scikitlearn中使用貝葉斯分類
2.4決策樹
2.4.1決策樹的基本思想
2.4.2決策樹學習算法
2.4.3構造決策樹
2.4.4決策樹的優化與可視化
2.4.5決策樹回歸
2.5線性模型
2.5.1線性回歸
2.5.2嶺回歸與Lasso回歸
2.5.3多項式回歸
2.5.4線性分類模型
2.6邏輯回歸
2.6.1邏輯回歸模型介紹
2.6.2邏輯回歸算法實現
2.7支持向量機
2.7.1支持向量
2.7.2線性SVM分類
2.7.3核技巧
2.7.4SVM回歸
2.7.5Scikitlearn SVM參數
2.8集成學習方法
2.8.1集成學習
2.8.2Bagging和Pasting
2.8.3隨機森林
2.8.4提升法
2.9人工神經網絡
2.9.1從生物神經元到人工神經元
2.9.2感知器學習
2.9.3神經網絡的訓練過程
2.9.4神經網絡應用案例
2.10分類器的不確定度估計
2.10.1決策函數
2.10.2預測概率
2.11本章小結
習題
第3章無監督學習與數據預處理
3.1無監督學習
3.1.1無監督學習的類型
3.1.2無監督學習的挑戰
3.2數據預處理
3.2.1數據清洗
3.2.2數據變換
3.2.3數據集成
3.2.4數據規約
3.3降維
3.3.1數據壓縮
3.3.2數據可視化
3.3.3降維的主要方法
3.3.4PCA
3.3.5利用PCA實現半導體製造數據降維
3.4聚類
3.4.1KMeans聚類
3.4.2均值偏移聚類
3.4.3DBSCAN
3.4.4高斯混合模型的期望最大化(EM)聚類
3.4.5層次聚類
3.5本章小結
習題
第4章特徵工程
4.1特徵理解
4.2特徵增強
4.2.1EDA
4.2.2處理數據缺失
4.2.3標準化和歸一化
4.3特徵構建
4.3.1特徵構建的基礎操作
4.3.2特徵構建的數值變量擴展
4.3.3文本變量處理
4.4特徵選擇
4.4.1單變量特徵選擇
4.4.2模型特徵選擇
4.4.3迭代特徵選擇
4.5特徵轉換
4.5.1PCA
4.5.2LDA
4.6特徵學習
4.6.1數據的參數假設
4.6.2受限玻爾茲曼機(RBM)
4.6.3詞嵌入
4.7本章小結
習題
第5章模型評估與優化
5.1算法鏈與管道
5.1.1用管道方法簡化工作流
5.1.2通用的管道接口
5.2交叉驗證
5.2.1K折交叉驗證
5.2.2分層K折交叉驗證
5.3模型評價指標
5.3.1誤分類的不同影響
5.3.2混淆矩陣
5.3.3分類的不確定性
5.3.4準確率召回率曲線
5.3.5受試者工作特徵(ROC)與AUC
5.3.6多分類指標
5.3.7回歸指標
5.3.8在模型選擇中使用評估指標
5.4處理類的不平衡問題
5.4.1類別不平衡問題
5.4.2解決類別不平衡問題
5.5網格搜索優化模型
5.5.1簡單網格搜索選擇超參數
5.5.2驗證集用於選擇超參數
5.5.3帶交叉驗證的網格搜索
5.6本章小結
習題
第6章機器學習應用案例
6.1電影推薦系統
6.1.1推薦系統基礎
6.1.2推薦引擎算法
6.1.3相似度指標
6.1.4電影推薦系統實戰
6.2情感分析系統
6.2.1情感分析概述
6.2.2導入數據集
6.2.3詞袋模型
6.2.4TFIDF
6.2.5數據預處理
6.2.6訓練模型
6.2.7模型評估及調優
6.3房價預測系統
6.3.1案例背景
6.3.2數據處理及可視化分析
6.3.3訓練模型
6.3.4模型評估
6.3.5模型調優
6.4人臉識別
6.4.1概述
6.4.2加載數據集
6.4.3訓練模型
6.4.4測試模型
6.4.5PCA主成分分析
6.4.6模型調優
6.5本章小結
習題