數據挖掘算法實踐與案例詳解
丁兆雲 沈大勇 徐偉 周鋆
- 出版商: 機械工業
- 出版日期: 2025-01-01
- 售價: $354
- 貴賓價: 9.5 折 $336
- 語言: 簡體中文
- 頁數: 174
- ISBN: 7111760697
- ISBN-13: 9787111760696
立即出貨 (庫存 < 3)
相關主題
商品描述
數據挖掘算法為大數據與人工智能的核心,掌握數據挖掘各算法的編程實現,有助於提升大數據的實踐運用能力。本書詳細闡述了數據挖掘常用算法與編程實現,同時,本書以多個經典的數據挖掘賽題為案例,詳細論述了數據預處理、特徵選擇、可視化、算法選擇等全流程數據挖掘過程的編程實現,有助於提升讀者面對實際數據問題時靈活運用各類算法能力。
目錄大綱
前言
第1章 緒論
1.1 數據挖掘技術的由來
1.2 數據挖掘的分類
1.2.1 關聯規則挖掘
1.2.2 監督式機器學習
1.2.3 非監督式機器學習
1.3 Python的安裝步驟
1.3.1 Python環境的配置
1.3.2 PyCharm的安裝
1.4 常見的數據集
1.4.1 鳶尾花數據集
1.4.2 員工離職預測數據集
1.4.3 泰坦尼克號災難預測數據集
1.4.4 PM2.5空氣質量預測數據集
1.5 本章小結
第2章 分類
2.1 分類的概念
2.2 分類中的訓練集與測試集
2.3 分類的過程及驗證方法
2.3.1 準確率
2.3.2 k折交叉驗證
2.4 貝葉斯分類的編程實踐
2.4.1 鳶尾花數據集的貝葉斯分類
2.4.2 基於貝葉斯分類的員工離職預測
2.5 本章小結
第3章 數據的特徵選擇
3.1 直方圖
3.1.1 直方圖可視化
3.1.2 直方圖特徵選擇
3.2 直方圖與柱狀圖的差異
3.3 特徵選擇實踐
3.4 本章小結
第4章 數據預處理之數據清洗
4.1 案例概述
4.2 缺失值處理
4.2.1 缺失值處理概述
4.2.2 缺失值處理實例
4.3 噪聲數據處理
4.3.1 正態分佈噪聲數據檢測
4.3.2 用箱線圖檢測噪聲數據
4.4 數據預處理案例實踐
4.4.1 問題
4.4.2 解決方法
4.4.3 實踐結論
4.5 本章小結
第5章 數據預處理之轉換
5.1 數據的數值化處理
5.1.1 順序編碼
5.1.2 二進制編碼
5.2 數據規範化
5.2.1 最小–最大規範化
5.2.2 z分數規範化
5.2.3 小數定標規範化
5.3 本章小結
第6章 數據預處理之數據降維
6.1 散點圖可視化分析
6.2 主成分分析
6.3 本章小結
第7章 不平衡數據分類
7.1 不平衡數據分類問題的特徵
7.1.1 數據稀缺問題
7.1.2 噪聲問題
7.1.3 決策面偏移問題
7.1.4 評價標準問題
7.2 重採樣方法
7.2.1 上採樣
7.2.2 對上採樣方法的改進
7.2.3 下採樣
7.2.4 對下採樣方法的改進
7.2.5 不平衡問題的其他處理方式
7.3 不平衡數據分類實踐
7.4 本章小結
第8章 回歸分析
8.1 線性回歸
8.1.1 一元線性回歸
8.1.2 多元線性回歸
8.2 回歸分析檢測
8.2.1 正態分佈可能性檢測
8.2.2 線性分佈可能性檢測
8.2.3 log轉換後的分佈
8.3 回歸預測案例實踐
8.3.1 案例背景
8.3.2 代碼實現
8.4 本章小結
第9章 聚類分析
9.1 k均值聚類
9.1.1 算法的步驟
9.1.2 代碼實現
9.2 層次聚類
9.2.1 算法的步驟
9.2.2 代碼實現
9.3 密度聚類
9.3.1 算法的步驟
9.3.2 代碼實現
9.4 本章小結
第10章 關聯分析
10.1 Apriori算法
10.2 關聯分析案例實踐
10.2.1 案例背景
10.2.2 案例的數據集
10.2.3 代碼實現
10.2.4 運行結果
10.3 提升Apriori算法性能的方法
10.4 本章小結
第11章 KNN分類
11.1 KNN算法的步驟
11.2 KNeighborsClassifier函數
11.3 KNN的代碼實現
11.4 結果分析
11.5 KNN案例實踐
11.5.1 案例分析
11.5.2 案例實現
11.5.3 運行結果
11.6 本章小結
第12章 支持向量機
12.1 支持向量機的可視化分析
12.2 SVM的代碼實現
12.2.1 鳶尾花數據分類
12.2.2 新聞文本數據分類
12.3 本章小結
第13章 神經網絡分類
13.1 多層人工神經網絡
13.2 多層人工神經網絡的代碼實現
13.3 神經網絡分類案例實踐
13.3.1 案例背景
13.3.2 數據說明
13.3.3 代碼實現
13.4 本章小結
第14章 集成學習
14.1 Bagging方法
14.2 隨機森林
14.3 Adaboost
14.4 GBDT
14.4.1 GradientBoostingClassifier函數
14.4.2 GradientBoostingRegressor函數
14.5 XGBoost
14.5.1 XGBClassifier函數
14.5.2 XGBRegressor函數
14.6 房價預測案例實踐
14.7 點擊欺騙預測案例實踐
14.7.1 案例背景
14.7.2 數據分析
14.7.3 模型優化
14.8 本章小結
第15章 綜合案例實踐
15.1 員工離職預測綜合案例
15.1.1 數據總覽
15.1.2 數據預處理
15.1.3 模型構建與比較
15.2 二手車交易價格預測綜合案例
15.2.1 數據集簡介
15.2.2 數據總覽
15.2.3 數據預處理
15.2.4 查看變量分佈
15.2.5 查看變量間的關系
15.2.6 查看變量間的分佈關系
15.2.7 分析汽車註冊月份與價格的關系
15.2.8 特徵工程
15.2.9 模型構建與訓練
15.3 信息抽取綜合案例
15.3.1 案例背景
15.3.2 數據集簡介
15.3.3 模型的構建與訓練
15.3.4 模型評價
15.4 學術網