Python機器學習基礎
王魯昆
- 出版商: 人民郵電
- 出版日期: 2023-04-01
- 定價: $299
- 售價: 8.5 折 $254
- 語言: 簡體中文
- 頁數: 192
- ISBN: 7115562172
- ISBN-13: 9787115562173
-
相關分類:
Machine Learning
下單後立即進貨 (約4週~6週)
相關主題
商品描述
Python是當前流行的編程語言,簡單易學、應用廣泛。本書以Python為基礎開發語言,系統地講解了機器學習的相關知識。本書共9章,主要包括機器學習的基本概念,Python及其庫的入門,機器學習中常用算法的理論介紹、項目實現和優缺點分析,數據預處理,特徵工程,模型評估及改進,綜合實戰等。
本書可作為本科院校和職業院校電腦相關專業的教材,還可作為社會培訓機構的教材,也適合電腦愛好者自學使用。
作者簡介
王鲁昆,工学博士,博士后,硕士生导师,副教授,IEEE会员,高级项目管理师。目前就职于山东科技大学,兼任山东科技大学泰安校区计算机视觉与模式识别团队负责人,山东科技大学智能装备学院院长助理,山东科技大学三创中心主任。2008年硕士毕业后,在大连古野软件有限公司,浪潮集团工作过5年时间,获得信息系统项目管理师高级认证,系统集成项目管理师高级认证,软件设计师中级认证, ITIL V3 Foundation高级认证。2016年博士毕业后,入职山东科技大学泰安校区。主要科研成果如下:发表论文16篇,其中SCI索引11篇,EI索引3篇,中文核心2篇。SCI论文中一区TOP期刊1篇,二区5篇,总影响因子37.627。主持山东省自然基金项目1项,山东省高等学校科技计划项目1项,教育部协同育人项目3项,山东省重点实验室项目1项,人才引进项目1项,泰安市科技计划项目1项。申请并授权专利7项,申请并授权软件著作权5项。
目錄大綱
第 1章 概述 1
1.1 什麽是機器學習 1
1.2機器學習的算法 2
1.3 監督學習 2
1.4 無監督學習 3
1.5 數據集 4
1.6 機器學習項目的流程 6
1.7 小結 7
習題1 7
第 2章 Python入門 9
2.1 Python語言介紹 9
2.2 Python平臺搭建 9
2.3 Python的基本概念 11
2.3.1 數據類型 11
2.3.2 基本運算 14
2.3.3 控制語句 15
2.3.4 復雜數據類型 16
2.3.5 函數 18
2.4 Python庫的使用 18
2.5 小結 24
習題2 24
第3章 分類算法 25
3.1 K近鄰算法 25
3.1.1 算法介紹 25
3.1.2 算法應用 27
3.1.3 算法的優缺點 37
3.2 樸素貝葉斯算法 38
3.2.1 算法介紹 38
3.2.2 算法實現 39
3.2.3 算法的優缺點 43
3.3 邏輯回歸 44
3.3.1 算法介紹 44
3.3.2 算法實現 46
3.3.3 算法的優缺點 48
3.4 支持向量機 48
3.4.1算法介紹 48
3.4.2 算法實現 53
3.4.3 算法的優缺點 55
3.5決策樹 55
3.5.1算法介紹 55
3.5.2算法實現 58
3.5.3算法的優缺點 61
3.6隨機森林 62
3.6.1算法介紹 62
3.6.2算法實現 63
3.6.3 算法的優缺點 65
3.7 人工神經網絡 65
3.7.1 算法介紹 65
3.7.2 項目實現 68
3.7.3 算法的優缺點 71
3.8 分類器的不確定性 71
3.8.1 決策函數 72
3.8.2 預測函數 72
3.8.3 多分類的不確定性 73
3.9 小結 74
習題3 75
第4章 回歸算法 76
4.1 線性回歸 76
4.1.1 線性模型 76
4.1.2 線性回歸 78
4.1.3 多項式回歸 81
4.1.4 算法的優缺點 82
4.2 嶺回歸 83
4.2.1 算法介紹 83
4.2.2 算法實現 83
4.2.3 算法的優缺點 87
4.3 LASSO回歸 87
4.3.1 算法介紹 87
4.3.2 算法實現 88
4.3.3 算法的優缺點 91
4.4 支持向量回歸機 91
4.4.1算法介紹 91
4.4.2算法實現 93
4.4.3算法的優缺點 94
4.5 回歸樹 95
4.5.1 算法介紹 95
4.5.2 算法實現 96
4.5.3 算法優缺點 97
4.6 小結 98
習題4 98
第5章 聚類算法 99
5.1 K均值凝聚聚類 99
5.1.1 算法介紹 99
5.1.2 算法實現 100
5.1.3 算法的優缺點 103
5.2 層次聚類 103
5.2.1 算法介紹 103
5.2.2 算法實現 104
5.2.3 算法的優缺點 107
5.3 DBSCAN算法 108
5.3.1 算法介紹 108
5.3.2 算法實現 108
5.3.3 算法的優缺點 111
5.4 Mean Shift 111
5.4.1 算法介紹 111
5.4.2 算法實現 112
5.4.3 算法的優缺點 114
5.5 Label Propagation 114
5.5.1 算法介紹 115
5.5.2 算法實現 115
5.5.3 算法優缺點 116
5.6 小結 116
習題5 117
第6章 數據預處理 118
6.1 數據清洗 118
6.1.1 缺失值處理 118
6.1.2 異常值處理 126
6.2 數據變換 130
6.2.1 無量綱化 130
6.2.2 離散化 131
6.2.3 對類別特徵編碼 133
6.2.4 多項式特徵 137
6.3 數據規約 142
6.4小結 143
習題6 143
第7章 特徵工程 144
7.1 特徵提取 144
7.1.1 字典特徵提取 144
7.1.2 文本特徵提取 145
7.1.3 圖像特徵提取 151
7.2特徵選擇 154
7.2.1 Filter 154
7.2.2 Wrapper 157
7.2.3 Embedded 158
7.3 降維 159
7.4 小結 164
習題7 164
第8章 模型評估及改進 165
8.1 交叉驗證 165
8.1.1 K折交叉驗證 165
8.1.2 分層K折交叉檢驗 166
8.1.3 留一交叉驗證和打亂劃分交叉驗證 168
8.2 網格搜索 169
8.3 評估指標 177
8.3.1 分類評估指標 178
8.3.2 回歸評估指標 189
8.4 小結 191
習題8 191
第9章 綜合實戰 192
9.1 管道模型 192
9.2 文本數據處理 197
9.2.1 擴展與深化——不同種方式的文本數據處理 197
9.2.2 文本數據的優化處理 203
9.3 泰坦尼克號數據分析 208
9.4 小結 217
習題9 217
參考文獻 219