Python機器學習一本通
楊志曉,範艷峰
- 出版商: 北京大學
- 出版日期: 2020-01-01
- 定價: $888
- 售價: 7.5 折 $666
- 語言: 簡體中文
- 頁數: 772
- 裝訂: 平裝
- ISBN: 7301313365
- ISBN-13: 9787301313367
-
相關分類:
Machine Learning
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
$474$450 -
$352Python 社會媒體挖掘 (Mastering Social Media Mining with Python)
-
$454跟著迪哥學Python數據分析與機器學習實戰
-
$449機器學習 — 原理、算法與應用
-
$294$279 -
$768$730 -
$299$284 -
$450$297 -
$556$523 -
$658斯坦福數據挖掘教程, 3/e (Mining of Massive Datasets, 3/e)
相關主題
商品描述
本書結合了Python和機器學習兩個熱門領域,通過易於理解的知識講解,幫助讀者學習和掌握機器學習。
全書共20章,分為5篇。
其中第1篇為基礎入門篇,主要講述Python機器學習入門、設置機器學習的環境、機器學習基礎和統計分析數學基礎等內容;
第2篇為數據預處理篇,主要講述了產生和加載數據集、數據預處理等內容;
第3篇為機器學習算法篇,主要講述了回歸分析、決策樹分析、支持向量機、
聚類分析、集成學習、神經網絡學習、捲積網絡學習和模型評價等內容;
第4篇為機器學習應用篇,主要講述了圖像識別、語音識別、期刊新聞分類和圖形壓縮4個機器學習應用;
第5篇為項目實戰篇,主要講述了社交好友分析、電商點擊率預估等。 本書適用於想瞭解傳統機器學習算法的學生和從業者,想知道如何高效實現機器學習算法的程序員,
以及想瞭解機器學習算法能如何進行應用的職員、經理等。
作者簡介
楊志曉
工學博士,副教授,現在河南牧業經濟學院智能製造與自動化學院工作,從事計算機應用、控制理論與控制工程專業的教學與科研工作。
研究方向主要有:人工智能理論及應用、人機情感交互、可信計算。曾參與主持河南省重點科技攻關項目1項、河南省教育廳自然科學研究計劃項目2項、
河南省高校青年骨干教師資助計劃項目、鄭州市科技攻關項目各1項,主持省級鑑定項目5項,
作為主要完成人參與省級項目10餘項,參與國家“十一五”科技支撐計劃項目1項,
獲省政府科技進步2等獎和3等獎各1項,獲教育廳科技成果一等獎2項,二等獎4項。獲國家授權發明專利2項(均為主持)等。
範豔峰
工學博士,教授。
1995年至今,於河南工業大學信息科學與工程學院工作,教授。
從事人工智能理論及應用的教學科研工作。
目錄大綱
第一篇基礎入門篇
第1章Python機器學習入門1
1.1機器學習是人工智能的一個分支2
1.1.1什麼是智能2
1.1.2智能的特點4
1.1.3人工智能及其研究內容5
1.1. 4人工智能的主要學派7
1.1.5人工智能的研究和應用範疇9
1.2理解機器學習10
1.2.1學習與機器學習10
1.2.2機器學習的分類11
1.2.3典型的機器學習方法12
1.2. 4深度學習17
1.3數據、大數據及其組織方式18
1.3.1數據及大數據18
1.3.2數據庫與數據倉庫18
1.4機器學習的一般步驟19
1.5本章小結21
1.6習題21
1.7高手點撥21
第2章設置機器學習的環境23
2.1機器學習工具及Python Anaconda的安裝24
2.1.1機器學習工具24
2.1.2 Python Anaconda 24
2.1.3 Python Anaconda版的安裝和使用28
2.1.4機器學習庫scikit- learn 32
2.2環境測試33
2.3綜合實例—第一個機器學習實例34
2.4本章小結36
2.5習題36
2.6高手點撥36
第3章Python機器學習基礎39
3.1 NumPy數值計算基礎40
3.2 Matplotlib可視化基礎59
3.2.1 matplotlib.pyplot繪圖元素和基本流程59
3.2.2繪製散點圖60
3.2.3繪製折線圖和點線圖62
3.2.4繪製柱狀圖64
3.2.5繪製餅圖67
3.2.6繪製箱線圖69
3.2.7繪製直方圖70
3.2.8繪製子圖71
3.3 Seaborn統計數據可視化72
3.3.1特徵關係可視化73
3.3.2特徵分類別可視化76
3.3.3特徵分佈可視化90
3.3.4矩陣可視化98
3.4訪問數據文件101
3.4.1 NumPy訪問二進製文件101
3.4.2 Pandas訪問文本文件104
3.4.3 Pandas訪問Excel文件107
3.5 Pandas DataFrame操作108
3.5.1 DataFrame對象及其屬性108
3.5.2使用字典方式訪問DataFrame 110
3.5.3使用屬性方式訪問DataFrame 112
3.5.4 DataFrame訪問行的特殊方法113
3.5.5使用DataFrame.loc[ ],DataFrame.iloc[ ]對DataFrame進行切片114
3.5.6更改DataFrame中的數據119
3.6綜合實例—iris數據集特徵、特徵間關係及分類別分析121
3.7本章小結129
3.8習題129
3.9高手點撥130
第4章統計分析數學基礎及Python實現131
4.1基本統計知識132
4.1.1中位數、眾數、極差132
4.1.2相關性、協方差、相關係數、協方差矩陣133
4.1.3數據的分組聚合135
4.1.4數據透視表與交叉表136
4.2 NumPy統計分析136
4.3 Pandas統計分析140
4.3.1 Pandas DataFrame描述性統計141
4.3.2 Pandas DataFrame數據離散化146
4.3.3使用GroupBy拆分數據並進行描述性統計150
4.3.4使用agg方法聚合數據157
4.3.5使用apply方法聚合數據160
4.3.6使用transform方法聚合數據161
4.3.7使用pivot_table創建透視表163
4.3.8使用crosstab創建交叉表171
4.4綜合實例—iris數據集統計分析173
4.5本章小結189
4.6習題189
4.7高手點撥190
第二篇數據預處理篇
第5章數據分析第一步—產生和加載數據集191
5.1使用NumPy的函數產生模擬數據集192
5.2使用scikit-learn樣本生成器生成數據集198
5.3訪問scikit-learn自帶數據文件206
5.4訪問外部數據文件210
5.5綜合實例—加載boston數據集、另存為並重新訪問211
5.6本章小結214
5.7習題215
5.8高手點撥215
第6章數據分析第二步—
數據預處理217
6.1數據預處理的基礎知識218
6.1.1一般流程和常用方法218
6.1.2標準化和正則化219
6.1.3特徵選擇221
6.1.4特徵降維—主成分分析、線性判別分析222
6.1.5 Pandas與scikit- learn數據預處理概述227
6.2使用scikit-learn進行數據預處理228
6.2.1使用sklearn對數據集進行Z- score標準化228
6.2.2使用sklearn對數據集進行極差標準化232
6.2.3使用sklearn對數據集正則化235
6.2.4使用sklearn對數據集二值化238
6.2.5使用sklearn進行缺失值插補239
6.2.6使用sklearn對分類特徵編碼240
6.3特徵降維242
6.3.1 PCA降維242
6.3.2 LDA降維247
6.3.3 TSNE降維250
6.4綜合實例—breast_cancer數據集預處理253
6.5本章小結258
6.6習題259
6.7高手點撥259
第三篇機器學習算法篇
第7章回歸分析261
7.1回歸分析及常用方法262
7.1.1線性回歸262
7.1.2邏輯回歸263
7.1.3多項式回歸263
7.1.4逐步回歸263
7.1.5嶺回歸263
7.1.6套索回歸264
7.1.7彈性網絡回歸264
7.2線性回歸理論基礎264
7.3使用scikit-learn進行線性回歸266
7.4使用scikit-learn進行嶺回歸271
7.5使用scikit-learn進行邏輯回歸274
7.6使用scikit-learn進行多項式回歸280
7.6.1單特徵數據集多項式回歸280
7.6.2多特徵數據集多項式回歸285
7.7綜合實例—波士頓房價數據集回歸分析291
7.8本章小結295
7.9習題296
7.10高手點撥296
第8章分類算法—決策樹學習297
8.1決策樹算法基礎298
8.1.1信息熵、信息增益、信息增益率298
8.1.2決策樹算法302
8.2使用scikit-learn進行決策樹學習303
8.3綜合實例—使用決策樹對鳶尾花數據集iris進行分類314
8.4本章小結319
8.5習題319
8.6高手點撥320