Python數據分析從小白到高手 全彩視頻版

王國平

  • 出版商: 化學工業
  • 出版日期: 2024-03-01
  • 定價: $594
  • 售價: 8.5$505
  • 語言: 簡體中文
  • 頁數: 307
  • ISBN: 7122444252
  • ISBN-13: 9787122444257
  • 相關分類: Data Science
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

大數據時代,掌握必要的數據分析能力,將大大提升你的工作效率和自身競爭力。Python是數據分析的一大利器,本書將詳細講解利用Python進行數據分析與可視化的相關知識。
《Python數據分析從小白到高手》主要內容包括:Python入門、搭建開發環境、語法、數據類型、數據加載、數據準備、數據可視化、機器學習、深度學習、自然語言處理等,並通過三個綜合案例將這些知識加以運用。
本書內容豐富,採用全彩印刷,配套視頻講解,結合隨書附贈的素材邊看邊學邊練,能夠大大提高學習效率,迅速掌握Python數據分析技能,並用於實踐。
本書適合數據分析初學者、初級數據分析師、數據庫技術人員等自學使用。同時,本書也可用作職業院校、培訓機構相關專業的教材及參考書。

目錄大綱

1 Python入門
1.1    為什麽選擇Python 2
1.1.1    人工智能與ChatGPT 2
1.1.2    Python與人工智能 3
1.2    Python主要庫簡介 4
1.2.1    NumPy 5
1.2.2    Pandas 6
1.2.3    Matplotlib 7
1.2.4    Sklearn 9
1.3    如何學習Python 11

2 搭建Python開發環境
2.1    Anaconda 14
2.1.1    什麽是Anaconda 14
2.1.2    安裝Anaconda 15
2.2    常用開發工具 18
2.2.1    Spyder 18
2.2.2    Jupyter Lab 21
2.2.3    PyCharm 23
2.3    包管理工具pip 26

3 Python語法
3.1    Python基礎語法 29
3.1.1    變量及其命名 29
3.1.2    代碼行與縮進 30
3.1.3    條件if及if嵌套 31
3.1.4    循環while與for 32
3.1.5    格式format()與% 34
3.1.6    編碼類型及轉換 37
3.2    Python運算符 39
3.2.1    算術運算符 39
3.2.2    賦值運算符 42
3.2.3    比較運算符 45
3.2.4    邏輯運算符 46
3.2.5    運算符優先級 49
3.3    Python常用技巧 51
3.3.1    自動補全程序 51
3.3.2    變量賦值技巧 52
3.3.3    變量鏈式比較 53
3.3.4    獲取元素索引 54
3.3.5    遍歷序列元素 55
3.3.6    序列元素排序 55
3.3.7    列表解析式 56
3.3.8    元素序列解包 57
3.3.9    合並序列元素 58
3.3.10    三元表達式 59
3.3.11    lambda表達式 61
3.3.12    矩陣乘法與轉置 62

4 Python數據類型
4.1    認識數據類型 64
4.1.1    數值(number)類型 64
4.1.2    字符串(string)類型 65
4.1.3    列表(list)類型 68
4.1.4    元組(tuple)類型 70
4.1.5    集合(set)類型 71
4.1.6    字典(dict)類型 73
4.1.7    布爾值(boolean)類型 76
4.1.8    空值(None)類型 76
4.1.9    數據類型轉換 77
4.2    字符串常用方法 81
4.2.1    字符串拼接的3種方法 81
4.2.2    字符串切片的2種方法 83
4.2.3    分割與合並字符串 84
4.2.4    檢索子字符串的幾種方法 87
4.2.5    字符串對齊的3種方法 91
4.2.6    去除字符串中空格的3種方法 93
4.2.7    字符串大小寫轉換的3種函數 96
4.2.8    獲取字符串長度或字節數 99
4.2.9    統計字符串出現次數 100
4.3    列表常用方法 101
4.3.1    append()方法 101
4.3.2    clear()方法 102
4.3.3    copy()方法 102
4.3.4    count()方法 104
4.3.5    extend()方法 104
4.3.6    index()方法 105
4.3.7    insert()方法 106
4.3.8    pop()方法 107
4.3.9    remove()方法 107
4.3.10    reverse()方法 108
4.3.11    sort()方法 109

5 Python數據加載
5.1    加載本地離線數據 111
5.1.1    加載TXT文件數據 111
5.1.2    加載CSV文件數據 112
5.1.3    加載Excel文件數據 113
5.2    加載常用數據庫數據 114
5.2.1    加載Oracle數據庫數據 114
5.2.2    加載MySQL數據庫數據 116
5.2.3    加載SQL Server數據庫數據 117
5.3    加載Hadoop集群數據 118
5.3.1    集群軟件及其版本 118
5.3.2    集群網絡環境配置 120
5.3.3    Python連接Hive 122
5.4    加載Web在線數據 124

6 Python數據準備
6.1    數據的索引 127
6.1.1    創建索引 127
6.1.2    創建層次化索引 129
6.1.3    調整索引 130
6.2    數據的排序 131
6.2.1    按行索引排序數據 131
6.2.2    按列索引排序數據 132
6.2.3    按一列或多列排序數據 133
6.2.4    按一行或多行排序數據 133
6.3    數據的切片 134
6.3.1    提取一列或多列數據 134
6.3.2    提取一行或多行數據 135
6.3.3    提取指定區域的數據 136
6.4    數據的聚合 137
6.4.1    groupby()函數:分組聚合 137
6.4.2    agg()函數:更多聚合指標 138
6.5    數據的透視 140
6.5.1    pivot_table()函數:數據透視 140
6.5.2    crosstab()函數:數據交叉 143
6.6    數據的合並 144
6.6.1    merge()函數:橫向合並 144
6.6.2    concat()函數:縱向合並 149

7 Python數據可視化
7.1    Matplotlib 152
7.1.1    Matplotlib庫簡介 152
7.1.2    業績考核誤差條形圖 152
7.2    Pyecharts 155
7.2.1    Pyecharts庫簡介 155
7.2.2    銷售額主題河流圖 156
7.3    Seaborn 159
7.3.1    Seaborn庫簡介 159
7.3.2    利潤額增強箱形圖 159
7.4    Plotly 162
7.4.1    Plotly庫簡介 162
7.4.2    家庭成員結構旭日圖 163
7.5    Altair 165
7.5.1    Altair庫簡介 165
7.5.2    月度訂單量脊線圖 166
7.6    NetworkX 169
7.6.1    NetworkX簡介 169
7.6.2    NetworkX繪制平衡樹 170

8 Python機器學習
8.1    機器學習理論概述 173
8.1.1    機器學習概念 173
8.1.2    機器學習分類 176
8.1.3    模型評估方法 177
8.2    線性回歸及其案例 181
8.2.1    線性回歸簡介 181
8.2.2    線性回歸的建模 181
8.2.3    汽車價格的預測 184
8.3    聚類分析及其案例 190
8.3.1    K-Means聚類簡介 190
8.3.2    K-Means聚類建模 192
8.3.3    使用手肘法判斷聚類數 197
8.3.4    輪廓系數法判斷聚類數 198
8.4    XGBoost及其案例 202
8.4.1    XGBoost算法概述 202
8.4.2    XGBoost算法參數 204
8.4.3    XGBoost算法案例 207
8.5    時間序列及其案例 209
8.5.1    時間序列算法概述 209
8.5.2    指數平滑法及其案例 210
8.5.3    ARIMA算法及其案例 214

9 Python深度學習
9.1    深度學習概述 223
9.1.1    什麽是深度學習 223
9.1.2    安裝PyTorch 2.0 227
9.2    PyTorch圖像識別技術 228
9.2.1    加載數據集 228
9.2.2    搭建與訓練網絡 229
9.2.3    預測圖像數據 231
9.3    PyTorch模型可視化 231
9.3.1    Visdom簡介 231
9.3.2    Visdom可視化操作 233
9.4    手寫數字自動識別 244

10 Python自然語言處理
10.1    自然語言處理概述 251
10.2    Jieba中文分詞 252
10.2.1    Jieba分詞模式 252
10.2.2    自定義停用詞 254
10.2.3    商品評論關鍵詞詞雲 255
10.3    聊天機器人ChatGPT 257
10.3.1    ChatGPT簡介 257
10.3.2    Python如何調用ChatGPT 259
10.3.3    Python調用ChatGPT舉例 260
10.4    spaCy 262
10.4.1    spaCy簡介 262
10.4.2    spaCy語言模型 266
10.4.3    spaCy依存分析 269
10.5    Gensim 272
10.5.1    Gensim簡介 272
10.5.2    Gensim文本處理步驟 273
10.5.3    中文LDA分析及可視化 275

11 案例:金融量化交易分析
11.1    案例背景概述 283
11.1.1    案例研究意義 283
11.1.2    K線圖技術理論 283
11.1.3    案例數據採集 284
11.2    數據基礎分析 287
11.2.1    查看數據集信息 287
11.2.2    數據描述性分析 288
11.2.3    數據可視化分析 289
11.3    股票數據分析 294
11.3.1    指標相關性分析 294
11.3.2    指標趨勢性分析 297
11.3.3    股票交易時機分析 299
11.3.4    股票交易策略分析 301
11.4    案例小結 303

12 案例:武漢市空氣質量分析
12.1    案例背景概述
12.2    歷年數據可視化分析
12.3    AQI回歸分析
12.4    案例小結

13 案例:阿爾茨海默病特徵分析
13.1    案例背景概述
13.2    數據預處理
13.3    數據建模
13.4    案例小結

附錄 306

參考文獻 307