Python科學計算、數據處理與分析
尹紅麗 趙桂新
- 出版商: 人民郵電
- 出版日期: 2023-04-01
- 定價: $359
- 售價: 8.5 折 $305
- 語言: 簡體中文
- 頁數: 256
- ISBN: 7115562121
- ISBN-13: 9787115562128
-
相關分類:
Python、程式語言、Data Science
下單後立即進貨 (約4週~6週)
相關主題
商品描述
本書涵蓋了Python在數值計算和數據處理領域的常用擴展庫,如NumPy、SciPy、Pandas、Matplotlib等,以數據載入、數據清洗與規整、數據分析與可視化為主線,利用淺顯易懂的語言、豐富有趣的實例和案例,全面、系統地介紹了科學計算、數據處理與分析的知識。
本書共7章,第1章主要介紹Python語言以及環境的搭建和使用;第2~3章介紹Numpy和Pandas擴展庫的數據結構和常用函數;第4章主要介紹了Pandas數據處理的相關技術;第5章主要介紹了Matplotlib和pandas兩種數據可視化技術。第6章通過兩個具體的案例介紹數據處理、數據探索的流程和方法;第7章介紹了數值計算擴展庫Scipy中的擬合和優化、插值、線性代數、數值積分模塊。
作者簡介
尹红丽,2006年硕士毕业于山东大学,2016年博士毕业于青岛大学。2006年至今任教于齐鲁工业大学数学与统计学院。主持横向课题一项,参与横向课题一项,参与国家面上基金一项,指导国家大学生创新创业项目一项,主持教育部协同育人项目一项,发表SCI、EI论文若干篇。2014年参编规划教材《数据结构》 大连理工出版社;2017年主编《Java基础与进阶》 中国建材工业出版社;2018年修订规划教材《数据结构》大连理工出版社。
目錄大綱
第 1章 Python簡介與環境安裝 1
1.1 Python簡介 1
1.1.1 為什麽使用Python 1
1.1.2 Python2和Python3 1
1.2 Python環境安裝 2
1.2.1 Anacanda安裝 2
1.2.2 安裝及更新Python包 4
1.3 IPython的使用 5
1.3.1 Python解釋器 5
1.3.2 IPython是什麽 5
1.3.3 安裝IPython 5
1.3.4 IPython的使用 6
1.3.5 IPython的調試 14
1.4 Jupyter Notebook 17
1.4.1 Jupyter Notebook是什麽 17
1.4.2 Jupyter Notebook的使用 17
習題 22
第 2章 NumPy基礎 24
2.1 Python與數組的關系 24
2.2 N維數組對象ndarray 25
2.2.1 數組基本操作 26
2.2.2 數組生成函數 29
2.2.3 數組存取 34
2.2.4 結構體數組 41
2.2.5 數組高級操作 42
2.3 通用函數 54
2.3.1 算術運算 56
2.3.2 比較運算 57
2.3.3 邏輯運算 57
2.4 聚合函數 58
2.5 排序函數 59
2.5.1 np.sort 59
2.5.2 ndarray.sort 61
2.5.3 np.argsort 61
2.5.4 np.lexsort 62
2.5.5 np.searchsorted 63
2.6 隨機數生成函數 65
2.6.1 np.random.uniform 66
2.6.2 np.random.rand 67
2.6.3 np.random.randint 67
2.6.4 np.random.normal 68
2.6.5 np.random.choice 69
2.6.6 np.random.shuffle 70
2.6.7 np.random.permutation 70
2.7 NumPy廣播 70
習題 73
第3章 Pandas基礎 75
3.1 Pandas數據結構 75
3.1.1 Series 75
3.1.2 DataFrame 79
3.2 索引對象 82
3.2.1 索引對象Index 83
3.2.2 層次化索引對象MultiIndex 84
3.3 數據存取 85
3.3.1 屬性和字典存取 85
3.3.2 [ ]存取 86
3.3.3 loc和iloc存取 92
3.3.4 多級索引的存取 94
3.3.5 條件存取 97
3.4 Pandas字符串操作 98
3.4.1 字符串對象方法 99
3.4.2 正則表達式 102
3.4.3 Pandas中的向量化字符串函數 108
3.5 文件讀寫 110
3.5.1 CSV文件讀寫 111
3.5.2 Excel文件讀寫 117
3.5.3 HDF5文件讀寫 119
3.6 基本運算 122
3.6.1 算術運算 122
3.6.2 排序和排名 125
3.6.3 匯總和統計 128
習題 134
第4章 Pandas數據處理 135
4.1 數據清洗 135
4.1.1 處理缺失值 135
4.1.2 刪除重復數據 139
4.1.3 刪除列 141
4.1.4 重命名索引 142
4.2 數據規整 143
4.2.1 離散化和分箱 143
4.2.2 索引重塑和軸向旋轉 144
4.2.3 分類數據處理 148
4.2.4 數據轉換 151
4.2.5 數據合並 158
4.3 數據分組與聚合 166
4.3.1 GounpBy技術 167
4.3.2 數據聚合 173
4.3.3 透視表和交叉表 180
4.4 時間序列 182
4.4.1 日期和時間類型以及工具 183
4.4.2 時間序列基礎 187
4.4.3 日期範圍和偏移 189
4.4.4 時間區間和區間算術 192
4.4.5 時間序列方法 194
習題 201
第5章 數據可視化 203
5.1 Matplotlib簡介 203
5.2 Matplotlib繪圖 203
5.2.1 面向對象繪圖流程 205
5.2.2 圖片對象 205
5.2.3 子圖 206
5.2.4 子圖間距 208
5.3 Matplotlib快速繪圖和麵向對象繪圖的區別 209
5.4 Matplotlib繪圖設置 209
5.4.1 圖像設置 209
5.4.2 坐標軸設置 216
5.4.3 圖例設置 221
5.4.4 標註設置 222
5.4.5 網格設置 225
5.4.6 圖表中使用中文 226
5.5 Pandas繪圖 228
5.5.1 Pandas基礎繪圖 228
5.5.2設置字體和顯示中文 232
5.5.3 Pandas繪圖類型 232
習題 239
第6章 數據探索和分析 240
6.1泰坦尼克號數據探索和分析 240
6.1.1 載入數據 240
6.1.2 數據觀察 240
6.1.3 數據處理 243
6.1.4 數據探索 245
6.2 IMDB電影數據探索和分析 250
6.2.1 載入數據 250
6.2.2 數據處理 251
6.2.3 數據探索和分析 259
習題 267
第7章 數值計算Scipy 269
7.1 擬合和優化 269
7.1.1 最小二乘擬合 269
7.1.2 函數極值求解 273
7.1.3 非線性方程組求解 277
7.2 插值庫 278
7.2.1 一維插值 279
7.2.2 二維插值 281
7.2.3 插值法處理缺失值 282
7.3 線性代數 283
7.3.1線性方程組求解 283
7.3.2 最小二乘解 283
7.3.3 計算行列式 284
7.3.4 求逆矩陣 284
7.3.5 求取特徵值與特徵向量 284
7.3.6 SVD奇異值分解 285
7.4 數值積分 286
7.4.1 已知函數式求積分 286
7.4.2 已知採樣數值求積分 288
7.4.3 解常微分方程組 289
習題 290