Python大數據分析
吳道君,沈陽,陳素霞
- 出版商: 中國鐵道
- 出版日期: 2024-02-01
- 定價: $300
- 售價: 8.5 折 $255
- 語言: 簡體中文
- 頁數: 215
- ISBN: 7113191827
- ISBN-13: 9787113191825
-
相關分類:
大數據 Big-data、Data Science
下單後立即進貨 (約4週~6週)
相關主題
商品描述
本書為新形態一體化應用型人才培養“十四五”系列教材之一,全面講解Python數據分析的相關知識和技術,內容包括Python數據分析概述、NumPy數值計算、Matplotlib數據可視化、Pandas數據分析、數據預處理、Sklearn機器學習。本書以培養學生編程能力和數據分析能力為目標,註重技術應用能力的培養。本書內容充實、結構合理、實用性強,具有明顯的應用能力培養特色。學完本書後,讀者可具備數據分析的基本能力。本書適合作為普通高等院校人工智能、數據科學與大數據以及計算機相關專業課程的教材,也可以作為相關從業人員的技術參考書。
作者簡介
吳道君,廣東嶺南職業技術學院講師、高級軟件工程師,承擔編程基礎C++、軟件工程、J2EE編程開發、.NET開發等多門課程的教學任務。2011年12月指導學生參加第二屆“國信藍點杯”全國軟件專業人才設計與開發大賽並獲得個人賽全國總決賽“二等獎”,2013年在廣東省首屆信息技術類專業帶頭人“說專業”競賽中獲得“二等獎”。發表論文數篇,主編教材多部。 沈陽,任職於廣州工程技術職業學院,信息系統項目管理師(高級),研究方向:大數據技術、移動因特網軟件開發,主授課程:Python大數據應用及實訓、Web前端技術、Android軟件項目開發,發表多篇SCI、EI和中文核心論文。 陳素霞,博士(美國喬治福克斯大學),河南輕工職業學院教師,副教授,專業方向為計算機應用專業,河南省學術技術帶頭人,參與多部教材編寫工作,參與多項教科研項目並獲獎。
目錄大綱
第1章 Python數據分析概述
1.1 數據分析的概念、流程和應用
1.1.1 數據分析的概念
1.1.2 數據分析的流程
1.1.3 數據分析的應用
1.2 數據分析工具
1.2.1 常用工具
1.2.2 Python數據分析
1.3 Python數據分析環境
小結
習題
實驗
第2章 NumPy數值計算
2.1 NumPy多維數組
2.1.1 數組創建
2.1.2 數組對象屬性
2.1.3 數組數據類型
2.2 數組操作
2.2.1 修改數組形狀
2.2.2 翻轉數組
2.2.3 連接數組
2.2.4 分割數組
2.2.5 數組元素添加與刪除
2.3 數組索引與切片
2.3.1 數組索引
2.3.2 數組切片
2.3.3 布爾型索引
2.3.4 花式索引
2.4 數組的運算
2.4.1 數組和標量間的運算
2.4.2 廣播
2.4.3 算術函數
2.4.4 集合運算
2.4.5 統計運算
2.4.6 排序
2.4.7 搜索
2.5 線性代數
2.5.1 數組相乘
2.5.2 矩陣行列式
2.5.3 逆矩陣
2.5.4 線性方程組
2.5.5 特徵值和特徵向量
2.6 數組的存取
2.7 視圖和副本
2.8 隨機漫步
小結
習題
實驗
第3章 Matplotlib數據可視化
3.1 折線圖
3.1.1 折線圖函數概述
3.1.2 折線圖繪制示例
3.2 圖表屬性設置
3.2.1 圖表屬性概述
3.2.2 圖例和rc設置
3.2.3 坐標網格設置
3.2.4 坐標系設置
3.2.5 文本註解
3.3 其他圖形
3.3.1 散點圖
3.3.2 垂直柱形圖
3.3.3 水平柱形圖
3.3.4 餅圖
3.3.5 直方圖
3.3.6 箱線圖
3.4 子圖
3.4.1 創建子圖
3.4.2 子圍坐標系設置
3.4.3 圖形嵌套
3.5 繪制三維圖形
3.5.1 三維曲線圖
3.5.2 三維散點圖
3.5.3 曲面圍
3.5.4 等高線
小結
習題
實驗
第4章 Pandas數據分析
4.1 Pandas數據結構
4.2 DataFrame基本功能
4.3 讀取外部數據
4.3.1 CSV文件
4.3.2 Sqlite數據庫
4.3.3 讀取外部數據-拓展
4.4 數據幀的列操作和行操作
4.4.1 列操作
4.4.2 行操作
4.5 高級索引
4.5.1 重建索引
4.5.2 更換索引
4.5.3 層次化索引
4.6 Pandas數據運算
4.6.1 算術運算
4.6.2 函數應用與映射運算
4.6.3 排序
4.6.4 疊代
4.6.5 唯一值與值計數
4.7 統計函數
4.7.1 描述性統計
4.7.2 變化率
4.7.3 協方差
4.7.4 相關性
4.7.5 數據排名
4.8 分組與聚合
4.8.1 分組
4.8.2 聚合
4.9 透視表與交叉表
4.9.1 透視表
4.9.2 交叉表
小結
習題
實驗
第5章 數據預處理
5.1 數據清洗
5.1.1 重覆值
5.1.2 缺失值
5.1.3 異常值
5.2 合並連接與重塑
5.2.1 merge合並
5.2.2 concat合並
5.2.3 combine first合並
5.2.4 數據重塑
5.3 數據變換
5.3.1 虛擬變量
5.3.2 函數變換
5.3.3 連續屬性離散化
5.3.4 規範化
5.3.5 隨機採樣
小結
習題
實驗
第6章 Sklearn機器學習
6.1 術語
6.2 Sklearn
6.2.1 Sklearn數據集
6.2.2 Sklearn常用算法
6.2.3 數據預處理
6.2.4 數據集拆分
6.2.5 模型評估
6.2.6 Sklearn常用方法
6.2.7 模型的保存和加載
6.3 降維
6.3.1 PCA(主成分分析)
6.3.2 LDA(線性評價分析)
6.4 回歸
6.4.1 線性回歸
6.4.2 邏輯回歸
6.4.3 回歸決策樹
6.5 分類
6.5.1 樸素貝葉斯分類
6.5.2 分類決策樹
6.5.3 SVM(支持向量機)
6.5.4 神經網絡
6.5.5 k-近鄰算法
6.6 聚類
6.6.1 K-means算法
6.6.2 DBSCAN
小結
習題
實驗
參考文獻