從Excel到Python數據分析——Pandas、xlwings、openpyxl、Matplotlib的交互與應用
黃福星
- 出版商: 清華大學
- 出版日期: 2023-12-01
- 定價: $534
- 售價: 8.5 折 $454
- 語言: 簡體中文
- 頁數: 362
- 裝訂: 平裝
- ISBN: 7302640947
- ISBN-13: 9787302640943
-
相關分類:
Excel、Data Science
立即出貨
相關主題
商品描述
本書採用理論與實踐相結合的原則,在各章的開篇會採用圖解方式,將所有知識點先貫穿起來,然後對每個知識點配套案例講解。“用讀者易於理解且可隨時直接套用的案例,方便讀者以最短的時間高效掌握最實用的技能”是本書創作的初衷。 全書共分為6篇:第一篇為入門篇(第1章和第2章),第二篇為基礎篇(第3章和第4章),第三篇為強化篇(第5~7章),第四篇為進階篇(第8章和第9章), 第五篇為高階篇(第10章和第11章), 第六篇為案例篇(第12章)。書中主要內容包括開啟Python之旅、Python基礎入門、Pandas數據提取、Pandas數據轉換、Pandas文本與日期、Pandas數據處理、Pandas數據重塑、xlwings高效辦公、openpyxl高效辦公、Python數據處理自動化、Python數據分析自動化、Excel+Python綜合應用。 本書適用於具有一些數據分析或Python基礎的讀者,包括電商客服、質量統計、財務金融、人事行政等與數據分析密切相關的從業人員,也可作為高等院校、IT培訓機構或IT專業人士的參考書籍。
目錄大綱
目錄
本書源碼
第一篇入門篇
第1章開啟Python之旅
1.1Python快速入門
1.1.1Python進化史
1.1.2搭建編程環境
1.2Anaconda下載與安裝
1.2.1下載Anaconda
1.2.2安裝Anaconda
1.2.3使用Anaconda
1.3Jupyter Notebook
1.3.1操作界面
1.3.2Code運行模式
1.3.3Markdown模式
1.3.4常用快捷鍵
1.3.5常用魔法命令
第2章Python基礎入門
2.1程序設計
2.1.1編碼規範
2.1.2命名規範
2.1.3保留字
2.1.4標識符
2.1.5變量
2.1.6代碼縮進
2.1.7註釋
2.1.8輸入與輸出
2.2數據結構
2.2.1列表
2.2.2元組
2.2.3字典
2.2.4集合
2.3數據類型
2.3.1數值型
2.3.2字符串型
2.3.3布爾型
2.4運算符
2.4.1算術運算符
2.4.2賦值運算符
2.4.3比較運算符
2.4.4邏輯運算符
2.4.5位運算符
2.5數據算法
2.5.1順序結構
2.5.2分支結構
2.5.3循環結構
2.6迭代器與生成器
2.6.1迭代器
2.6.2生成器
2.7函數與方法
2.7.1內置函數
2.7.2自定義函數
2.7.3匿名函數
2.8異常處理
2.8.1內置異常
2.8.2異常處理
第二篇基礎篇
第3章Pandas數據提取
3.1Pandas簡介
3.1.1Pandas數據分析
3.1.2SMED與數據分析
3.1.3Excel數據的讀取流程
3.2pd.read_excel()函數
3.2.1路徑參數
3.2.2引擎參數
3.3工作表名稱
3.3.1選擇工作簿中的所有工作表
3.3.2選擇工作簿中指定的工作表
3.3.3選擇工作簿中具體的某一工作表
3.4標題
3.4.1提升為標題
3.4.2不需要標題
3.4.3多層索引
3.5處理行
3.5.1跳過行
3.5.2保留行
3.6選擇列
3.6.1指定索引列
3.6.2選擇列
3.7數據類型
3.7.1查看數據類型
3.7.2轉換數據類型
3.7.3解析日期時間列
3.8對Excel的讀取與解析
3.9存儲數據
3.9.1to_excel
3.9.2ExcelWriter
第4章Pandas數據轉換
4.1Pandas入門
4.1.1數據處理流程
4.1.2數據轉換內容
4.2創建Series
4.2.1列表轉Series
4.2.2元組轉Series
4.2.3字典轉Series
4.2.4ndarray轉Series
4.2.5常量轉Series
4.3創建DataFrame
4.3.1文件導入生成
4.3.2Series創建
4.3.3字典創建
4.3.4二維列表創建
4.3.5元組創建
4.4索引與切片
4.4.1直接索引
4.4.2標簽索引
4.4.3位置索引
4.5邏輯值篩選
4.5.1索引器訪問
4.5.2查詢方法
4.6移動列
4.7選擇列
4.7.1篩選列
4.7.2選擇數據類型
4.8列名修改
4.8.1列名替換
4.8.2重命名列
4.9添加列
4.9.1屬性賦值
4.9.2分配新列
4.9.3表達式創建新列
4.10添加行
4.10.1追加行
4.10.2添加多行
4.11刪除操作
4.11.1刪除
4.11.2刪除缺失值
4.11.3刪除重復項
4.12填充操作
第三篇強化篇
第5章Pandas文本與日期
5.1字符串處理
5.1.1字符串處理流程
5.1.2正則表達式
5.1.3文本正則應用
5.2日期和時間
5.2.1時間點
5.2.2時間段
5.2.3時間差
5.2.4時間偏移
5.2.5頻率轉換
第6章Pandas數據處理
6.1數據對齊
6.1.1對齊性
6.1.2空值處理
6.1.3設置行索引
6.1.4重置索引或層級
6.1.5重置行列索引
6.2數值排序
6.2.1排序規則
6.2.2索引排序
6.2.3數值排序
6.2.4數據排名
6.3統計分析
6.3.1統計學基礎
6.3.2唯一值
6.3.3聚合統計
6.3.4聚合運算
6.4移動窗口
6.4.1滾動
6.4.2差分
6.4.3偏移
6.4.4擴展
6.4.5同環比
6.5數據遍歷
6.5.1映射
6.5.2應用
6.5.3應用映射
6.5.4轉換
6.6數據分組
6.6.1創建分組對象
6.6.2分組對象的應用
6.6.3扁平化分組表
6.6.4循環分組對象
6.7數據透視
第7章Pandas數據重塑
7.1多層索引
7.1.1生成多層索引
7.1.2設置多層索引
7.2結構重塑
7.2.1重置索引
7.2.2從列到行堆疊
7.2.3從行到列取消堆疊
7.2.4逆透視
7.2.5層級交換
7.2.6重新排列索引級別
7.2.7刪除層級
7.2.8行列轉置
7.2.9擴展到行
7.3追加查詢
7.3.1數據追加
7.3.2縱橫拼接
7.4合並查詢
7.4.1數據合並
7.4.2按索引合並
7.5在Power BI中運行
7.5.1緣何從Excel進階Python
7.5.2Power BI與Pandas的互補性
第四篇進階篇
第8章xlwings高效辦公
8.1xlwings對象模型
8.2xlwings基礎語法
8.2.1新建工作簿
8.2.2打開工作簿
8.2.3新增工作表
8.2.4寫入數據
8.2.5單元格引用
8.2.6合並單元格
8.2.7單元格區域
8.2.8應用程序接口
8.2.9區域調整
8.2.10選項方法
8.3xlwings工作表調整
8.3.1加密工作簿
8.3.2保護工作表
8.3.3隱藏工作表
8.3.4凍結窗格
8.4xlwings行列調整
8.4.1插入公式
8.4.2插入行列
8.4.3刪除行列
8.4.4行高與列寬
8.5xlwings樣式調整
8.5.1字體樣式
8.5.2邊框樣式
8.5.3對齊樣式
8.5.4填充樣式
8.5.5數據格式
8.5.6條件格式
8.5.7表格格式
8.6xlwings添加圖表
8.6.1xlwings插入圖片
8.6.2xlwings創建圖表
8.6.3與Pandas交互
8.6.4與NumPy及Matplotlib交互
8.6.5與Pandas及Matplotlib交互
8.6.6與Pandas及Seaborn交互
8.7與Pandas的用法對比
8.7.1拆分列並擴展到行
8.7.2查看所有工作表名稱
8.7.3打開一個已有工作簿
8.7.4在一個工作簿中新增一個工作表
第9章openpyxl高效辦公
9.1openpyxl基礎語法
9.1.1創建、保存工作簿
9.1.2打開工作簿
9.1.3創建、刪除工作表
9.1.4復制、移動工作表
9.1.5移動區域範圍
9.1.6合並單元格
9.1.7行列範圍用法
9.2openpyxl工作表調整
9.2.1保護工作表
9.2.2隱藏工作表
9.2.3凍結窗格
9.2.4標簽顏色
9.3openpyxl行列應用
9.3.1插入公式
9.3.2插入行列
9.3.3刪除行列
9.3.4隱藏行列
9.3.5行高與列寬
9.3.6數據組合
9.4openpyxl樣式設置
9.4.1字體樣式
9.4.2邊框樣式
9.4.3對齊樣式
9.4.4填充樣式
9.4.5文本樣式
9.4.6數據格式
9.4.7條件格式
9.5openpyxl數據處理
9.5.1行值統計
9.5.2列值統計
9.6openpyxl添加圖表
9.6.1添加圖片
9.6.2添加圖表
9.7openpyxl與Pandas交互
9.7.1openpyxl獲取來自Pandas的數據
9.7.2Pandas獲取來自openpyxl的數據
第五篇高階篇
第10章Python數據處理自動化
10.1pathlib基礎
10.1.1常用方法
10.1.2路徑處理
10.1.3批量重命名應用
10.1.4與xlwings交互
10.1.5與openpyxl交互
10.2批量創建空白工作簿
10.2.1Pandas實現方式
10.2.2xlwings實現方式
10.2.3openpyxl實現方式
10.3批量操作單個工作簿
10.3.1將一個工作表復制到另一個工作簿
10.3.2將一個工作表批量復制到多個工作簿
10.3.3在一個工作表旁新增多個工作表
10.3.4將所有工作表合並成一個工作表
10.3.5按列值將一個工作表拆分成多個工作表
10.3.6按表名將多個工作表拆分為多個工作簿
10.3.7按列將一個工作表拆分成多個工作簿
10.3.8將一個工作表拆分成多個工作簿的多個工作表
10.3.9重命名一個工作簿中的所有工作表
10.3.10刪除一個工作簿中的指定工作表
10.4批量操作多個工作簿
10.4.1批量打開現有工作簿
10.4.2將多個工作簿中所有工作表合並為一個工作表
10.4.3批量重命名多個工作簿中的同名工作表
10.4.4在多個工作簿中批量刪除工作表
10.4.5批量隱藏工作簿中的工作表
第11章Python數據分析自動化
11.1數據分析方法論
11.1.1數據分析方法
11.1.2數據分析的5W1H
11.1.3數據分析流程
11.1.4Pandas數據分析應用
11.2單個工作簿數據處理
11.2.1對所有工作表進行數據篩選
11.2.2對所有工作表進行批量排序
11.2.3對所有工作表求最大值和最小值
11.2.4對所有工作表進行各自統計
11.2.5對所有工作表進行數據透視
11.3多個工作簿數據處理
11.3.1對所有工作簿的數據批量排序
11.3.2對多個工作簿批量統計最大值和最小值
11.3.3對多個工作簿中的各工作表分類匯總
11.3.4對多個工作簿批量製作數據透視表
11.4圖表與數據的綜合應用
11.4.1圖表的應用
11.4.2添加柱形圖
11.4.3添加簇狀柱形圖
11.4.4添加雙軸組合圖
11.4.5添加多個子圖
11.4.6Matplotlib應用流程
11.5批量打印工作簿中的工作表
11.6批量加密保護工作簿
第六篇案例篇
第12章Excel+Python綜合應用
12.1綜觀全局
12.1.1數據獲取
12.1.2信息獲取
12.2數據質量
12.2.1異常值探究
12.2.2缺失值處理
12.3數據現狀
12.3.1現狀摸底
12.3.2數據觀測
12.4數據分析
12.4.1分組統計
12.4.2數據透視
12.4.3時序分析
12.5數據可視化
12.5.1統計操作量
12.5.2管理標準差
12.5.3數據集子圖
12.5.4流向流量圖
12.6數據自動化