Python數據分析實戰——從Excel輕松入門Pandas
曾賢志
- 出版商: 清華大學
- 出版日期: 2022-05-01
- 定價: $474
- 售價: 8.5 折 $403
- 語言: 簡體中文
- ISBN: 7302602816
- ISBN-13: 9787302602811
-
相關分類:
Excel、Data Science
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
$500$475 -
$379Python 3 網絡爬蟲實戰
-
$237從Excel到Python:用Python輕松處理Excel數據
-
$356Excel儀表盤實戰
-
$620$490 -
$1,194$1,134 -
$504$479 -
$359跟李銳學Excel數據分析
-
$509機器學習極簡入門
-
$458輕鬆學 MATLAB 2021 從入門到實戰 (案例·視頻·彩色版)
-
$380$296 -
$600$468 -
$680$578 -
$520$390 -
$500$390 -
$654$621 -
$352MATLAB 修煉之道:編程實例透析
-
$1,014$963 -
$356Stata統計分析從入門到精通
-
$708$673
相關主題
商品描述
目錄大綱
目錄
第1章Pandas數據處理環境搭建
1.1Pandas環境配置
1.1.1安裝Python發行版本Anaconda
1.1.2程序編寫工具Jupyter Notebook
1.2Python基礎操作
1.2.1變量
1.2.2註釋
1.2.3代碼縮進
1.2.4數據結構
1.2.5控制語句
1.2.6函數
第2章Pandas中數據的存取
2.1讀取Excel文件數據
2.2讀取CSV文件數據
2.3保存為Excel文件格式
2.4保存為CSV文件格式
2.5Pandas中表格的結構
2.5.1DataFrame數據結構
2.5.2Series數據結構
第3章NumPy數據處理基石
3.1NumPy的定義
3.2NumPy數組的創建與轉換
3.2.1普通數組
3.2.2序列數組
3.2.3隨機數組
3.2.4轉換數組
3.3NumPy數組的預處理
3.3.1類型轉換
3.3.2缺失值處理
3.3.3重復值處理
3.4NumPy數組維度轉換
3.4.1數組維度轉換
3.4.2數組合並
3.5Series數據的創建
3.6DataFrame表格的創建
3.6.1使用NumPy數組創建DataFrame表格
3.6.2使用Python列表創建DataFrame表格
3.6.3使用Python字典創建DataFrame表格
第4章表格管理技術
4.1表格屬性獲取與修改
4.1.1表格屬性的獲取
4.1.2表格屬性修改
4.2表格的切片選擇
4.2.1切片法
4.2.2篩選法
4.2.3loc切片法
4.2.4iloc切片法
4.3添加表格的行和列
4.3.1添加行
4.3.2添加列
4.4刪除表格的行和列
4.4.1刪除行
4.4.2刪除列
4.4.3刪除有缺失值的行和列
4.5表格數據的修改
4.6鞏固案例
第5章數據處理基礎
5.1數據運算處理
5.1.1運算符與運算函數
5.1.2Series與單值的運算
5.1.3DataFrame與單值運算
5.1.4Series與Series運算
5.1.5DataFrame與DataFrame運算
5.1.6DataFrame與Series運算
5.1.7數據運算時的對齊特性
5.2數據分支判斷
5.2.1條件判斷處理1(mask()與where())
5.2.2條件判斷處理2(np.where())
5.3數據遍歷處理
5.3.1遍歷Series元素(map())
5.3.2遍歷DataFrame行和列(apply())
5.3.3遍歷DataFrame元素(applymap())
5.4數據統計處理
5.4.1聚合統計
5.4.2邏輯統計
5.4.3極值統計
5.4.4排名統計
5.5鞏固案例
5.5.1根據不同蔬菜的採購數量統計每天採購金額
5.5.2篩選出成績表中各科目均大於或等於100的記錄
5.5.3篩選出成績表中各科目的和大於或等於300的記錄
5.5.4統計每個人各科目總分之和的排名
5.5.5統計每個人所有考試科目的最優科目
第6章字符串清洗技術
6.1正則
6.1.1正則表達式的導入與創建
6.1.2正則表達式處理函數
6.1.3正則表達式編寫規則
6.2拆分
6.2.1普通拆分
6.2.2正則拆分
6.2.3拆分次數
6.2.4拆為表格
6.2.5實例應用
6.3提取
6.3.1將數據提取到列方向
6.3.2將數據提取到行方向
6.3.3實例應用
6.4查找
6.4.1查找位置
6.4.2查找判斷
6.4.3查找數據
6.4.4實例應用
6.5替換
6.5.1Series數據替換
6.5.2DataFrame表格替換
6.5.3實例應用
6.6長度
6.7重復
6.8修剪
6.9填充
6.9.1元素填充
6.9.2字符填充
6.10去重
6.10.1重復項判斷
6.10.2重復項刪除
6.11排序
6.11.1單列排序
6.11.2多列排序
6.11.3自定義排序
6.12合並
6.12.1Series數據自身元素合並
6.12.2Series數據與其他數據合並
6.13擴展
6.14鞏固案例
6.14.1篩選出分數中至少有3個大於或等於90分的記錄
6.14.2兩表查詢合並應用
6.14.3給關鍵信息加掩碼
6.14.4提取文本型單價後與數量做求和統計
6.14.5提取不重復名單
6.14.6對文本中的多科目成績排序
第7章日期和時間處理技術
7.1時間戳
7.1.1單個時間戳
7.1.2時間戳序列
7.1.3時間戳轉換
7.1.4時間戳信息獲取
7.2時間差
7.2.1單個時間差
7.2.2時間差序列
7.2.3時間差信息獲取
7.2.4時間差偏移
7.3鞏固案例
7.3.1根據出生日期計算年齡
7.3.2將不規範日期整理為標準日期
7.3.3根據開始時間到結束時間的時長計算金額
7.3.4根據借書起始時間及租借天數計算歸還日期
第8章高級索引技術
8.1Pandas索引
8.1.1Series索引
8.1.2DataFrame索引
8.2分層索引的設置
8.2.1Series的分層索引設置
8.2.2DataFrame的分層索引設置
8.3分層索引設置的4種方法
8.4文件導入導出時分層索引設置
8.5行索引與列數據的相互轉換
8.5.1列數據設置為行索引
8.5.2行索引設置為列數據
8.6分層索引切片
8.6.1選擇單行
8.6.2選擇單列
8.6.3選擇單值
8.6.4選擇多行多列
8.6.5選擇指定級別數據
8.6.6篩選索引
8.7索引的修改
8.7.1索引重命名
8.7.2索引重置
8.7.3索引排序
8.7.4索引層級交換
8.7.5索引刪除
8.8鞏固案例
8.8.1篩選出下半年總銷量大於上半年的記錄
8.8.2對文本型數字月份排序
8.8.3根據分數返回等級設置索引
第9章數據匯總技術
9.1分組處理
9.1.1分組
9.1.2聚合
9.1.3轉換
9.1.4過濾
9.1.5高級分組
9.2數據透視表
9.2.1指定索引方向分組聚合
9.2.2多列執行單種聚合
9.2.3單列執行多種聚合
9.2.4多列執行多種聚合
9.2.5指定列做指定聚合
9.2.6行索引和列索引分組聚合
9.2.7跟列數據長度相同的數組做分組
9.2.8數據透視表缺失值處理
9.2.9數據透視表的行和列總計設置
9.3鞏固案例
9.3.1提取各分組的前兩名記錄
9.3.2按條件篩選各分組的記錄
9.3.3提取各分組下的唯一值
9.3.4分組批量拆分表格到Excel文件
9.3.5將數據透視表拆分為Excel文件
第10章表格轉換技術
10.1表格方向轉換
10.1.1列索引數據轉換成行索引數據
10.1.2將行索引數據轉換成列索引數據
10.2表格縱橫拼接
10.2.1表格縱向拼接(初級)
10.2.2表格縱向拼接(進階)
10.2.3表格橫向拼接(初級)
10.2.4表格橫向拼接(進階)
10.3表格數據存取
10.3.1批量讀取
10.3.2批量保存
10.4鞏固案例
10.4.1多個工作表數據合並
10.4.2工資條製作
10.4.3特殊的縱向表格拼接
10.4.4多工作表合並與聚合處理
10.4.5跨表查詢後再聚合匯總
10.4.6將匯總結果分發到不同工作表