Excel+Python輕松掌握數據分析
曹化宇
- 出版商: 人民郵電
- 出版日期: 2024-10-01
- 定價: $539
- 售價: 8.5 折 $458 (限時優惠至 2024-12-31)
- 語言: 簡體中文
- 頁數: 383
- 裝訂: 平裝
- ISBN: 7115623813
- ISBN-13: 9787115623812
-
相關分類:
Excel、Data Science
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
$599$569 -
$650$514 -
$407Python 測試開發入門與實踐
-
$479$455 -
$203軟件定義網絡(SDN)技術與應用
-
$880$695 -
$780$608 -
$760PyTorch 電腦視覺實戰:目標偵測、影像處理與深度學習
-
$600$396 -
$505OpenCV4 應用發展:入門、進階與工程化實踐
-
$556大規模語言模型:從理論到實踐
-
$599$569 -
$505LangChain 入門指南:構建高可復用、可擴展的 LLM 應用程序
-
$356自然語言處理技術與應用
-
$700$553 -
$474$450 -
$708$673 -
$454MicroPython項目開發實戰
-
$580$458 -
$650$455 -
$580$458 -
$539$512 -
$356Flask Web應用開發項目實戰 基於Python和統信UOS
-
$660$515 -
$714$678
相關主題
商品描述
本書重點介紹了目前處理數據非常有效的工具——Excel、Python和數據庫的應用知識。本書通過一則完整的故事討論瞭如何以Python編程為中心,結合Excel和數據庫的特點,並以基礎統計學貫穿其中,幫助讀者深入地瞭解數據分析的相關知識。在本書中,首先,討論瞭如何使用Excel整理數據,以及Excel中數學和統計函數的應用;其次,探討了與Python編程相關的數據分析內容,包括在Python中進行數據統計工作,以及各種格式數據的轉換等;然後,討論SQLite和MySQL數據庫的應用,並介紹瞭如何使用Python操作數據庫;最後,介紹瞭如何綜合使用Excel、數據庫和Python編程等工具打造自動化的數據處理中心。
本書架構清晰,內容深入淺出,案例豐富,適合需要進行數據處理和統計分析的職場人士、電腦愛好者等閱讀。
作者簡介
曹化宇,獨立軟體開發人,擁有20餘年軟體開發經驗,從事Windows、.NET Framework、Android等應用開發,精通Web項目開發。編寫的圖書有《網站全栈開發指南:HTML+CSS+JavaScript+PHP》《網站全栈開發指南:HTML+CSS+JavaScript+ASP.NET》《Java與Android移動應用開發:技術、方法與實踐》《C#開發實用指南:方法與實踐》《Objective-C和Sprite Kit遊戲開發從入門到精通》《構建高質量的C#代碼》等。
目錄大綱
第 1章 網店開業——初識數據 1
1.1 清點庫存——獲取原始數據 1
1.2 數據標準化——整理Excel 數據 2
1.2.1 二維表 3
1.2.2 數據完整性與正確性 5
1.2.3 拆分數據——分列與 公式 7
1.2.4 數據類型和顯示格式 11
1.2.5 分而治之,按需組合 12
1.3 認識數據 14
1.3.1 定量數據和定性數據 14
1.3.2 絕對量與相對量 14
1.4 尋找“大客戶”——排序 16
1.5 數據挑著看——篩選 17
1.6 數據交換——Excel和CSV 19
第 2章 銷量的起伏——數據背後的 故事 25
2.1 銷售數據如何——簡單的統計 25
2.1.1 算術平均數 26
2.1.2 幾何平均數 27
2.1.3 眾數 30
2.1.4 最小值和最大值 32
2.1.5 中位數、四分位數和 百分位數 33
2.1.6 方差和標準差 35
2.1.7 標準分 36
2.1.8 分類匯總 38
2.1.9 數據透視表 41
2.2 學看統計圖 43
2.2.1 折線圖 43
2.2.2 餅圖 45
2.2.3 條形圖 46
2.3 銷量下降——是時候認真 分析數據了 47
2.3.1 轉化率——訪問量和 銷量 48
2.3.2 訪問量-購買量=? 50
第3章 凌晨3點——又加班了 51
3.1 多銷售渠道的煩惱 51
3.2 日報表、月報表、 年度報表等 53
第4章 強大的信息處理工具—— Python編程 54
4.1 創建Python環境 54
4.1.1 Visual Studio 54
4.1.2 代碼文件的編碼問題 56
4.1.3 使用指定版本的Python 58
4.1.4 設置Path環境變量 59
4.1.5 命令行窗口 61
4.1.6 Python命令行環境 62
4.2 編寫Python代碼 64
4.3 功能實現者——函數和lambda 表達式 66
4.3.1 函數 66
4.3.2 可調用類型 71
4.3.3 lambda表達式 73
4.4 “對象”是主角——面向對象 編程 74
4.4.1 類與對象 74
4.4.2 繼承 80
4.4.3 “魔術方法” 82
4.4.4 with語句 84
4.4.5 類成員和靜態方法 87
4.5 模塊化管理 91
4.6 向左還是向右——代碼流程 控制 96
4.6.1 條件判斷和if語句 96
4.6.2 循環語句 100
4.6.3 match語句 103
4.7 處理運行錯誤 104
第5章 更靈活的計算——在Python 中處理數據 108
5.1 不一樣的算術運算 108
5.2 隨機數 110
5.3 序列 112
5.3.1 列表 113
5.3.2 元組 121
5.3.3 數列 123
5.4 字典 124
5.5 集合 128
5.6 更自由的排列—— sorted() 函數 129
5.7 數學計算—— math模塊 131
5.8 統計資源—— statistics模塊 132
5.8.1 使用Fraction類處理 分數 132
5.8.2 算術平均數 133
5.8.3 幾何平均數 133
5.8.4 眾數 134
5.8.5 中位數 134
5.8.6 方差和標準差 135
5.9 計算百分位數 136
5.10 計算標準分數 139
5.11 按中文拼音排序 139
5.12 日期和時間 142
5.12.1 datetime類 142
5.12.2 時間間隔 143
5.12.3 時區 144
5.12.4 時間戳 144
5.12.5 日期和時間的推算 145
5.12.6 格式轉換 146
第6章 “超能熊貓”來幫忙—— pandas應用 149
6.1 Series對象 149
6.2 排序 152
6.3 統計方法 154
第7章 二維表模型—— DataFrame 158
7.1 DataFrame對象 158
7.2 讀取數據 160
7.2.1 iloc和loc屬性 160
7.2.2 讀取列 163
7.2.3 讀取行 164
7.3 排序 168
7.4 按條件查詢數據 170
7.5 處理空值數據 173
7.6 處理重復數據 174
7.7 數據旋轉 177
7.8 數據合並 178
7.9 數據連接 181
7.10 統計方法 182
7.11 分組 183
7.12 透視表 185
第8章 圖形更直觀——pandas 繪制統計圖 188
8.1 部分與整體的比例——餅圖 189
8.2 數據的關系與分佈——散點圖與 氣泡圖 193
8.3 趨勢——折線圖 197
8.4 更直觀的對比——條形圖 202
8.5 數據的“距”——箱線圖 209
第9章 數據中轉站——數據格式 轉換 211
9.1 xlwt模塊寫入Excel 211
9.2 xlrd模塊讀取Excel 215
9.3 openpyxl模塊讀寫Excel 217
9.4 pandas模塊讀寫Excel 220
9.5 csv模塊讀寫CSV數據 223
9.6 pandas模塊讀寫CSV數據 227
第 10章 強大的數據倉庫—— SQLite數據庫 229
10.1 使用DB Browser for SQLite 229
10.2 數據類型 230
10.3 數據表 230
10.3.1 創建表 230
10.3.2 表的關聯——主鍵、唯一 約束和外鍵 232
10.3.3 添加字段 234
10.3.4 刪除表 235
10.3.5 sqlite_master系統表 235
10.3.6 索引 236
10.4 導入CSV數據 236
10.5 查詢與視圖 237
10.5.1 查詢條件 238
10.5.2 排序 240
10.5.3 分組與統計 242
10.5.4 連接 243
10.5.5 聯合 245
10.5.6 limit和offset關鍵字 247
10.5.7 exists語句 248
10.5.8 case語句 248
10.5.9 視圖 249
10.5.10 將查詢結果 保存到表 251
10.5.11 將數據保存到CSV 文件 252
10.6 添加數據 252
10.7 修改數據 254
10.8 刪除數據 255
10.9 日期和時間的處理方式 255
第 11章 Python操作SQLite 261
11.1 應用基礎 261
11.1.1 執行SQL語句 262
11.1.2 讀取查詢結果 263
11.1.3 創建tSqlite類 263
11.2 查詢單值 265
11.3 查詢單條記錄 266
11.4 查詢多條記錄 267
11.5 查詢單列數據 270
11.6 添加數據 271
11.7 修改數據 273
11.8 刪除數據 274
11.9 擴展操作 275
11.9.1 自定義函數 275
11.9.2 聚合函數 277
11.9.3 排序規則 280
11.10 pandas讀取和寫入SQLite數據 282
第 12章 更大、更快、更強——MySQL數據庫 285
12.1 MySQL安裝與配置 285
12.2 使用HeidiSQL 289
12.3 常用數據類型 291
12.4 數據表 292
12.4.1 創建表 292
12.4.2 主鍵、唯一值和外鍵約束 294
12.4.3 修改字段定義 295
12.4.4 復製表結構 296
12.4.5 表的重命名(表的移動) 297
12.4.6 刪除表 298
12.4.7 索引 298
12.5 導入CSV數據 298
12.6 查詢和視圖 302
12.6.1 查詢條件與排序 302
12.6.2 分組與統計 307
12.6.3 連接 307
12.6.4 聯合 308
12.6.5 limit和offset關鍵字 310
12.6.6 exists語句 311
12.6.7 case語句 311
12.6.8 視圖 312
12.6.9 查詢結果保存到表 312
12.6.10 查詢結果導出CSV 313
12.7 數據添加、修改和刪除 314
12.7.1 添加數據 314
12.7.2 修改數據 315
12.7.3 刪除數據 315
12.8 常用函數與功能 315
12.8.1 統計與數學計算 315
12.8.2 文本操作 316
12.8.3 日期和時間 317
12.8.4 if()和ifnull()函數 320
12.8.5 判斷對象是否存在 320
12.9 存儲過程 321
第 13章 Python操作MySQL 323
13.1 應用基礎 323
13.1.1 連接數據庫 323
13.1.2 執行SQL並讀取查詢結果 324
13.1.3 使用參數傳遞數據 325
13.2 創建tMySql類 325
13.3 查詢單值 327
13.4 查詢單條記錄 328
13.5 查詢多條記錄 329
13.6 查詢單列數據 331
13.7 添加記錄 332
13.8 修改數據 335
13.9 刪除記錄 336
13.10 pandas讀取和寫入MySQL數據 337
第 14章 數據一籮筐——打造數據中心 339
14.1 創建數據中心 339
14.2 批量導入數據 341
14.2.1 標準化數據 341
14.2.2 導入Excel數據 342
14.3 定時導入 343
14.4 處理網絡數據 349
14.4.1 HTML表格 349
14.4.2 JSON 352
14.5 從圖像中識別數據OCR) 353
14.5.1 圖像識別——EasyOCR 354
14.5.2 裁剪圖片 356
14.5.3 保存到“數據中心” 359
第 15章 更深入的數據分析 365
15.1 客戶的抱怨——處理文本信息 365
15.1.1 字符串處理 366
15.1.2 正則表達式 368
15.2 關於服裝的信息 373
15.3 “購買指數”——產品推薦算法 374
第 16章 早上八點,一杯咖啡,一份報表 378
16.1 自動生成報表 378
16.1.1 數據計算 378
16.1.2 生成Excel報表 379
16.2 繼續前進 383