Mastering Exploratory Analysis with pandas: Build an end-to-end data analysis workflow with Python
暫譯: 掌握使用 pandas 的探索性分析:建立完整的 Python 數據分析工作流程
Harish Garg
- 出版商: Packt Publishing
- 出版日期: 2018-09-29
- 售價: $1,190
- 貴賓價: 9.5 折 $1,131
- 語言: 英文
- 頁數: 140
- 裝訂: Paperback
- ISBN: 1789619637
- ISBN-13: 9781789619638
-
相關分類:
Python、程式語言、Data Science
海外代購書籍(需單獨結帳)
買這商品的人也買了...
相關主題
商品描述
Explore Python frameworks like pandas, Jupyter notebooks, and Matplotlib to build data pipelines and data visualization
Key Features
- Learn to set up data analysis pipelines with pandas and Jupyter notebooks
- Effective techniques for data selection, manipulation, and visualization
- Introduction to Matplotlib for interactive data visualization using charts and plots
Book Description
The pandas is a Python library that lets you manipulate, transform, and analyze data. It is a popular framework for exploratory data visualization and analyzing datasets and data pipelines based on their properties.
This book will be your practical guide to exploring datasets using pandas. You will start by setting up Python, pandas, and Jupyter Notebooks. You will learn how to use Jupyter Notebooks to run Python code. We then show you how to get data into pandas and do some exploratory analysis, before learning how to manipulate and reshape data using pandas methods. You will also learn how to deal with missing data from your datasets, how to draw charts and plots using pandas and Matplotlib, and how to create some effective visualizations for your audience. Finally, you will wrapup your newly gained pandas knowledge by learning how to import data out of pandas into some popular file formats.
By the end of this book, you will have a better understanding of exploratory analysis and how to build exploratory data pipelines with Python.
What you will learn
- Learn how to read different kinds of data into pandas DataFrames for data analysis
- Manipulate, transform, and apply formulas to data imported into pandas DataFrames
- Use pandas to analyze and visualize different kinds of data to gain real-world insights
- Extract transformed data form pandas DataFrames and convert it into the formats your application expects
- Manipulate model time-series data, perform algorithmic trading, derive results on fixed and moving windows, and more
- Effective data visualization using Matplotlib
Who this book is for
If you are a budding data scientist looking to learn the popular pandas library, or a Python developer looking to step into the world of data analysis, this book is the ideal resource you need to get started. Some programming experience in Python will be helpful to get the most out of this course
Table of Contents
- Working with different kinds of Datasets
- Data Selection
- Manipulating, transforming and reshaping data
- Visualizing data like a pro
商品描述(中文翻譯)
**探索 Python 框架,如 pandas、Jupyter notebooks 和 Matplotlib,以建立數據管道和數據可視化**
#### 主要特點
- 學習如何使用 pandas 和 Jupyter notebooks 設置數據分析管道
- 有效的數據選擇、操作和可視化技術
- 介紹 Matplotlib 用於使用圖表和圖形進行互動式數據可視化
#### 書籍描述
pandas 是一個 Python 函式庫,讓您能夠操作、轉換和分析數據。它是一個流行的框架,用於探索性數據可視化和根據數據集及其屬性進行分析。
本書將成為您探索數據集的實用指南,使用 pandas。您將從設置 Python、pandas 和 Jupyter Notebooks 開始。您將學習如何使用 Jupyter Notebooks 執行 Python 代碼。接著,我們將向您展示如何將數據導入 pandas 並進行一些探索性分析,然後學習如何使用 pandas 方法操作和重塑數據。您還將學習如何處理數據集中的缺失數據,如何使用 pandas 和 Matplotlib 繪製圖表和圖形,以及如何為您的觀眾創建一些有效的可視化。最後,您將通過學習如何將數據從 pandas 導入一些流行的文件格式,來總結您新獲得的 pandas 知識。
在本書結束時,您將對探索性分析有更深入的了解,以及如何使用 Python 建立探索性數據管道。
#### 您將學到的內容
- 學習如何將不同類型的數據讀入 pandas DataFrames 以進行數據分析
- 操作、轉換並對導入到 pandas DataFrames 的數據應用公式
- 使用 pandas 分析和可視化不同類型的數據,以獲得現實世界的見解
- 從 pandas DataFrames 中提取轉換後的數據,並將其轉換為您的應用程序所需的格式
- 操作模型時間序列數據,執行算法交易,推導固定和移動窗口的結果等
- 使用 Matplotlib 進行有效的數據可視化
#### 本書適合誰
如果您是一位希望學習流行的 pandas 函式庫的初學數據科學家,或是一位希望進入數據分析領域的 Python 開發者,本書是您開始的理想資源。具備一些 Python 編程經驗將有助於您充分利用本課程。
#### 目錄
1. 處理不同類型的數據集
2. 數據選擇
3. 操作、轉換和重塑數據
4. 像專業人士一樣可視化數據