Data Manipulation with R
暫譯: 使用 R 進行資料處理

Jaynal Abedin

  • 出版商: Packt Publishing
  • 出版日期: 2014-01-18
  • 售價: $1,350
  • 貴賓價: 9.5$1,283
  • 語言: 英文
  • 頁數: 102
  • 裝訂: Paperback
  • ISBN: 178328109X
  • ISBN-13: 9781783281091
  • 海外代購書籍(需單獨結帳)

相關主題

商品描述

Perform group-wise data manipulation and deal with large datasets using R efficiently and effectively

Overview

  • Perform factor manipulation and string processing
  • Learn group-wise data manipulation using plyr
  • Handle large datasets, interact with database software, and manipulate data using sqldf

In Detail

One of the most important aspects of computing with data is the ability to manipulate it to enable subsequent analysis and visualization. R offers a wide range of tools for this purpose. Data from any source, be it flat files or databases, can be loaded into R and this will allow you to manipulate data format into structures that support reproducible and convenient data analysis.

This practical, example-oriented guide aims to discuss the split-apply-combine strategy in data manipulation, which is a faster data manipulation approach. After reading this book, you will not only be able to efficiently manage and check the validity of your datasets with the split-apply-combine strategy, but you will also learn to handle larger datasets.

This book starts with describing the R object's mode and class, and then highlights different R data types, explaining their basic operations. You will focus on group-wise data manipulation with the split-apply-combine strategy, supported by specific examples. You will also learn to efficiently handle date, string, and factor variables along with different layouts of datasets using the reshape2 package. You will learn to use plyr effectively for data manipulation, truncating and rounding data, simulating data sets, as well as character manipulation. Finally you will get acquainted with using R with SQL databases.

What you will learn from this book

  • Learn R data types and their basic operations
  • Deal efficiently with string, factor, and date
  • Understand group-wise data manipulation
  • Work with different layouts of the R dataset and interchange between layouts for different purposes
  • Connect R with database software to manage relational databases
  • Manage bigger datasets using R
  • Manipulate datasets using SQL statements through the sqldf package

Approach

This book is a step-by step, example-oriented tutorial that will show both intermediate and advanced users how data manipulation is facilitated smoothly using R.

Who this book is written for

This book is aimed at intermediate to advanced level users of R who want to perform data manipulation with R, and those who want to clean and aggregate data effectively. Readers are expected to have at least an introductory knowledge of R and some basic administration work in R, such as installing packages and calling them when required.

商品描述(中文翻譯)

執行群組資料操作並有效率地處理大型資料集,使用 R 進行操作

概述
- 執行因子操作和字串處理
- 學習使用 plyr 進行群組資料操作
- 處理大型資料集,與資料庫軟體互動,並使用 sqldf 操作資料

詳細內容
計算資料的一個最重要的方面是能夠操作資料,以便進行後續的分析和視覺化。R 提供了廣泛的工具來達成這個目的。來自任何來源的資料,無論是平面檔案還是資料庫,都可以載入到 R 中,這將使您能夠將資料格式轉換為支持可重現和方便的資料分析的結構。

這本實用的、以範例為導向的指南旨在討論資料操作中的分割-應用-合併策略,這是一種更快速的資料操作方法。在閱讀完這本書後,您不僅能夠有效地管理和檢查您的資料集的有效性,還能學會處理更大的資料集。

本書首先描述 R 物件的模式和類別,然後強調不同的 R 資料類型,解釋其基本操作。您將專注於使用分割-應用-合併策略進行群組資料操作,並輔以具體範例。您還將學會有效地處理日期、字串和因子變數,以及使用 reshape2 套件處理不同佈局的資料集。您將學會有效地使用 plyr 進行資料操作、截斷和四捨五入資料、模擬資料集以及字元操作。最後,您將熟悉如何將 R 與 SQL 資料庫結合使用。

您將從本書中學到的內容
- 學習 R 資料類型及其基本操作
- 有效處理字串、因子和日期
- 理解群組資料操作
- 處理不同佈局的 R 資料集,並根據不同目的在佈局之間互換
- 將 R 與資料庫軟體連接以管理關聯資料庫
- 使用 R 管理更大的資料集
- 通過 sqldf 套件使用 SQL 語句操作資料集

方法
本書是一個逐步的、以範例為導向的教程,將向中級和高級用戶展示如何順利地使用 R 進行資料操作。

本書的讀者對象
本書針對希望使用 R 進行資料操作的中級到高級用戶,以及希望有效清理和聚合資料的人士。讀者預期至少具備 R 的入門知識,以及一些基本的 R 管理工作,例如安裝套件和在需要時調用它們。