Data Manipulation with R, 2/e(Paperback)
暫譯: R資料處理,第二版(平裝本)

Jaynal Abedin, Kishor Kumar Das

  • 出版商: Packt Publishing
  • 出版日期: 2015-03-31
  • 售價: $1,350
  • 貴賓價: 9.5$1,283
  • 語言: 英文
  • 頁數: 161
  • 裝訂: Paperback
  • ISBN: 1785288814
  • ISBN-13: 9781785288814
  • 相關分類: R 語言Data Science
  • 海外代購書籍(需單獨結帳)

買這商品的人也買了...

相關主題

商品描述

Efficiently perform data manipulation using the split-apply-combine strategy in R

About This Book

  • Perform data manipulation with add-on packages such as plyr, reshape, stringr, lubridate, and sqldf
  • Learn about factor manipulation, string processing, and text manipulation techniques using the stringr and dplyr libraries
  • Enhance your analytical skills in an intuitive way through step-by-step working examples

Who This Book Is For

This book is for all those who wish to learn about data manipulation from scratch and excel at aggregating data effectively. It is expected that you have basic knowledge of R and have previously done some basic administration work with R.

What You Will Learn

  • Learn about R data types and their basic operations
  • Work efficiently with string, factor, and date variables using stringr
  • Understand group-wise data manipulation
  • Work with different layouts of R datasets and interchange between layouts for varied purposes
  • Manage bigger datasets using pylr and dpylr
  • Perform data manipulation with add-on packages such as plyr, reshape, stringr, lubridate, and sqldf
  • Manipulate datasets using SQL statements with the sqldf package
  • Clean and structure raw data for data mining using text manipulation

In Detail

This book starts with the installation of R and how to go about using R and its libraries. We then discuss the mode of R objects and its classes and then highlight different R data types with their basic operations.

The primary focus on group-wise data manipulation with the split-apply-combine strategy has been explained with specific examples. The book also contains coverage of some specific libraries such as lubridate, reshape2, plyr, dplyr, stringr, and sqldf. You will not only learn about group-wise data manipulation, but also learn how to efficiently handle date, string, and factor variables along with different layouts of datasets using the reshape2 package.

By the end of this book, you will have learned about text manipulation using stringr, how to extract data from twitter using twitteR library, how to clean raw data, and how to structure your raw data for data mining.

商品描述(中文翻譯)

有效地使用 R 中的分割-應用-合併策略進行數據操作

本書介紹



  • 使用附加套件如 plyr、reshape、stringr、lubridate 和 sqldf 進行數據操作

  • 學習使用 stringr 和 dplyr 函式庫進行因子操作、字串處理和文本操作技術

  • 通過逐步的實作範例增強您的分析技能

本書適合誰


本書適合所有希望從零開始學習數據操作並有效聚合數據的人。預期您對 R 有基本的了解,並且之前有進行過一些基本的 R 管理工作。

您將學到什麼



  • 了解 R 的數據類型及其基本操作

  • 使用 stringr 有效處理字串、因子和日期變數

  • 理解分組數據操作

  • 處理不同佈局的 R 數據集,並根據不同目的在佈局之間互換

  • 使用 plyr 和 dplyr 管理更大的數據集

  • 使用附加套件如 plyr、reshape、stringr、lubridate 和 sqldf 進行數據操作

  • 使用 sqldf 套件通過 SQL 語句操作數據集

  • 使用文本操作清理和結構原始數據以進行數據挖掘

詳細內容


本書從 R 的安裝開始,並介紹如何使用 R 及其函式庫。接著,我們討論 R 物件的模式及其類別,並強調不同 R 數據類型及其基本操作。


本書主要集中於使用分割-應用-合併策略進行分組數據操作,並通過具體範例進行說明。本書還涵蓋了一些特定的函式庫,如 lubridate、reshape2、plyr、dplyr、stringr 和 sqldf。您不僅會學習分組數據操作,還會學習如何有效處理日期、字串和因子變數,以及使用 reshape2 套件處理不同佈局的數據集。


在本書結束時,您將學會使用 stringr 進行文本操作,如何使用 twitteR 函式庫從 Twitter 提取數據,如何清理原始數據,以及如何為數據挖掘結構化您的原始數據。