R數據分析秘笈 R数据分析秘笈
維西瓦·維斯瓦納坦 (Viswa Viswanathan), 珊蒂·維斯瓦納坦 (Shanthi Viswanathan)
- 出版商: 機械工業
- 出版日期: 2016-04-06
- 定價: $354
- 售價: 8.5 折 $301
- 語言: 簡體中文
- 頁數: 257
- 裝訂: 平裝
- ISBN: 7111531736
- ISBN-13: 9787111531739
-
相關分類:
Data Science
- 此書翻譯自: R數據分析秘笈
-
相關翻譯:
R數據分析秘笈 (簡中版)
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
$399$315 -
$235ggplot2:數據分析與圖形藝術
-
$454R 數據可視化手冊 (R Graphics Cookbook)
-
$352MATLAB 數據分析與挖掘實戰
-
$650$553 -
$2,180$2,071 -
$780$616 -
$3,050$2,898 -
$352R語言數據分析與挖掘實戰
-
$2,600$2,470 -
$860$774 -
$700$553 -
$30521天學通Python
-
$293Python 資料分析 (Python Data Analysis)
-
$1,780$1,691 -
$470$447 -
$505基於R語言的自動資料收集:網絡抓取和文本挖掘實用指南 (Automated Data Collection with R)
-
$383R語言實戰:程式設計基礎、統計分析與資料採擷寶典
-
$680$537 -
$420$210 -
$560$437 -
$420$332 -
$352R 語言數據分析
-
$454R語言與數據分析實戰
-
$352R圖形化數據分析
相關主題
商品描述
<內容介紹>
R作為一個可擴展的系統,其功能分佈在眾多的包中,每一個包囊括了大量函數,即使是經驗豐富的使用者也不會指望能將所有的細節記在腦海中。維西瓦·維斯瓦納坦、珊蒂·維斯瓦納坦編著的《R數據分析秘笈》在為已有一定基礎的R用戶提供現成的方法來實現很多重要的數據分析任務。當面對一個特定任務時,你可以在幾分鐘內找到合適的方法並實施,而不必在因特網或眾多書籍中苦苦搜索。
本書從各類源數據的讀入和調整,數據分析前的準備工作、清洗、轉換,到面向各類需求的各種模型,再到能夠顯著提高效率的自動化報告系統knitr和交互式可視化系統shiny,最後到與Java、MySQL、MongoDB和Excel之間的配合工作,為初級和中級數據分析師準備了80多種實用方法,幫助你完成真實場景中的各項任務。
<章節目錄>
譯者序
作者簡介
審校者簡介
前言
第1章 獲取並準備好材料—數據
1.1 引言
1.2 從csv文件中讀取數據
1.3 讀取XML數據
1.4 讀取JSON數據
1.5 從定寬格式文件中讀取數據
1.6 從R數據文件和R庫中讀取數據
1.7 刪除帶有缺失值的樣本
1.8 用均值填充缺失值
1.9 刪除重複樣本
1.10 將變量縮放至[0,1]區間
1.11 對數據框中的數據做正則化或標準化
1.12 為數值數據分箱
1.13 為分類變量創建啞變量
第2章 那裡面有什麼——探索性數據分析
2.1 引言
2.2 創建標準化數據概覽
2.3 抽取數據集的子集
2.4 分割數據集
2.5 創建隨機數據分塊
2.6 創建直方圖、箱線圖、散點圖等標準化圖像
2.7 在網格窗口上創建多個圖像
2.8 選擇圖形設備
2.9 用lattice包繪圖
2.10 用ggplot2包繪圖
2.11 創建便於比較的圖表
2.12 創建有助於發現因果關係的圖表
2.13 創建多元圖像
第3章 它屬於哪兒——分類技術
3.1 引言
3.2 創建誤差/分類–混淆矩陣
3.3 創建ROC圖
3.4 構建、繪製和評估—分類樹
3.5 用隨機森林模型分類
3.6 用支持向量機分類
3.7 用樸素貝葉斯分類
3.8 用K最近鄰分類
3.9 用神經網絡分類
3.10 用線性判別函數分類
3.11 用邏輯回歸分類
3.12 用AdaBoost來整合分類樹模型
第4章 給我一個數——回歸分析
4.1 引言
4.2 計算均方根誤差
4.3 建立用於回歸的KNN模型
4.4 運用線性回歸
4.5 在線性回歸中運用變量選擇
4.6 建立回歸樹
4.7 建立用於回歸的隨機森林模型
4.8 用神經網絡做回歸
4.9 運用K-折交叉驗證
4.10 運用留一交叉驗證來限制過度擬合
第5章 你能化簡它嗎——數據簡化技術
5.1 引言
5.2 用K-均值聚類法實現聚類分析
5.3 用系統聚類法實現聚類分析
5.4 用主成分分析降低維度
第6章 從歷史中學習——時間序列分析
6.1 引言
6.2 創建並檢查日期對象
6.3 對日期對象進行操作
6.4 對時間序列數據做初步分析
6.5 使用時間序列對象
6.6 分解時間序列
6.7 對時間序列數據做濾波
6.8 用HoltWinters 方法實現平滑和預測
6.9 創建自動的ARIMA模型
第7章 這都是你的關係——社交網絡分析
7.1 引言
7.2 通過公共API下載社交網絡數據
7.3 創建鄰接矩陣和連邊列表
7.4 繪製社交網絡數據
7.5 計算重要的網絡度量指標
第8章 展現你最好的一面——製作文檔和呈現分析報告
8.1 引言
8.2 用R Markdown 和 knitR創建數據分析報告
8.3 用shiny創建交互式Web應用
8.4 用R Presentation為分析報告創建PDF幻燈片
第9章 事半功倍——高效且簡潔的R代碼
9.1 引言
9.2 利用向量化操作
9.3 用apply函數操作整行或整列
9.4 用lapply和sapply將函數應用於整組元素
9.5 在向量的一個子集上應用函數
9.6 用plyr完成分割–應用–組合策略
9.7 用數據表對數據進行切片、切塊和組合
第10章 在哪兒——地理空間信息數據分析
10.1 引言
10.2 下載並繪製一個地區的谷歌地圖
10.3 在已下載的谷歌地圖上疊加數據
10.4 將ESRI形狀文件導入到R中
10.5 使用sp包繪製地理數據
10.6 從maps包中獲取地圖
10.7 從包含空間及其他數據的普通數據框中創建空間數據框
10.8 通過合併普通數據框和空間對象生成空間數據框
10.9 為已有的空間數據框添加變量
第11章 友好協作——連接到其他系統
11.1 引言
11.2 在R中使用Java對象
11.3 從Java中用JRI調用R函數
11.4 從Java中用Rserve調用R函數
11.5 從Java中執行R腳本
11.6 使用xlsx包連接到Excel
11.7 從關係型數據庫—MySQL中讀取數據
11.8 從非關係型數據庫—MongoDB中讀取數據