R 語言實戰 (R in Action: Data Analysis and Graphics with R) R语言实战 (图灵程序设计丛书 5)

Robert I. Kabacoff

  • 出版商: 人民郵電
  • 出版日期: 2013-12-12
  • 定價: $474
  • 售價: 8.5$403
  • 語言: 簡體中文
  • 頁數: 388
  • ISBN: 7115299900
  • ISBN-13: 9787115299901
  • 相關分類: R 語言Data Science
  • 已過版

買這商品的人也買了...

相關主題

商品描述

<內容簡介>

《圖靈程序設計叢書:R語言實戰》註重實用性,是一本全面而細緻的R指南,高度概括了該軟件和它的強大功能,展示了實用的統計示例,且對於難以用傳統方法處理的凌亂、不完整和非正態的數據給出了優雅的處理方法。作者不僅僅探討統計分析,還闡述了大量探索和展示數據的圖形功能。
《圖靈程序設計叢書:R語言實戰》適合數據分析人員及R用戶學習參考。

<目錄>
第一部分 入門
第1章 R語言介紹 3
1.1 為何要使用R? 4
1.2 R的獲取和安裝 6
1.3 R的使用 7
1.3.1 新手上路 7
1.3.2 獲取幫助 10
1.3.3 工作空間 10
1.3.4 輸入和輸出 12
1.4 包 14
1.4.1 什麼是包 14
1.4.2 包的安裝 14
1.4.3 包的加載 14
1.4.4 包的使用方法 15
1.5 批處理 15
1.6 將輸出用為輸入——結果的重用 16
1.7 處理大數據集 16
1.8 示例實踐 17
1.9 小結 18

第2章 創建數據集 19
2.1 數據集的概念 19
2.2 數據結構 20
2.2.1 向量 21
2.2.2 矩陣 22
2.2.3 數組 23
2.2.4 數據框 24
2.2.5 因子 27
2.2.6 列表 29
2.3 數據的輸入 30
2.3.1 使用鍵盤輸入數據 31
2.3.2 從帶分隔符的文本文件導入數據 32
2.3.3 導入Excel數據 33
2.3.4 導入XML數據 34
2.3.5 從網頁抓取數據 34
2.3.6 導入SPSS數據 34
2.3.7 導入SAS數據 34
2.3.8 導入Stata數據 35
2.3.9 導入netCDF數據 35
2.3.10 導入HDF5數據 35
2.3.11 訪問數據庫管理系統 36
2.3.12 通過Stat/Transfer導入數據 37
2.4 數據集的標註 37
2.4.1 變量標籤 38
2.4.2 值標籤 38
2.5 處理數據對象的實用函數 38
2.6 小結 39

第3章 圖形初階 40
3.1 使用圖形 40
3.2 一個簡單的例子 42
3.3 圖形參數 43
3.3.1 符號和線條 45
3.3.2 顏色 46
3.3.3 文本屬性 47
3.3.4 圖形尺寸與邊界尺寸 49
3.4 添加文本、自定義坐標軸和圖例 50
3.4.1 標題 51
3.4.2 坐標軸 52
3.4.3 參考線 54
3.4.4 圖例 54
3.4.5 文本標註 56
3.5 圖形的組合 58
3.6 小結 64

第4章 基本數據管理 65
4.1 一個示例 65
4.2 創建新變量 67
4.3 變量的重編碼 68
4.4 變量的重命名 69
4.5 缺失值 70
4.5.1 重編碼某些值為缺失值 71
4.5.2 在分析中排除缺失值 72
4.6 日期值 73
4.6.1 將日期轉換為字符型變量 74
4.6.2 更進一步 74
4.7 類型轉換 74
4.8 數據排序 75
4.9 數據集的合併 76
4.9.1 添加列 76
4.9.2 添加行 76
4.10 數據集取子集 77
4.10.1 選入(保留)變量 77
4.10.2 剔除(丟棄)變量 77
4.10.3 選入觀測 78
4.10.4 subset()函數 79
4.10.5 隨機抽樣 79
4.11 使用SQL語句操作數據框 80
4.12 小結 81

第5章 高級數據管理 82
5.1 一個數據處理難題 82
5.2 數值和字符處理函數 83
5.2.1 數學函數 83
5.2.2 統計函數 84
5.2.3 概率函數 86
5.2.4 字符處理函數 89
5.2.5 其他實用函數 90
5.2.6 將函數應用於矩陣和數據框 91
5.3 數據處理難題的一套解決方案 93
5.4 控制流 96
5.4.1 重複和循環 97
5.4.2 條件執行 97
5.5 用戶自編函數 99
5.6 整合與重構 101
5.6.1 轉置 101
5.6.2 整合數據 101
5.6.3 reshape包 102
5.7 小結 105

第二部分 基本方法
第6章 基本圖形 108
6.1 條形圖 108
6.1.1 簡單的條形圖 109
6.1.2 堆砌條形圖和分組條形圖 110
6.1.3 均值條形圖 111
6.1.4 條形圖的微調 112
6.1.5 棘狀圖 113
6.2 餅圖 114
6.3 直方圖 116
6.4 核密度圖 118
6.5 箱線圖 120
6.5.1 使用並列箱線圖進行跨組比較 121
6.5.2 小提琴圖 124
6.6 點圖 125
6.7 小結 128

第7章 基本統計分析 129
7.1 描述性統計分析 130
7.1.1 方法雲集 130
7.1.2 分組計算描述性統計量 133
7.1.3 結果的可視化 136
7.2 頻數表和列聯表 136
7.2.1 生成頻數表 137
7.2.2 獨立性檢驗 142
7.2.3 相關性的度量 144
7.2.4 結果的可視化 144
7.2.5 將表轉換為扁平格式 144
7.3 相關 146
7.3.1 相關的類型 146
7.3.2 相關性的顯著性檢驗 148
7.3.3 相關關係的可視化 150
7.4 t檢驗 150
7.4.1 獨立樣本的t檢驗 150
7.4.2 非獨立樣本的t檢驗 151
7.4.3 多於兩組的情況 152
7.5 組間差異的非參數檢驗 152
7.5.1 兩組的比較 152
7.5.2 多於兩組的比較 153
7.6 組間差異的可視化 155
7.7 小結 155

第三部分 中級方法
第8章 回歸 158
8.1 回歸的多面性 159
8.1.1 OLS回歸的適用情境 159
8.1.2 基礎回顧 160
8.2 OLS回歸 160
8.2.1 用lm()擬合回歸模型 161
8.2.2 簡單線性回歸 162
8.2.3 多項式回歸 164
8.2.4 多元線性回歸 167
8.2.5 有交互項的多元線性回歸 169
8.3 回歸診斷 171
8.3.1 標準方法 171
8.3.2 改進的方法 175
8.3.3 線性模型假設的綜合驗證 180
8.3.4 多重共線性 181
8.4 異常觀測值 181
8.4.1 離群點 182
8.4.2 高槓桿值點 182
8.4.3 強影響點 183
8.5 改進措施 186
8.5.1 刪除觀測點 186
8.5.2 變量變換 186
8.5.3 增刪變量 187
8.5.4 嘗試其他方法 188
8.6 選擇“最佳”的回歸模型 188
8.6.1 模型比較 188
8.6.2 變量選擇 189
8.7 深層次分析 193
8.7.1 交叉驗證 193
8.7.2 相對重要性 194
8.8 小結 197

第9章 方差分析 198
9.1 術語速成 198
9.2 ANOVA模型擬合 201
9.2.1 aov()函數 201
9.2.2 表達式中各項的順序 201
9.3 單因素方差分析 202
9.3.1 多重比較 204
9.3.2 評估檢驗的假設條件 206
9.4 單因素協方差分析 208
9.4.1 評估檢驗的假設條件 209
9.4.2 結果可視化 210
9.5 雙因素方差分析 211
9.6 重複測量方差分析 214
9.7 多元方差分析 216
9.7.1 評估假設檢驗 217
9.7.2 穩健多元方差分析 219
9.8 用回歸來做ANOVA 219
9.9 小結 221

第10章 功效分析 222
10.1 假設檢驗速覽 222
10.2 用pwr包做功效分析 225
10.2.1 t檢驗 225
10.2.2 方差分析 227
10.2.3 相關性 227
10.2.4 線性模型 228
10.2.5 比例檢驗 229
10.2.6 卡方檢驗 229
10.2.7 在新情況中選擇合適的效應值 230
10.3 繪製功效分析圖形 232
10.4 其他軟件包 234
10.5 小結 235

第11章 中級繪圖 ​​236
11.1 散點圖 237
11.1.1 散點圖矩陣 239
11.1.2 高密度散點圖 244
11.1.3 三維散點圖 247
11.1.4 氣泡圖 250
11.2 折線圖 252
11.3 相關圖 255
11.4 馬賽克圖 259
11.5 小結 261

第12章 重抽樣與自助法 263
12.1 置換檢驗 263
12.2 用coin包做置換檢驗 265
12.2.1 獨立兩樣本和K樣本檢驗 266
12.2.2 列聯表中的獨立性 267
12.2.3 數值變量間的獨立性 268
12.2.4 兩樣本和K樣本相關性檢驗 268
12.2.5 深入探究 269
12.3 lmPerm包的置換檢驗 269
12.3.1 簡單回歸和多項式回歸 269
12.3.2 多元回歸 271
12.3.3 單因素方差分析和協方差分析 271
12.3.4 雙因素方差分析 272
12.4 置換檢驗點評 273
12.5 自助法 273
12.6 boot包中的自助法 274
12.6.1 對單個統計量使用自助法 275
12.6.2 多個統計量的自助法 277
12.7 小結 279

第四部分 高級方法
第13章 廣義線性模型 282
13.1 廣義線性模型和glm()函數 282
13.1.1 glm()函數 283
13.1.2 連用的函數 284
13.1.3 模型擬合和回歸診斷 285
13.2 Logistic回歸 285
13.2.1 解釋模型參數 288
13.2.2 評價預測變量對結果概率的影響 289
13.2.3 過度離勢 290
13.2.4 擴展 291
13.3 泊松回歸 291
13.3.1 解釋模型參數 293
13.3.2 過度離勢 294
13.3.3 擴展 295
13.4 小結 297

第14章 主成分和因子分析 298
14.1 R中的主成分和因子分析 299
14.2 主成分分析 300
14.2.1 判斷主成分的個數 300
14.2.2 提取主成分 302
14.2.3 主成分旋轉 305
14.2.4 獲取主成分得分 306
14.3 探索性因子分析 307
14.3.1 判斷需提取的公共因子數 308
14.3.2 提取公共因子 309
14.3.3 因子旋轉 310
14.3.4 因子得分 313
14.3.5 其他與EFA相關的包 313
14.4 其他潛變量模型 314
14.5 小結 314

第15章 處理缺失數據的高級方法 316
15.1 處理缺失值的步驟 317
15.2 識別缺失值 318
15.3 探索缺失值模式 319
15.3.1 列表顯示缺失值 319
15.3.2 圖形探究缺失數據 320
15.3.3 用相關性探索缺失值 322
15.4 理解缺失數據的來由和影響 324
15.5 理性處理不完整數據 325
15.6 完整實例分析(行刪除) 326
15.7 多重插補 327
15.8 處理缺失值的其他方法 331
15.8.1 成對刪除 331
15.8.2 簡單(非隨機)插補 332
15.9 小結 332

第16章 高級圖形進階 333
16.1 R中的四種圖形系統 333
16.2 lattice包 334
16.2.1 條件變量 338
16.2.2 面板函數 339
16.2.3 分組變量 342
16.2.4 圖形參數 345
16.2.5 頁面擺放 346
16.3 ggplot2包 347
16.4 交互式圖形 351
16.4.1 與圖形交互:鑑別點 351
16.4.2 playwith 352
16.4.3 latticist 353
16.4.4 iplots包的交互圖形 354
16.4.5 rggobi 355
16.5 小結 356

後記:探索R的世界 357

附錄A 圖形用戶界面 359
附錄B 自定義啟動環境 362
附錄C 從R中導出數據 364
附錄D 製作出版級品質的輸出 366
附錄E R中的矩陣運算 374
附錄F 本書中用到的擴展包 376
附錄G 處理大數據 381
附錄H 更新R 383