R語言數據分析與可視化
楊劍鋒、張豹、尹少齊、伍仕屹、楊雲江
- 出版商: 清華大學
- 出版日期: 2022-01-01
- 定價: $348
- 售價: 8.5 折 $296
- 語言: 簡體中文
- 頁數: 292
- 裝訂: 平裝
- ISBN: 7302591067
- ISBN-13: 9787302591061
-
相關分類:
R 語言、Data Science
立即出貨 (庫存=1)
買這商品的人也買了...
-
$301R語言入門與實踐
-
$505R語言入門經典
-
$480$379 -
$704R語言之書 編程與統計
-
$954$906 -
$352概率、決策與博弈: 基於R語言介紹 (Probability, Decisions and Games: A Gentle Introduction Using R)
-
$356數據可視化——基於R語言
-
$709高級 R語言編程指南, 2/e
-
$352深入淺出 R語言數據分析
-
$350$315 -
$560全棧性能測試修煉寶典 JMeter 實戰, 2/e
-
$599$473 -
$654$621 -
$505統計建模與 R軟件, 2/e
-
$414$393 -
$611R語言機器學習實戰
-
$1,200$792 -
$714$678 -
$654$621 -
$560$442 -
$479$455 -
$750$593 -
$1,200$948 -
$539$512 -
$490$387
相關主題
商品描述
本書涵蓋了R語言介紹、創建數據集、基本繪圖、高級繪圖、基本數據管理、高級數據管理、基本統計分析、高級統計分析、創建動態報告、R語言與Hadoop、R語言圖形用戶界面、綜合案例分析。 本書可以作為數據科學與大數據技術、統計學及相關專業本科生的教材使用,也可以作為高職高專數據分析與可視化專業的教材使用,同時可以供數據分析技術人員和R語言用戶使用。
作者簡介
楊劍鋒,貴州理工學院大數據學院大數據教研室主任,博士,副教授,瑞典耶夫勒大學訪問學者。主要研究方向:可靠性工程、應用統計、數據分析。主講課程:C語言程序設計、統計計算、統計建模與R語言、JAVA面向對象程序設計、大數據技術及應用實踐、離散數學等。發表學術論文30餘篇,其中SCI檢索3篇,EI檢索8篇;主持省部級項目2項、校級項目1項,參與國家自然科學基金項目1項、省部級項目2項、市廳級及其它項目2項;指導大學生創新創業項目8項;編寫大數據領域專著1部,信息專業本科教材1本。
目錄大綱
第1章R語言介紹1
1.1R語言概述1
1.1.1R語言簡介1
1.1.2R語言的特點與優勢2
1.1.3R語言的下載和安裝2
1.1.4R語言的應用前景2
1.2R語言的基本使用3
1.2.1R語言的入門3
1.2.2R語言的幫助功能5
1.2.3R語言的工作空間6
1.2.4R語言的輸入與輸出7
1.3R語言的軟件包8
1.3.1安裝包8
1.3.2載入包8
1.4小結8
習題8
第2章創建數據集9
2.1數據集的概念9
2.2數據結構9
2.2.1向量10
2.2.2矩陣11
2.2.3數組12
2.2.4數據框14
2.2.5列表15
2.3數據的輸入17
2.3.1使用鍵盤輸入數據17
2.3.2從帶分隔符的文本文件導入數據17
2.3.3導入Excel數據18
2.3.4導入SPSS數據18
2.3.5導入SAS數據19
2.3.6導入Stata數據19
2.4小結19
習題19
第3章基本繪圖20
3.1使用圖形20
3.2圖形參數21
3.2.1圖形參數簡介21
3.2.2符號和線條22
3.2.3顏色23
3.2.4文本屬性24
3.2.5圖形尺寸和邊界尺寸26
3.3添加文本、自定義坐標軸和圖例27
3.3.1標題28
3.3.2坐標軸28
3.3.3參考線30
3.3.4圖例30
3.3.5文本標註32
3.4散點圖32
3.4.1散點圖矩陣33
3.4.2三維散點圖33
3.4.3旋轉三維散點圖35
3.4.4氣泡圖36
3.5折線圖37
3.6圖形組合38
3.7小結42
習題42
第4章繪圖43
4.1R語言中的圖形43
4.2ggplot2包繪圖46
4.2.1幾何函數46
4.2.2分組圖形47
4.2.3網格圖形47
4.2.4光滑曲線48
4.2.5圖形外觀50
4.3lattice包繪圖55
4.3.1lattice包簡介55
4.3.2調節變量55
4.3.3自定義面板函數57
4.3.4圖形分組變量58
4.3.5修改圖形參數59
4.3.6圖形條帶60
4.3.7圖形頁面佈局61
4.3.8深入學習64
4.4保存圖形64
4.5繪圖實例66
4.6小結68
習題68
第5章基本數據管理70
5.1變量的定義70
5.1.1示例70
5.1.2創建新變量71
5.1.3變量的重編碼73
5.1.4變量的重命名74
5.2缺失值76
5.2.1缺失值判斷77
5.2.2缺失模型判斷78
5.2.3缺失值處理80
5.3日期值82
5.3.1創建日期型變量83
5.3.2日期值的格式轉換84
5.3.3日期值的運算86
5.4類型轉換87
5.5數據排序88
5.6數據集的合併90
5.6.1數據框添加列93
5.6.2數據框添加行94
5.7數據集取子集95
5.7.1選入(保留)變量95
5.7.2剔除(丟棄)變量96
5.7.3subset()函數97
5.7.4隨機抽樣97
5.8使用SQL語句操作數據框97
5.9小結98
習題98
第6章數據管理100
6.1數值和字符處理函數100
6.1.1數學函數100
6.1.2統計函數102
6.1.3概率函數103
6.1.4字符處理函數105
6.1.5其他實用函數106
6.1.6將函數應用於矩陣和數據框107
6.2控制流108
6.2.1重複和循環108
6.2.2條件執行109
6.3用戶自編函數111
6.4整合與重構112
6.4.1轉置112
6.4.2整合數據114
6.4.3reshape2包114
6.5數據管理實例118
6.6小結121
習題121
第7章基本統計分析122
7.1描述性統計分析122
7.1.1統計分析概述122
7.1.2方法雲集 128
7.1.3更多方法129
7.1.4分組計算描述性統計量131
7.1.5分組計算的擴展134
7.1.6結果的可視化135
7.2頻數表和列聯表154
7.2.1生成頻數表154
7.2.2生成列聯表155
7.2.3生成列聯表的擴展159
7.2.4獨立性檢驗160
7.2.5相關性的度量162
7.3相關分析163
7.3.1相關的類型163
7.3.2相關性的顯著性檢驗166
7.3.3相關關係的可視化168
7.4T檢驗統計量170
7.4.1獨立樣本的T檢驗170
7.4.2非獨立樣本的 T 檢驗171
7.5組間差異的非參數檢驗172
7.5.1兩組的比較172
7.5.2多組的比較174
7.6組間差異的可視化175
7.7小結181
習題181
第8章統計分析182
8.1回歸分析182
8.1.1回歸的多面性182
8.1.2OLS回歸183
8.1.3回歸診斷187
8.1.4異常觀測值189
8.2方差分析190
8.2.1ANOVA模型擬合190
8.2.2單因素方差分析195
8.2.3協方差分析195
8.2.4多因素方差分析196
8.3廣義線性回歸196
8.3.1廣義線性模型和glm()函數197
8.3.2logistic回歸199
8.4主成分分析和因子分析205
8.4.1主成分分析205
8.4.2因子分析207
8.5聚類分析209
8.5.1層次聚類分析209
8.5.2劃分聚類分析212
8.6統計分析實例214
8.7小結220
習題221
第9章創建動態報告222
9.1用模板生成報告222
9.2用R語言和Markdown創建動態報告224
9.3用R語言和LaTex創建動態報告230
9.3.1LaTex的基本語法230
9.3.2R LaTex創建動態報告232
9.3.3其他文檔編輯方法234
9.4用R語言和Open Document創建動態報告236
9.5用R語言和Microsoft Word創建動態報告237
9.6創建動態報告實例240
9.7小結241
習題241
第10章R語言與Hadoop243
10.1RHadoop包243
10.1.1RHadoop簡介243
10.1.2R語言與Hadoop的安裝244
10.1.3RHadoop的安裝246
10.2RHadoop的基本使用248
10.2.1rhdfs包的使用248
10.2.2rmr2包的使用250
10.3實例分析250
10.4小結252
習題252
第11章R語言圖形用戶界面253
11.1R語言圖形用戶界面簡介253
11.2集成開發環境RStudio254
11.2.1RStudio簡介254
11.2.2RStudio的安裝256
11.2.3RStudio的基本使用257
11.3交互式Web應用Shiny包257
11.3.1Shiny包的安裝258
11.3.2交互式Shiny Web應用的部署259
11.4可視化儀表板Flex Dashboard包261
11.5小結264
習題264
第12章綜合實例分析265
12.1實例背景265
12.2描述性統計分析267
12.3統計分析272
12.3.1相關分析可視化272
12.3.2回歸分析可視化273
12.3.3聚類分析可視化276
12.4小結277
參考文獻278