R語言入門與實踐

張婷

  • 出版商: 清華大學
  • 出版日期: 2024-07-01
  • 售價: $534
  • 貴賓價: 9.5$507
  • 語言: 簡體中文
  • ISBN: 7302663963
  • ISBN-13: 9787302663966
  • 相關分類: R 語言
  • 立即出貨

  • R語言入門與實踐-preview-1
  • R語言入門與實踐-preview-2
  • R語言入門與實踐-preview-3
R語言入門與實踐-preview-1

商品描述

"《R語言入門與實踐》循序漸進、由淺入深地講解了R語言開發技術,並通過具體實例講解了R語言的各個知識點。本書共分12章,其中第1~2章是基礎知識部分,講解了R語言開發的基礎知識,包括R語言基礎、R語言語法基礎;第3~6章是核心語法部分,分別講解了流程控制語句、函數、數據結構、包和環境空間等知識,這部分內容介紹的是R語言中最重要的語法知識;第7~10章是進階提高部分,分別講解了數據輸入和導出、數據處理、繪制可視化圖、R語言和人工智能等知識,這部分內容是R語言開發技術的重點和核心;第11章和第12章是綜合實戰部分,講解了兩個大型案例的實現過程,介紹了R語言在大型商業項目中的應用。 《R語言入門與實踐》不僅可以作為R語言初學者的學慣用書,也適合有一定R語言基礎的讀者學習,還可以作為高等院校相關專業的教學用書和培訓機構的教材。 "

目錄大綱

目錄 

第1章  R語言基礎 1

1.1  R語言的發展歷程 2

1.2  R語言的特點 2

1.3  安裝R語言運行環境 3

1.3.1  Windows系統安裝R語言 3

1.3.2  在Linux系統和macOS系統安裝R語言 6

1.4  R語言開發工具:R GUI 7

1.4.1  命令行方式運行R程序 7

1.4.2  文件方式運行R程序 8

1.5  R語言開發工具:RStudio 9

1.5.1  安裝RStudio 10

1.5.2  RStudio界面 12

1.5.3  使用RStudio開發R程序 13

1.6  認識第一個R程序:石頭、剪刀、布游戲 15

1.6.1  新建R工程 15

1.6.2  編寫程序文件 16

第2章  R語言語法基礎 19

2.1  註釋 20

2.2  標識符和關鍵字 21

2.2.1  標識符 21

2.2.2  關鍵字 22

2.3  常量和變量 23

2.3.1  常量 23

2.3.2  變量 25

2.4  數據類型 27

2.4.1  數據的分類 27

2.4.2  整型 29

2.4.3  實數型 29

2.4.4  邏輯型 30

2.4.5  復數型 30

2.4.6  字符串型 31

2.4.7  因子型 32

2.5  向量 33

2.5.1  創建向量 33

2.5.2  訪問向量中的元素 34

2.5.3  修改向量中的元素 35

2.5.4  向向量中添加新元素 36

2.5.5  向量運算 37

2.5.6  向量統計 37

2.5.7  類型轉換 39

2.6  運算符和表達式 42

2.6.1  算術運算符 43

2.6.2  關系運算符 44

2.6.3  邏輯運算符 45

2.6.4  賦值運算符 46

2.6.5  其他運算符 47

2.6.6  運算符的優先級 49

第3章  流程控制語句 51

3.1  條件語句 52

3.1.1  條件語句介紹 52

3.1.2  if語句 53

3.1.3  if...else語句 53

3.1.4  if…else if…else語句 54

3.1.5  switch 語句 56

3.2  循環語句 58

3.2.1  repeat語句 58

3.2.2  while語句 59

3.2.3  for語句 60

3.3  循環控制語句 61

3.3.1  break 語句 61

3.3.2  next 語句 62

第4章  函數 65

4.1  函數基礎 66

4.1.1  函數的特徵和好處 66

4.1.2  R 語言函數和其他編程語言函數的區別 67

4.2  定義函數 67

4.2.1  定義函數的語法格式 67

4.2.2  函數的參數 68

4.2.3  函數的返回值 70

4.3  函數調用 72

4.3.1  使用位置參數 72

4.3.2  使用關鍵字參數 73

4.3.3  使用默認參數 74

4.3.4  存儲函數返回值 76

4.4  內置函數 77

4.4.1  數學和統計函數 78

4.4.2  字符和字符串處理函數 79

4.4.3  文件操作函數 82

4.4.4  概率分佈函數 86

4.4.5  日期和時間函數 89

第5章  數據結構 95

5.1  矩陣 96

5.1.1  創建和訪問矩陣 96

5.1.2  轉置操作 98

5.1.3  求和、平均值和總和 99

5.1.4  行和列操作 100

5.1.5  矩陣運算 101

5.1.6  索引和切片 103

5.2  列表 104

5.2.1  創建和訪問列表 104

5.2.2  更新列表元素 107

5.2.3  遍歷列表 109

5.3  數組 111

5.3.1  創建數組 112

5.3.2  訪問數組 113

5.3.3  修改數組元素 115

5.3.4  數組運算 115

5.3.5  數組轉置 116

5.3.6  數組重塑 117

5.3.7  數組合並 118

5.3.8  數組排序 120

5.3.9  數組切片 121

5.4  數據框 121

5.4.1  創建數據框 122

5.4.2  訪問數據框 123

5.4.3  添加新列 127

5.4.4  修改數據框元素 128

5.4.5  聚合操作 130

5.4.6  排序 131

5.5  因子 133

5.5.1  創建因子 133

5.5.2  因子水平標簽 134

5.5.3  生成因子水平 135

5.6  數據表 137

5.6.1  創建數據表 137

5.6.2  對數據表的操作 139

5.7  時間序列 143

5.7.1  創建時間序列 143

5.7.2  時間序列的可視化 145

5.7.3  時間序列的索引和切片 147

5.7.4  時間序列的分析和建模 149

5.7.5  時間序列的統計性質 150

第6章  包和環境空間 153

6.1  包(Package) 154

6.1.1  R語言包的管理 154

6.1.2  自定義R包 157

6.2  環境空間 159

6.2.1  環境空間的種類 159

6.2.2  環境空間的特徵 160

6.2.3  使用全局環境 160

6.2.4  使用函數環境 162

6.2.5  使用用戶定義的環境 164

6.2.6  使用包環境 165

6.2.7  使用臨時環境 166

第7章  數據輸入和導出 169

7.1  數據輸入和導出介紹 170

7.2  使用鍵盤輸入數據 170

7.3  操作CSV文件 172

7.3.1  CSV文件的優點 172

7.3.2  讀取CSV文件 173

7.3.3  寫入CSV文件 174

7.3.4  數據轉換和處理 175

7.4  Excel文件 178

7.4.1  R語言和Excel文件 178

7.4.2  使用包readxl 179

7.4.3  使用包openxlsx 180

7.5  XML文件 182

7.5.1  使用包XML 182

7.5.2  使用包xml2 185

7.6  JSON文件 187

7.6.1  JSON包 187

7.6.2  使用包jsonlite 188

7.6.3  使用包RJSONIO 190

7.6.4  使用包tidyjson 192

7.7  MySQL數據庫連接 193

7.7.1  和MySQL相關的包 193

7.7.2  使用包RMySQL 194

7.7.3  使用包RMariaDB 195

7.7.4  使用包DBI 197

7.7.5  包dplyr和包dbplyr 198

7.8  從網頁抓取數據 200

7.8.1  R語言和網絡爬蟲 200

7.8.2  使用包rvest抓取數據 201

7.8.3  使用包httr抓取數據 202

7.8.4  使用包XML抓取數據 204

7.8.5  使用包jsonlite抓取數據 205

第8章  數據處理 207

8.1  R語言和數據處理 208

8.1.1  R語言的優勢 208

8.1.2  數據處理和數據分析的

區別 209

8.2  內置數據處理函數 209

8.2.1  查看、篩選和編輯數據 209

8.2.2  合並數據 212

8.2.3  分組和匯總 215

8.2.4  排序 217

8.2.5  轉換 218

8.3  apply函數族 220

8.3.1  apply函數族中的函數 220

8.3.2  函數apply() 220

8.3.3  函數lapply() 222

8.3.4  函數sapply() 223

8.3.5  函數vapply() 224

8.3.6  函數mapply() 225

第9章  繪制可視化圖 229

9.1  R語言繪圖系統 230

9.1.1  常用的繪圖包 230

9.1.2  基本繪圖函數plot() 230

9.2  單變量繪圖 232

9.2.1  繪制直方圖 232

9.2.2  繪制條形圖 236

9.2.3  繪制餅形圖 240

9.2.4  繪制箱線圖 242

9.2.5  繪制密度圖 244

9.3  雙變量繪圖 247

9.3.1  繪制雙變量條形圖 248

9.3.2  繪制雙變量散點圖 252

9.3.3  繪制雙變量折線圖 255

9.3.4  繪制雙變量箱線圖 258

9.4  繪制多變量圖 261

9.4.1  繪制多變量氣泡圖 261

9.4.2  繪制多變量熱力圖 265

9.5  文件數據的可視化 268

9.5.1  CSV文件數據的可視化 268

9.5.2  Excel文件數據的可視化 270

9.5.3  XML文件數據的可視化 271

9.5.4  JSON文件數據的可視化 273

9.5.5  MySQL數據庫數據的可視化 275

第10章  R語言和人工智能 277

10.1  機器學習 278

10.1.1  機器學習相關包 278

10.1.2  包caret 278

10.1.3  包randomForest 285

10.1.4  包e1071 288

10.1.5  包glmnet 291

10.1.6  包xgboost 293

10.2  深度學習 294

10.2.1  包keras 294

10.2.2  包tensorflow 298

第11章  心力衰竭數據分析系統 303

11.1  背景介紹 304

11.1.1  數據分析在醫療行業的作用 304

11.1.2  心力衰竭臨床記錄介紹 304

11.2  需求分析 305

11.3  系統介紹 306

11.3.1  系統功能模塊 306

11.3.2  系統模塊結構 307

11.4  技術分析 307

11.4.1  Web包Shiny 307

11.4.2  交互式表格包DT 308

11.4.3  集成可視化包tidyverse 308

11.4.4  圖形排列包gridExtra 309

11.5  UI界面 309

11.5.1  導入包 309

11.5.2  設計UI 310

11.6  Server服務器端 313

11.6.1  準備工作 313

11.6.2  數據預處理 314

11.6.3  數據可視化 316

11.6.4  數據導出 318

11.7  調試運行 319

第12章  基於機器學習的患者再入院預測分析系統 323

12.1  背景介紹 324

12.2  需求分析 324

12.3  系統分析 325

12.4  系統介紹 326

12.4.1  系統功能介紹 326

12.4.2  系統模塊結構 326

12.5  技術分析 327

12.5.1  dplyr:數據預處理 327

12.5.2  psych:心理學和社會科學研究 328

12.5.3  ROSE:不平衡處理 329

12.5.4  caret模型訓練和評估 330

12.6  數據處理 330

12.6.1  導入數據集 331

12.6.2  數據預處理 333

12.7  第一方案 342

12.7.1  劃分訓練集和測試集 342

12.7.2  數據集平衡 343

12.7.3  交叉驗證 343

12.7.4  模型比較 347

12.8  第二方案 349

12.8.1  數據集拆分和數據平衡 349

12.8.2  邏輯回歸模型擬合和預測 350

12.8.3  計算處理 350

12.8.4  邏輯回歸模型的擬合、預測和評估 351

12.8.5  使用交叉驗證方法訓練決策樹模型 352

12.8.6  使用交叉驗證方法訓練隨機森林模型 353

12.8.7  實現樸素貝葉斯模型 354

12.9  模型訓練和評估 356

12.9.1  數據預處理 356

12.9.2  邏輯回歸模型的訓練和評估 357

12.9.3  決策樹模型的訓練和評估 358

12.9.4  隨機森林模型的訓練和評估 359

12.9.5  樸素貝葉斯模型的訓練和評估 360

12.10  結論 361