多元數據分析原理與實踐
楊壽淵
- 出版商: 清華大學
- 出版日期: 2023-11-01
- 定價: $479
- 售價: 8.5 折 $407
- 語言: 簡體中文
- ISBN: 730264862X
- ISBN-13: 9787302648628
-
相關分類:
Data Science
下單後立即進貨 (約2週~3週)
相關主題
商品描述
目錄大綱
目錄
第1章 導論與預備知識 1
1.1 數據分析的研究對象 1
1.2 向量空間 3
1.3 範數 7
1.4 內積空間 9
1.5 線性變換 12
1.6 特徵值與特徵向量 16
1.7 正交補空間和保範變換 23
1.8 多維隨機變量 26
1.8.1 隨機向量的分佈和獨立性 26
1.8.2 隨機向量的數字特徵 28
1.8.3 多維正態分佈 29
1.9 多元統計量及抽樣分佈 36
1.9.1 總體、樣本和統計量 36
1.9.2 估計量的評價標準 38
1.9.3 常用的多元抽樣分佈 41
拓展閱讀建議 44
第1章習題 44
第2章 方差分析 46
2.1 單變量的均值檢驗 46
2.2 單變量的方差分析 49
2.3 多元均值檢驗 54
2.4 多元方差分析 59
2.5 協方差矩陣相等的檢驗 62
2.6 MATLAB方差分析工具 64
拓展閱讀建議 67
第2章習題 68
第3章 關於總體分佈的檢驗和獨立性檢驗 69
3.1 擬合優度檢驗 69
3.1.1 多項分佈的中心極限定理 69
3.1.2 擬合優度檢驗 71
3.1.3 理論分佈中含有未知參數的擬合優度檢驗 75
3.2 正態性檢驗 78
3.2.1 圖示法 79
3.2.2 擬合優度檢驗 85
3.2.3 Kolmogorov-Smirnov檢驗 87
3.2.4 偏度和峰度 89
3.2.5 Jarque-Bera檢驗 91
3.3 獨立性檢驗 92
3.3.1 引例 92
3.3.2 列聯表分析 94
拓展閱讀建議 96
第3章習題 96
第4章 奇異值分解 99
4.1 奇異值分解定理 99
4.2 幾何解釋 104
4.3 應用 106
4.3.1 矩陣的低秩逼近和數據壓縮 106
4.3.2 超定線性方程組和矩陣的偽逆 112
拓展閱讀建議 114
第4章習題 114
第5章 多元線性回歸分析 116
5.1 線性回歸模型 116
5.2 最小二乘估計 117
5.3 幾何解釋 123
5.4 偏相關系數 126
5.5 線性回歸模型的推斷及評價 134
5.6 實例 137
拓展閱讀建議 140
第5章習題 140
第6章 主成分分析 142
6.1 概述 142
6.2 數學模型 143
6.3 主成分模型的解 144
6.4 主成分的性質 147
6.5 主成分分析的計算實現 150
6.6 實踐中需要考慮的問題 154
6.6.1 適合用主成分法降維的數據 154
6.6.2 是否先對數據進行標準化處理 156
6.6.3 應該保留多少個主成分 156
6.7 實例 161
拓展閱讀建議 164
第6章習題 164
第7章 因子分析 165
7.1 概述 165
7.2 數學模型 167
7.3 因子模型的參數估計 168
7.3.1 主成分法 169
7.3.2 主因子法 171
7.3.3 極大似然估計 173
7.3.4 三種參數估計法的比較 176
7.4 因子旋轉 179
7.4.1 基本思想 179
7.4.2 因子旋轉方法 180
7.4.3 應用實例 182
7.5 因子得分的估計 186
7.5.1 最小二乘法 186
7.5.2 加權最小二乘估計 187
7.5.3 回歸法 188
7.5.4 因子正交旋轉對因子得分的影響 189
7.5.5 應用實例 189
拓展閱讀建議 193
第7章習題 193
第8章 聚類分析 195
8.1 概述 195
8.2 相似性度量 196
8.2.1 距離 196
8.2.2 相似系數 198
8.2.3 用MATLAB計算距離矩陣和不相似度矩陣 199
8.3 系統聚類法 201
8.3.1 常用的系統聚類法 201
8.3.2 系統聚類法的步驟 205
8.3.3 系統聚類的實現 208
8.3.4 系統聚類法的性質 212
8.4 K-均值聚類 213
8.4.1 基本思想與算法 213
8.4.2 MATLAB實現 214
8.5 聚類分析實踐中常遇到的問題 216
8.5.1 變量的選取 216
8.5.2 確定類的個數 216
8.5.3 聚類結果的解釋 218
拓展閱讀建議 220
第8章習題 220
第9章 多維標度分析 221
9.1 概述 221
9.2 多維標度分析的古典解 222
9.2.1 基本概念 222
9.2.2 歐氏距離結構的充要條件 223
9.2.3 多維標度分析的古典解 227
9.2.4 計算實例 228
9.3 多維標度分析的古典解與主成分的聯系 233
9.4 非度量多維標度分析 235
9.4.1 概念及原理 235
9.4.2 實現 238
拓展閱讀建議 241
第9章習題 241
第10章 判別分析和邏輯回歸分析 243
10.1 概述 243
10.2 兩個總體的判別分析 244
10.2.1 判別模型 244
10.2.2 正態總體的平均錯判成本最小判別法 245
10.2.3 應用實例 247
10.3 多個總體的判別分析 253
10.3.1 後驗概率和Bayes公式 253
10.3.2 Bayes判別法 254
10.3.3 平均錯判成本最小判別法 255
10.3.4 計算實例 257
10.4 Fisher線性判別分析 262
10.4.1 基本思想 262
10.4.2 Fisher線性判別函數 263
10.4.3 計算實例 266
10.4.4 MATLAB的判別分析函數 270
10.5 邏輯回歸模型 271
10.5.1 基本思想及數學模型 271
10.5.2 模型參數估計 272
10.5.3 利用邏輯回歸模型分類 273
10.5.4 假設檢驗 274
10.5.5 應用實例 275
10.6 多分類的softmax回歸模型 278
10.6.1 模型與參數估計方法 278
10.6.2 應用實例 279
拓展閱讀建議 281
第10章習題 281
第11章 典型相關分析 284
11.1 概述 284
11.2 數學模型及求解 285
11.2.1 數學模型 285
11.2.2 模型求解 286
11.2.3 典型相關系數的顯著性檢驗 289
11.3 MATLAB實現及應用實例 289
11.3.1 MATLAB實現 289
11.3.2 應用實例 293
拓展閱讀建議 295
第11章習題 296
附錄A 2分佈、t分佈和F分佈 298
附錄B 多元正態總體參數的極大似然估計 305
附錄C 順序統計量和經驗分佈函數 309
C.1 順序統計量 309
C.2 經驗分佈函數 311
附錄D 矩陣函數的求導公式 317
部分習題答案 321
參考文獻 336