人工智能的數學基礎——數據之本

於江生

  • 出版商: 清華大學
  • 出版日期: 2024-08-01
  • 定價: $1,008
  • 售價: 8.5$857
  • 語言: 簡體中文
  • ISBN: 7302627355
  • ISBN-13: 9787302627357
  • 下單後立即進貨 (約4週~6週)

  • 人工智能的數學基礎——數據之本-preview-1
  • 人工智能的數學基礎——數據之本-preview-2
  • 人工智能的數學基礎——數據之本-preview-3
人工智能的數學基礎——數據之本-preview-1

相關主題

商品描述

"統計學是在概率論基礎上發展起來的一門應用數學的學問。在自然科學、工程學、社會學、人文學、軍事學等諸多應用領域,凡是涉及數據的收集、處理、分析、可視化和解釋等方面的問題,都是統計學大顯身手的舞臺。 統計學既是應用數學的一個分支,又是一門推斷的藝術,其中不乏有哲學思辯和信念差異。來自不同學派的觀點相互碰撞,使得統計學在二十世紀飛速發展。今天,借助電腦的幫助,人們可以從各個角度探索數據的本質。然而,我們仍需時刻提醒自己,在算力之上,精巧的算法永遠重要。 本書延續了《隨機之美》的寫作風格,以二十世紀最偉大的兩位統計學家羅納德·艾爾默·費舍爾和耶澤·內曼為故事的主角,介紹了現代統計學的一些主要成果。這兩位統計學大師同屬頻率派,均為貝葉斯主義的反對者,然而二人之間也有過很多饒有趣味的學術之爭,至今對我們仍有啟發。 二十一世紀是人工智能和大數據的時代,統計學和電腦科學應該如何結合才能互惠互利?如何站在人工智能的角度看待數據和數據分析?還有很多統計應用的問題值得我們深思。作者希望通過此書喚起普通讀者對統計學的興趣,用它去推動人工智能、大數據分析的發展。這本書也是統計機器學習的入門,幫助讀者從經典統計學順利過渡到這個新興領域。"

目錄大綱

目   錄

第一部分 統計學歷史背景

第 1 章 費舍爾和內曼的學術成就  3

1.1 費舍爾生平  11

1.1.1 費舍爾的主要著作  13

1.1.2 費舍爾的統計思想  16

1.2 內曼生平  22

1.2.1 內曼的置信區間與假設檢驗  24

1.2.2 內曼的歸納行為 .26

第 2 章 數理統計學簡史  31

2.1 20 世紀前的統計學 .33

2.2 20 世紀上半葉的統計學  35

2.3 20 世紀下半葉的統計學  36

2.4 21 世紀的統計學  38

2.5 推薦讀物  42

第二部分 經典統計學

第 3 章 統計學的一些基本概念  45

3.1 樣本的特徵  49

3.1.1 次序統計量  55

3.1.2 經驗分佈及其性質  60

3.1.3 樣本矩及其極限分佈  67

3.2 樣本統計量及其性質  69

3.2.1 統計量的抽樣分佈  71

3.2.2 重抽樣和自助法. 76

3.2.3 統計量的充分性 .79

第 4 章 參數估計理論  84

4.1 點估計及其優良性  92

4.1.1 相合性與漸近正態性  96

4.1.2 有效性  100

4.1.3 折刀法  105

4.1.4 點估計之矩方法和最大似然法  107

4.2 內曼置信區間估計  120

4.2.1 基於馬爾可夫不等式的區間估計  122

4.2.2 樞軸量法  124

4.2.3 大樣本區間估計  128

4.2.4 費舍爾的信任估計  132

第 5 章 假設檢驗 137

5.1 內曼-皮爾遜假設檢驗理論 .145

5.1.1 功效函數與兩類錯誤的概率  151

5.1.2 內曼-皮爾遜基本引理與似然比檢驗  157

5.1.3 廣義似然比檢驗  163

5.1.4 假設檢驗與置信區間估計的關系  169

5.2 大樣本檢驗  173

5.2.1 擬合優度檢驗 177

5.2.2 獨立性的列聯表檢驗  184

第 6 章 回歸分析與方差分析  188

6.1 線性回歸模型  193

6.1.1 最小二乘估計 194

6.1.2 線性回歸的若乾性質  200

6.1.3 回歸模型的假設檢驗  203

6.1.4 正交多項式回歸  205

6.1.5 貝葉斯線性回歸  211

6.1.6 對數率回歸  214

6.2 方差分析模型  219

6.2.1 單因素方差分析  223

6.2.2 兩因素方差分析  225

第三部分 現代統計學

第 7 章 多元統計分析簡介  235

7.1 核方法及其在回歸上的應用  243

7.1.1 核函數的性質 246

7.1.2 基於最優化的核線性回歸  247

7.1.3 貝葉斯核線性回歸  252

7.2 特徵工程  255

7.2.1 主成分分析  260

7.2.2 因子分析  270

7.2.3 獨立成分分析 278

7.2.4 多維縮放與等距映射  284

7.2.5 局部嵌入的降維  288

7.2.6 塔克分解  294

7.3 聚類  301

7.3.1 層級聚類  303

7.3.2 k-均值聚類  307

7.4 分類  310

7.4.1 近鄰法  323

7.4.2 決策樹  327

7.4.3 費舍爾線性判別分析  339

7.4.4 支持向量機  344

7.4.5 基於高斯過程的分類  348

7.4.6 人工神經網絡 350

第 8 章 期望最大化算法  362

8.1 完全數據與最大似然估計  366

8.1.1 EM 算法及其收斂速度  367

8.1.2 指數族的 EM 算法 370

8.2 期望最大化算法的應用 373

8.2.1 分支個數已知的高斯混合模型  375

8.2.2 針對刪失數據的 EM 算法  378

8.2.3 概率潛在語義分析  381

8.3 數據增擴算法與缺失數據分析  385

8.3.1 經典的數據增擴算法  386

8.3.2 窮人的數據增擴算法  392

第 9 章 時間序列分析初步  397

9.1 時間序列模型  405

9.1.1 ARMA 模型  408

9.1.2 樣本(偏)自相關函數. 419

9.1.3 經典分解模型 422

9.2 預測與估計  428

9.2.1 指數平滑  433

9.2.2 最佳線性預測 435

9.2.3 ARMA 模型的估計  441

9.3 隱馬爾可夫模型及算法 445

9.3.1 隱馬爾可夫模型  449

9.3.2 概率有限狀態轉換器  452

9.3.3 觀測序列的概率:向前算法與向後算法 456

9.3.4 狀態序列的概率:維特比算法  460

9.3.5 模型參數的估計:鮑姆-韋爾奇算法  462

9.4 狀態空間模型與卡爾曼濾波  466

9.4.1 狀態的最佳線性估計  471

9.4.2 參數估計  477

第四部分 附 錄

附錄 A 軟件 R、Maxima 和 GnuPlot 簡介  483

A.1 R:最好的統計軟件  483

A.2 Maxima:符號計算的未來之路  485

A.3 GnuPlot:強大的函數繪圖工具 .490

附錄 B 一些常用的最優化方法  491

B.1 梯度下降法. 494

B.2 高斯-牛頓法  495

B.3 拉格朗日乘子法  497

B.4 非線性優化方法  500

B.5 隨機最優化 502

附錄 C 核密度估計 504

附錄 D 再生核希爾伯特空間  508

D.1 希爾伯特空間  511

D.2 內積矩陣與距離矩陣  514

D.3 核函數的判定條件 515

附錄 E 張量分析淺嘗  520

E.1 張量的定義. 523

E.2 張量的代數運算  526

E.3 張量場  528

E.4 曲線坐標  531

附錄 F 參考文獻  536

附錄 G 符號表  544

附錄 H 名詞索引  546

H.1 術語索引  546

H.2 人名索引  557