深入淺出機器學習:從數據到AI算法
陳德忠,肖彧潔
- 出版商: 清華大學
- 出版日期: 2025-01-01
- 定價: $534
- 售價: 8.5 折 $454
- 語言: 簡體中文
- 頁數: 210
- ISBN: 7302678049
- ISBN-13: 9787302678045
-
相關分類:
Machine Learning
下單後立即進貨 (約4週~6週)
商品描述
"《深入淺出機器學習:從數據到大模型》是一本旨在幫助讀者系統學習機器學習的著作。本書通過深入淺出的方式,將復雜的機器學習理論和技術講解得深入淺出。 本書從機器學習的基礎開始,為讀者提供了對數據處理、特徵工程和模型評估等核心概念的全面介紹。讀者將學習如何準備和清洗數據,如何選擇和構建合適的特徵,並學會使用各種評估指標來評估模型性能。 然後,本書深入探討了常見的機器學習算法和技術。詳細解釋了線性回歸、邏輯回歸和神經網絡等算法的原理和應用,通過豐富的示例和實踐項目,掌握這些算法的實現和調優技巧。 本書聚焦於大規模模型和深度學習,介紹了深度學習的基本原理和常用的深度學習框架,如TensorFlow和PyTorch。讀者將學習如何構建深度神經網絡,如何進行模型訓練和調優,並瞭解大規模機器學習系統的實現和部署。"
作者簡介
肖彧潔,教授級高工,國際數字地球學會中國國家委員會空間信息產業化專業委員會委員。曾任職於中國智慧城市與大數據研究院,從事計算機軟件工程、網絡安全、數據科學應用等多學科的教學與科研工作,曾參與中國智慧城市頂層設計課題研究及規劃。
目錄大綱
第 1 章 AI 算法的基礎—數據
1.1 科學研究的兩種方法
1.2 深度學習技術也離不開對數據的觀察
1.3 一個通過數據觀察和分析的 AI 算法技術創新案例
1.4 數據問題導致的算法或項目失敗案例
1.4.1 忽視數據誤差
1.4.2 忽視數據特點
1.4.3 忽視人工標註數據的不可靠性
1.5 如何選擇合適的算法
1.6 數據是推進人工智能技術發展的“燃料”
第 2 章 培養對數據的敏銳觀察力
2.1 心中有“數”
2.2 數據理解力
2.3 實踐經驗積累
2.4 數據的復雜性
2.5 培養創新意識
2.6 兩種思維模式
2.7 觀察數據實現算法的案例
2.7.1 算法設計需求—檢測電路板中的污漬
2.7.2 觀察數據
2.7.3 算法設計
第 3 章 所有的努力都是為了提升概率—漫談數據分析方法
3.1 AI 系統的可靠性是個概率問題
3.2 呈高斯分佈的數據
3.3 高斯分佈與聚類分析
3.4 分析數據間的關系—相關性分析
3.5 數據頻域分析—如何理解傅里葉變換
3.5.1 捲積
3.5.2 復數
3.6 圖像數據分析
3.6.1 分析圖像數據的格式
3.6.2 分析圖像數據來源
3.6.3 分析圖像數據的生成場景
3.6.4 結合圖像識別需求分析圖像數據的特點
3.6.5 分析生成識別模型所需要的訓練圖像數量
3.7 自然語言數據分析要領
3.7.1 分析要處理的自然語言包含的語言種類
3.7.2 分析文本數據涉及的場景類型
3.7.3 分析文本數據的字符編碼
3.7.4 分析文本數據的大小
3.7.5 結合需求分析文本數據的特點
3.7.6 分析建立自然語言處理模型需要的數據量
3.8 一個充分分析文字數據特點實現算法設計的案例—數學相似題判斷方法
第4章 高維空間中的數據
4.1 高維災難
4.2 高維空間數據分佈特點
4.2.1 稀疏性
4.2.2 高維空間數據趨於錶面分佈
4.2.3 高維空間向量近似正交
4.3 高維空間難題的解決方法
4.4 高維空間數學理論應用案例
4.4.1 JL 引理.
116
4.4.2 壓縮感知
4.4.3 利用隨機投影獲取圖像特徵
4.4.4 利用隨機投影獲取到的特徵值進行運動物體跟蹤的方法
第5章 數據之間存在千絲萬縷的聯系
5.1 上下文關系
5.2 知識圖譜
5.3 事件圖譜
5.4 事件圖譜應用案例
5.4.1 大數據能做什麽
5.4.2 教學活動過程中的事件本體設計
5.4.3 教學活動過程大數據系統框架
5.4.4 教學過程中的事件圖譜應用
第6章 讓機器學會說話
6.1 語言的起源
6.1.1 不是只有人類才擁有“語言”
6.1.2 人類語言的形成過程
6.1.3 文字的產生
6.2 漢語和英語的語言差異
6.2.1 詞語
6.2.2 語法
6.3 Transformer 模型
6.3.1 人工神經網絡
6.3.2 Transformer 模型技術原理.
195
6.4 殊途同歸 . 201
6.4.1 智能涌現202
6.4.2 思維的機制202
6.4.3 人工智能“十問”206
後記 208