機器學習中的樣例選擇

翟俊海

  • 出版商: 化學工業
  • 出版日期: 2024-11-01
  • 定價: $288
  • 售價: 8.5$245
  • 語言: 簡體中文
  • 頁數: 236
  • ISBN: 7301357192
  • ISBN-13: 9787301357194
  • 相關分類: Machine Learning
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

隨著數據存儲技術、網絡技術和雲計算技術的快速發展, 數據正以前所未有的速度在不斷地增長和積累。在各種實際應用中, 需要處理的數據量越來越大。 而樣例選擇就是從包括冗余或噪聲的海量數據中選擇重要數據的技術, 是機器學習的重要數據預處理步驟, 對後續學習算法的訓練及性能有很大的影響. 在機器學習中, 樣例選擇有兩種場景:一是主動學習場景, 二是監督學習場景. 本書結合作者及研究團隊近年來關於樣例選擇的研究成果, 系統介紹了兩種場景下樣例選擇的理論和方法以及兩種場景下樣例選擇之間的區別與聯系。另外,本書內容涵還蓋了樣例選擇的最新研究進展。

作者簡介

翟俊海:河北大學教授,博士生導師,河北省機器學習與計算智能重點實驗室主任,河北省機器學習學會理事長,河北省高校大數據教育聯盟專家委員會委員,河北大學學術委員會委員。中國人工智能學會知識工程與分布智能專業委員會委員、粒計算與知識發現專業委員會委員。主要研究方向為大數據處理、機器學習、深度學習。近5年主持和主研國家和省部級科研項目7項。發表學術論文70余篇,其中SCI檢索17篇,ESI高被引論文2篇。獲河北省自然科學三等獎1項(排名第2)。

目錄大綱

第1章 機器學習基礎
1.1 分類問題
1.2 K-近鄰算法
1.3 決策樹
1.4 神經網絡
1.5 極限學習機
1.6 支持向量機
第2章 主動學習中的樣例選擇
2.1 主動學習概述
2.2 樣例選擇準則
2.3 基於信息熵的主動學習
2.4 基於投票熵的主動學習
2.5 基於在線序列極限學習機的主動學習
第3章 監督學習中的樣例選擇
3.1 監督學習中的樣例選擇概述
3.2 壓縮近鄰算法及其變體
3.3 基於組合先驗熵和預測熵的樣例選擇算法
3.4 基於監督聚類的樣例選擇算法
3.5 基於概率神經網絡的樣例選擇算法
3.6 基於交叉驗證策略的樣例選擇算法
第4章 大數據樣例選擇
4.1 大數據與大數據樣例選擇概述
4.2 大數據主動學習
4.3 基於MapReduce和投票機制的大數據樣例選擇
4.4 基於局部敏感哈希和雙投票機制的大數據樣例選擇
4.5 基於遺傳算法和開源框架的大數據樣例選擇
第5章 模糊樣例選擇
5.1 壓縮模糊K-近鄰樣例選擇算法
5.2 基於MapReduce和Spark的大數據CFKNN算法
5.3 基於模糊粗糙集技術的樣例選擇算法
參考文獻