數據流機器學習:MOA (Machine Learning for Data Streams)

[法] 阿爾伯特·比費特(Albert Bifet) [西班牙] 理乍得·戈華達(Richard Gavaldà) [新西蘭] 傑弗里·福爾摩斯(Geoffrey Holmes) [新西蘭] 伯恩哈德·普法林格(Bernhard Pfahringer)

買這商品的人也買了...

相關主題

商品描述

本書分成三個部分。第一部分簡要地介紹大數據流挖掘,包含三章。前兩章介紹大數據流及其基本挖掘方法。後一章是MOA上手指南,讀者可以作為參考,自行探索MOA。第二部分詳細地展現了數據流挖掘中的常見問題和重要算法。由於涉及的知識面廣闊,本書優先講解MOA中已涵蓋的算法。該部分第一章提到了sketch技巧,本書認為數據流挖掘領域人員很有必要對該技巧加以瞭解。大部分章節含有一套練習題或MOA上手教程,或兩者兼具。第三部分全篇講解MOA,從用戶界面開始,到命令行和API,最後講解如何實現新方法。

如今,許多信息源(包括傳感器網絡、金融市場、社交網絡和醫療保健監控)都是所謂的數據流,依序高速地傳入數據。在無法存儲整個數據集的情況下,我們必須基於部分樣本進行實時分析。本書介紹了數據流挖掘和實時分析中使用的算法和技術,並在展示技術時使用了MOA(大規模在線分析)——一個熱門的免費開源軟件框架。本書提供動手實踐的方法,使得讀者能夠在閱讀相關解釋後,通過MOA嘗試這些技術。
本書首先簡要介紹主題,包括大數據挖掘、數據流挖掘的基本方法,以及MOA的簡單示例。之後的章節詳細討論了數據流中的sketch技術、變化、分類、集成方法、回歸、聚類和頻繁模式挖掘等。大多數章節都包含練習題或基於MOA的實驗指南,或兩者兼具。最後,本書討論了MOA軟件,包括MOA圖形用戶界面、命令行、API的使用,以及如何為MOA開發新方法。對於想要在實踐中使用數據流挖掘的讀者、創新或數據流挖掘領域的研究人員,以及想要為MOA創建新算法的程序員而言,本書都是必不可少的參考指南。