大資料採擷(系統方法與實例分析)-大資料技術叢書 大数据挖掘:系统方法与实例分析
周英, 卓金武
- 出版商: 機械工業
- 出版日期: 2016-05-01
- 定價: $474
- 售價: 8.5 折 $403
- 語言: 簡體中文
- 頁數: 384
- 裝訂: 平裝
- ISBN: 7111532678
- ISBN-13: 9787111532675
-
相關分類:
Matlab、大數據 Big-data、Data-mining
下單後立即進貨 (約4週~6週)
買這商品的人也買了...
-
$620$589 -
$580$551 -
$500$475 -
$690$656 -
$400$380 -
$250機器學習系統設計 (Building Machine Learning Systems with Python)
-
$420$332 -
$580$452 -
$250R語言與數據挖掘最佳實踐和經典案例
-
$780$616 -
$305圖解機器學習
-
$352R語言數據分析與挖掘實戰
-
$403機器學習
-
$750$638 -
$505基於R語言的自動資料收集:網絡抓取和文本挖掘實用指南 (Automated Data Collection with R)
-
$594$564 -
$352大數據架構商業之路:從業務需求到技術方案
-
$352機器學習與R語言實戰
-
$580$452 -
$250貝葉斯思維 : 統計建模的 Python 學習法 (Think Bayes : Bayesian Statistics in Python)
-
$288深度學習導論及案例分析
-
$422R語言市場研究分析
-
$500$500 -
$580$458 -
$590$460
相關主題
商品描述
<內容簡介>
周英、卓金武和卞月青著的《大數據挖掘:系統方法與實例分析》是大數據挖掘領域的扛鼎之作,由全球科學計算領域的領導者MathWorlks(MATLAB公司)官方的資深數據挖掘專家撰寫,MathWorks官方及多位專家聯袂推薦。
它從技術、方法、案例和最佳實踐4個維度對如何系統、深入掌握大數據挖掘提供了詳盡的講解。
技術:不僅講解了大數據挖掘的原理、過程、工具,還講解了大數據的準備、處理與探索;
方法:既深入地講解了關聯規則方法、回歸方法、分類方法、聚類方法、預測方法、診斷方法等6大類數據挖掘主體方法,又重點講解了時間序列方法和智能優化方法兩種數據挖掘中常用的方法;
案例:詳細地再現了來自銀行、證券、機械、礦業、生命科學和社會科學等6大領域的經典案例,不僅有案例的實現過程,而且還有案例原理和預備知識的的講解;
最佳實踐:首先總結了數據挖掘中確定挖掘、應用技術以及如何平衡的藝術,然後總結了數據挖掘的項目管理和團隊管理的藝術。
<章節目錄>
序言
前言
第—篇 基礎篇
第1章 認識大數據挖掘
1.1 大數據與數據挖掘
1.1.1 何為大數據
1.1.2 大數據的價值
1.l.3 大數據與數據挖掘的關係
1.2 數據挖掘的概念和原理
1.2.l 什麼是數據挖掘
1.2.2 數據挖掘的原理
1.3 數據挖掘的內容
1.3.1 關聯
1.3.2 回歸
1.3.3 分類
l.3.4 聚類
1.3.5 預測
l.3.6 診斷
1.4 數據挖掘的應用領域
1.4.1 零售業
1.4.2 銀行業
l.4.3 證券業
1.4.4 能源業
l.4.5 醫療行業
1.4.6 通信行業
1.4.7 汽車行業
l.4.8 公共事業
1.5 大數據挖掘的要點
1.6 小結
參考文獻
第2章 數據挖掘的過程及工具
2.1 數據挖掘過程概述
2.2 挖掘目標的定義
2.3 數據的準備
2.4 數據的探索
2.5 模型的建立
2.6 模型的評估
2.7 模型的部署
2.8 工具的比較與選擇
2.9 小結
參考文獻
第3章 MAlLAB數據快速入門
3.1 MATLAB快速入門
3.1.1 M舡1AB概要
3.1.2 MATLAB的功能
3.1.3 快速入門門實例
3.1.4 入門後的提高
3.2 MATLAB常用技巧
3.3 MATLAB開發模式
3.4 MATLAB姬數據挖掘實例
3.5 MATLAB集成數據挖掘工具
3.5.1 分類學習機簡介
3.5.2 交互探索演算法的方式
3.5.3 MATLAB分類學習機應用實例
3.6 小結
第二篇 技術篇
第4章 數據的準備
4.1 數據的收集
4.1.1 認識數據
4.1.2 數據挖掘的數據源
4.1.3 數據抽樣
4.1.4 金融行業的數據源
4.1.5 從雅虎獲取交易數據
4.1.6 從大智慧獲取財務數據
4.1.7 從Wind獲取高質量數據
4.2 數據質量分析
4.2.1 數據質量分析的必要性
4.2.2 數據質量分析的目的
4.2.3 數據質量分析的內容
4.2.4 數據質量分析方法
4.2.5 數據質量分析的結果及應用
4.3 數據預處理
4.3.1 為什麼需要數據預處理
4.3.2 數據預處理的方法
4.3.3 數據清洗
4.3.4 數據集成
4.3.5 數據歸約
4.3.5 數據變換
4.4 小結
參考文獻
第5章 數據的探索
5.1 衍生變量
5.1.1 衍生變量的定義
5.1.2 變量衍生的原則和方法
5.1.3 常用的股票衍生變量
5.1.4 評價型衍生變量
5.1.5 衍生變量的數據收集與集成
5.2 數據的統計
5.2.1 基本描述性統計
5.2.2 分佈描述性統計
第6章 關聯規則方法
第7章 數據回歸方法
第8章 分類方法
第9章 聚類方法
第10章 預測方法
第11章 診斷方法
第12章 時間序列方法
第13章 智能優化方法
第三篇 項目篇
第14章 數據挖掘在銀行信用評分中的應用
第15章 數據挖掘在量化股中的應用
第16章 數據挖掘在工業故障診斷中的應用
第17章 數據挖掘技術在礦業工程中的應用
第18章 數據挖掘技術在生命科學中的應用
第19章 數據挖掘在社會科學研究中的應用
第四篇 理念篇
第20章 數據挖掘的藝術
第21章 數據挖掘的項目管理和團隊管理