認識大數據的第一本書

Anil Maheshwari 著、徐瑞珠 譯

買這商品的人也買了...

相關主題

商品描述

完整的大數據概論 大數據是無所不包的名詞,它代表無法使用傳統資料管理工具來管理十分大量、快速、且高度多樣又複雜的資料。

理想上大數據包含了所有資料類型,可用來協助我們在正確的時間,以正確的數量,傳達正確的資訊給適當的人,最終協助人們做出正確決策。

本書將為管理階層與資料科學家提供完整的大數據概論。涵蓋大數據的關鍵挑戰與優點,以及組織所需的必備工具與技術,還有能從大數據獲得的好處。

本書涵蓋內容包括: .大數據的商業應用 .頂尖組織如何應用大數據 .大數據的生態系統 .大數據的應用、入門與教學

目錄大綱

第1章|大數據整體介紹

第2章|大數據來源與應用

第3章|大數據架構

第4章|使用 Hadoop 進行分散式運算

第5章|運用 MapReduce 進行平行處理

第6章|NoSQL 資料庫

第7章|運用 Spark 進行串流處理

第8章|提取資料

第9章|雲端運算

第10章|網路日誌分析器應用程式個案研究

第11章|資料探勘入門

第12章|大數據程式設計入門

附錄 A|在 Virtual Box 上使用 Cloudera 安裝 Hadoop

附錄 B|在 Amazon Web Services (AWS) Elastic Compute Cluster (EC2) 上安裝 Hadoop

附錄 C|Spark 安裝與教學 "