大數據 (Big Data) 分析與應用－使用 Hadoop 與 Spark (最新版)

劉勇志

出版商: 台科大圖書出版社
出版日期: 2017-02-28
定價: $550
售價: 9.0 折 $495
語言: 繁體中文
頁數: 388
ISBN: 9864553771
ISBN-13: 9789864553778
相關分類: Hadoop、Spark、大數據 Big-data

無法訂購

買這商品的人也買了...

~~$680~~ $537

深入淺出軟體開發 (Head First Software Development)
~~$680~~ $537

深入淺出程式設計－奠基於 Python 語言的編程學習指南 (Head First Programming: A Learner's Guide to Programming Using the Python Language)
~~$780~~ $616

深入淺出 Python (Head First Python)
~~$780~~ $616

精通 Python｜運用簡單的套件進行現代運算 (Introducing Python: Modern Computing in Simple Packages)
~~$480~~ $374

Hadoop：Big Data技術詳解與專案實作
~~$400~~ $340

Heroku 網路應用開發指南 (The Basis Development of Cloud Applications-Heroku) ─ 邁向國際化雲端服務平台開發操作手冊, 2/e
~~$750~~ $638

大數據分析處理：Spark技術、應用與性能優質化
~~$474~~ $450

Python 絕技：運用 Python 成為頂級駭客 (Violent Python : A Cookbook for Hacker, Forensic Analysis, Penetration Testers and Security Engineers)
~~$480~~ $408

學 Hadoop 永遠都不遲：從 MapReduce 到 YARN 的演化 (舊版:最新 Hadoop Yarn 的精華：MapReduce 機制 )
~~$320~~ $288

Scratch2.0 競賽主題程式設計含各縣市比賽分析 (附贈250分鐘影音教學)
~~$1,260~~ $983

Python 機器學習 + Python+Spark 2.0+Hadoop機器學習與大數據分析實戰 (雙書合購促銷)
~~$550~~ $468

Scratch 2.0 元件堆疊動畫遊戲繪畫程式設計
~~$580~~ $493

新觀念 Microsoft Visual C# 程式設計範例教本, 4/e
$403

機器學習導論 (An Introduction to Machine Learning)
~~$520~~ $260

Spark 大數據分析新利器─資料科學家與數據分析師非用不可的入門指南書 (Big Data Analytics with Spark: A Practitioner's Guide to Using Spark for Large Scale Data Analysis)
$352

Python大戰機器學習：數據科學家的第一個小目標
~~$480~~ $379

圖解雲端技術｜基礎架構x運作原理 x API
$352

Python 數據可視化 (Mastering Python Data Visualization)
~~$680~~ $537

資料視覺化｜使用 Python 與 JavaScript (Data Visualization with Python and JavaScript: Scrape, Clean, Explore & Transform Your Data)
$356

實用機器學習 (Practical Machine Learning)
$352

精通 Python 網絡爬蟲:核心技術、框架與項目實戰
$352

Python可以這樣學
$352

面向機器智能的 TensorFlow 實踐
$283

零起點 Python 機器學習快速入門
~~$590~~ $460

TensorFlow + Keras 深度學習人工智慧實務應用

商品描述

1.闡述大數據的重要觀念，包括正面的效用與負面的副作用，建立讀者對大數據正確的認知。
2.說明大數據時代的因應與挑戰，其中有思維的轉變、大數據分析技術、大數據的應用模式分類，也有大數據分析的流程。
3.介紹各行各業的大數據經典應用案例，讓讀者體會大數據分析的應用精隨，有機會發揮創造力，開創自己的大數據應用。
4.介紹大數據分析工具（Hadoop和Spark）的生態系統，期使讀者能充分掌握大數據的技術發展和工具的應用藍圖。
5.透過對大數據工具的實戰演練，包括安裝、設定、指令操作等，使讀者在具備大數據概念正確理解的同時，還能擁有動手實現的功力。
6.學習大數據程式語言Scala，熟悉函數式程式設計（functional programming）的特點，以及它對於大數據的操作與處理，提昇讀者7.使用Spark的機器學習程式庫（MLlib），應用在既有資料集的分析上，讓讀者迅速獲得大數據的預測能力。

目錄大綱

觀念篇

第 1 章　進入大數據時代

1-1 大數據時代來了

1-2 「大」數據有多「大」

1-3 大數據的「大」特徵

1-4 大數據的「大」作用

1-5 大數據的「大」問題

1-6 結語

第 2 章　大數據挑戰與因應

2-1 大數據的思維轉變

2-2 大數據案例

2-3 大數據的應用模式分類

2-4 大數據計畫的啟動

2-5 結語

第 3 章　大數據分析技術

3-1 資料科學

3-2 資料分析工具箱

3-3 大數據分析流程

3-4 結語

工具篇

第 4 章　大數據工具與生態系統

4-1 Hadoop/HDFS：分散式檔案系統

4-2 Spark：平行運算框架

4-3 NoSQL 資料庫

4-4 結語

第 5 章　大數據作業系統Ubuntu 的安裝

5-1 安裝虛擬化系統工具Oracle VirtualBox

5-2 新增和設定Ubuntu 虛擬機

5-3 安裝和設定Ubuntu 作業系統

第 6 章　大數據平台Hadoop 和Spark 的安裝

6-1 建立和設定master 主機

6-2 建立slave1 虛擬機

6-3 繼續master 的設定

6-4 啟動Hadoop 主機集群

6-5 試玩HDFS

6-6 試玩Spark

6-7 結束Spark 和Hadoop

第 7 章　HDFS 和Spark RDD 的操作

7-1 HDFS 的操作指令

7-2 Spark RDD 的操作

第 8 章　Scala—大數據的程式語言

8-1 Scala 基礎

8-2 基本的資料型態

8-3 資料集Collections

8-4 邏輯流程控制

8-5 函數

8-6 常用資料集處理方法

8-7 模式匹配Pattern Matching

應用篇

第 9 章　大數據分析應用基礎

9-1 字數計算（word count）

9-2 矩陣相乘

9-3 頻繁項（frequent items）分析

9-4 One-hot 編碼

9-5 相似性（similarity）計算

9-6 文件資料反向排序

第 10 章大數據分析範例—葡萄酒分析

10-1 葡萄酒品質資料集

10-2 讀入資料檔

10-3 基本統計資料

10-4 建立LabeledPoint 資料類別格式

10-5 資料標準化

10-6 切割資料集

10-7 預測模型訓練

10-8 預測與模式評估MSE

10-9 參數最佳組合與模型測試

10-10 結論

第 11 章大數據分析範例—書籍推薦

11-1 推薦技術

11-2 書籍資料集

11-3 讀入資料檔與資料前處理

11-4 建立Rating 資料格式

11-5 切割資料集

11-6 預測模型訓練

11-7 計算均方差MSE

11-8 參數最佳組合與最佳模型

11-9 使用最佳模型進行推薦

第 12 章大數據分析範例—鳶尾花分類

12-1 大數據分析流程

12-2 分類演算法

12-3 鳶尾花資料集

12-4 讀入資料檔與資料前處理

12-5 資料集隨機切割

12-6 模式設定與訓練

12-7 使用評價器（evaluator）計算準確度

12-8 交叉驗證

12-9 使用最佳模式來預測新值

附錄　參考文獻

大數據 (Big Data) 分析與應用－使用 Hadoop 與 Spark (最新版)

劉勇志

買這商品的人也買了...

商品描述

目錄大綱

類似商品