Spark 學習手冊 (Learning Spark: Lightning-Fast Big Data Analysis)
Holden Karau, Andy Konwinski, Patrick We 著,許致軒 譯
- 出版商: 歐萊禮
- 出版日期: 2016-09-04
- 定價: $520
- 售價: 7.9 折 $411
- 語言: 繁體中文
- 頁數: 288
- ISBN: 9864760467
- ISBN-13: 9789864760466
-
相關分類:
Spark、大數據 Big-data、Data Science
- 此書翻譯自: Learning Spark: Lightning-Fast Big Data Analysis (Paperback)
立即出貨(限量)
買這商品的人也買了...
-
$620$490 -
$580$458 -
$780$616 -
$360$284 -
$750$638 -
$980$774 -
$245Scala 學習手冊
-
$654$621 -
$420$332 -
$680$537 -
$580$458 -
$580$452 -
$580$493 -
$980$774 -
$680$530 -
$580$458 -
$520$260 -
$500$395 -
$360$281 -
$580$458 -
$680$537 -
$590$460 -
$390$332 -
$580$458 -
$500$390
相關主題
商品描述
<內容介紹>
現今無論在任何領域,資料都逐漸地變大,你該如何有效率的對他們進行處理?此書介紹了Apache Spark,一個開放原始碼叢集運算系統。它使資料可以更快速的寫入以及執行。藉由Spark,你可以透過簡易的Pyhon,Java,或是Scala的API進行快速的大量資料處理。
此書為Spark的開發者親自撰寫,可以讓資料科學家以及工程師立即應用書中的知識展開工作。讀者將學會如何透過數行的程式碼進行一個平行處理的工作。本書涵蓋了基礎的批次工作到串流處理以及機器學習等相關的應用。
‧讓讀者可以快速地了解Spark,例如:分散式資料集、記憶體快取、以及交互式介面等。
‧利用Spark內建的強大資料庫,包含Spark SQL、Spark Streaming以及MLib。
‧使用一個Spark程式框架即可取代混合多種工具如Hive、Hadoop、Mahout以及Strom。
‧學習透過Spark進行交互式、批次、以及串流式的應用程式開發
‧與諸多資料來源進行連接,包含HDFS、HIVE、JSON以及S3
‧學習資料切割以及共享變數等進階議題
“本書是我在大數據處理應用程式指南推薦書單中的第一名” --Ben. Lorica資料科學家主席, O’Reilly Media
<章節目錄>
Chapter 1 Spark 資料分析導論
Chapter 2 下載及開始使用 Spark
Chapter 3 RDD程式撰寫
Chapter 4 鍵值對 RDD 操作
Chapter 5 存取資料
Chapter 6 進階 Spar k程式撰寫
Chapter 7 在叢集執行 Spark
Chapter 8 Spark 調校與除錯
Chapter 9 Spark SQL
Chapter 10 Spark streaming
Chapter 11 MLlib 機器學習函式庫