Spark 技術手冊｜輕鬆寫意處理大數據 (Spark: The Definitive Guide｜Big Data Processing Made Simple)

Name: Spark 技術手冊｜輕鬆寫意處理大數據 (Spark: The Definitive Guide｜Big Data Processing Made Simple)
Price: 695 TWD
Availability: InStock
Author: Matei Zaharia, Bill Chambers 著
ISBN: 9865022990

Matei Zaharia, Bill Chambers 著許致軒、李尚、蔡政廷、吳政倫、鄭憶婷譯

出版商: 歐萊禮
出版日期: 2019-10-18
定價: $880
售價: 7.9 折 $695
語言: 繁體中文
頁數: 608
裝訂: 平裝
ISBN: 9865022990
ISBN-13: 9789865022990
相關分類: Spark、大數據 Big-data
此書翻譯自: Spark: The Definitive Guide: Big Data Processing Made Simple (Paperback)

立即出貨 (庫存 > 10)

買這商品的人也買了...

~~$480~~ $379

人月神話：軟體專案管理之道 (20 週年紀念版)(The Mythical Man-Month: Essays on Software Engineering, Anniversary Edition, 2/e)
~~$1,700~~ $1,615

Cracking the Coding Interview : 189 Programming Questions and Solutions, 6/e (Paperback)
~~$520~~ $411

Spark 學習手冊 (Learning Spark: Lightning-Fast Big Data Analysis)
~~$980~~ $774

Hadoop 技術手冊, 4/e (Hadoop: The Definitive Guide, 4/e)
~~$480~~ $379

鳳凰專案｜看 IT部門如何讓公司從谷底翻身的傳奇故事
~~$500~~ $425

為你自己學 Git
~~$580~~ $452

無瑕的程式碼－整潔的軟體設計與架構篇 (Clean Architecture: A Craftsman's Guide to Software Structure and Design)
~~$534~~ $507

Lua 程序設計, 4/e (Programming in Lua, 4/e)
~~$680~~ $578

領域驅動設計：軟體核心複雜度的解決方法 (Domain-Driven Design: Tackling Complexity in the Heart of Software)
~~$480~~ $379

分散式系統設計 (Designing Distributed Systems: Patterns and Paradigms for Scalable, Reliable Services)
~~$580~~ $458

Kafka 技術手冊｜即時資料與串流處理 (Kafka: The Definitive Guide)
~~$720~~ $612

Working Effectively with Legacy Code : 管理、修改、重構遺留程式碼的藝術 (中文版)
$1,995

The Pragmatic Programmer: your journey to mastery, 2/e (20th Anniversary Edition) (Hardcover)
~~$580~~ $458

圖形演算法｜Apache Spark 與 Neo4j 實務範例 (Graph Algorithms)
~~$650~~ $507

機器學習工程師面試全破解：嚴選124道AI演算法決勝題完整剖析
$301

PySpark 機器學習、自然語言處理與推薦系統 (Machine Learning with PySpark: With Natural Language Processing and Recommender Systems)
~~$680~~ $537

The Pragmatic Programmer 20週年紀念版 (The Pragmatic Programmer, 20th Anniversary Edition)
~~$520~~ $411

Kubernetes 建置與執行 : 邁向基礎設施的未來, 2/e (Kubernetes: Up and Running: Dive into the Future of Infrastructure, 2/e)
$607

數據庫系統內幕
~~$1,700~~ $1,615

System Design Interview – An Insider's Guide (Paperback)
$505

實戰大數據 (Hadoop + Spark + Flink) 從平臺構建到交互式數據分析 (離線/實時)
$254

大數據技術入門 — Hadoop + Spark
$560

圖解 Spark 大數據快速分析實戰
~~$680~~ $537

強健的 Python｜撰寫潔淨且可維護的程式碼 (Robust Python: Write Clean and Maintainable Code)
~~$620~~ $490

SQL 學習手冊｜資料建立、維護與檢索, 3/e (Learning SQL: Generate, Manipulate, and Retrieve Data, 3/e)

商品描述

本書是由Spark這個專案的成員所撰寫，詳盡的說明如何使用、部署與維運Apache Spark。本書將帶領您探索Spark結構化API基礎操作、結構化串流，並透過新的高階API建立端到端的串流應用。開發與系統管理人員可由本書學習到如何進行Spark的監控、調校以及除錯，以及如何使用MLlib分散式機器學習函式庫。

．完整說明大數據與Spark
．透過實際的範例學習DataFrame、SQL與Dataset等Spark核心API概念
．深入了解Spark低階API、RDD以及DataFrame與SQL的關係
．學習如何在叢集環境運行Spark
．針對Spark叢集與應用程式進行除錯、監控與調校
．體會Spark結構化串流處理引擎的威力
．學習MLlib函式庫並將其應用於多種分類或推薦等機器學習專案中

Bill Chambers是Databricks的產品經理，專注於大數據分析並提供企業用戶完整的文件與協作讓客戶藉由Spark與Databricks取得成功。

Matei Zaharia是史丹佛電腦科學系的助理教授以及Databricks的技術長。他於2009在加州柏克萊大學發起Spark專案，同時他也是Apache Mesos專案的共同發起人以及Apache Hadoop的早期貢獻者。

名人推薦

「本書是專業Spark開發人員的必讀指南，提供在其他書上找不到的技巧與訣竅」
—Ion Stoica, Director of the UC Berkeley RISE Lab

作者簡介

Bill Chambers
於2014年開始在多個實驗專案中使用Spark。Bill目前在Databricks公司擔任產品經理，這家公司協助使用者撰寫各式Apache Spark應用程式。Bill也經常撰寫關於Spark的網誌並參與相關的研討會與社群聚會。Bill擁有柏克萊大學資訊管理與系統碩士學位。

Matei Zaharia
於2009年在柏克萊大學博士生期間建立了Spark專案。Matei與柏克萊其他研究學者以及外部協力者共同設計了Spark核心API並發展Spark社群。他也持續參與Spark的新功能開發，例如結構化API與Structured Streaming。Matei與其他柏克萊Spark團隊的成員在2013年共同創立了Databricks，旨在促進Spark開放原始碼專案成長以及提供商業支援服務。至今Matei仍在Databricks擔任首席技術長，並且為史丹佛大學資訊科學系助理教授，研究大規模系統與人工智慧。Matei於2013年取得柏克萊大學資訊科學博士學位。

目錄大綱

第一篇大數據與Spark概覽
第1章何為Apache Spark？
第2章 Spark 簡介
第3章 Spark 工具組導覽

第二篇結構化API—DataFrame、SQL與Dataset
第4章結構化API 概覽
第5章基礎結構化操作
第6章操作不同型別的資料
第7章聚合
第8章關聯
第9章資料源
第10章 Spark SQL
第11章 Datasets

第三篇低階API
第12章彈性分散式資料集（RDD）
第13章進階RDD
第14章分散式共享變數

第四篇 Production Applications
第15章如何在叢集上運行Spark
第16章開發Spark 應用程式
第17章部署Spark
第18章監控與除錯
第19章效能調校

第五篇串流
第20章串流處理基礎
第21章結構化串流基礎
第22章事件時間和狀態處理
第23章生產級的結構化串流

第六篇進階分析與機器學習概覽
第24章進階分析與機器學習概覽
第25章前處理與特徵工程
第26章分類
第27章迴歸
第28章推薦
第29章非監督式學習
第30章圖形分析
第31章深度學習
第32章其他特定語言: Python(PySpark) 與R(SparkR 和sparklyr)
第33章生態系與社群