Introduction to Spark Operations: A Guide to Administering Spark at Enterprise Scale
暫譯: Spark 操作入門:企業級 Spark 管理指南

Anya Bida

  • 出版商: O'Reilly
  • 出版日期: 2017-06-25
  • 售價: $1,580
  • 貴賓價: 9.5$1,501
  • 語言: 英文
  • 頁數: 150
  • 裝訂: Paperback
  • ISBN: 1491971797
  • ISBN-13: 9781491971796
  • 相關分類: Spark
  • 海外代購書籍(需單獨結帳)

相關主題

商品描述

Apache Spark may be the most powerful technology to hit the data world since MapReduce, but many enterprises face unique problems when trying to take advantage of it. With this practical book, system administrators will learn how to work with data science teams to configure, troubleshoot, and optimize Spark clusters at enterprise scale.

You’ll learn everything from initial setup and installation to all facets of architecture, functional testing, and memory. You’ll also get up to speed with the Spark WebUI and troubleshooting toolkit. Learn how to administer a Spark cluster on the Hadoop Distributed File System (HDFS), and discover how take advantage of this open source cluster computing framework.

The book provides:

  • A quick reference for getting started and administering a Spark cluster
  • Practical understanding of the Spark WebUI
  • Deeper understanding of Spark’s internals to avoid common missteps

商品描述(中文翻譯)

Apache Spark 可能是自 MapReduce 以來對數據世界影響最大的技術,但許多企業在嘗試利用它時面臨獨特的問題。這本實用的書籍將幫助系統管理員學習如何與數據科學團隊合作,以在企業規模上配置、排除故障和優化 Spark 集群。

您將學習從初始設置和安裝到架構、功能測試和內存的各個方面。您還將熟悉 Spark WebUI 和故障排除工具包。學習如何在 Hadoop 分佈式文件系統 (HDFS) 上管理 Spark 集群,並發現如何利用這個開源集群計算框架。

本書提供:

- 快速參考以開始和管理 Spark 集群
- 對 Spark WebUI 的實用理解
- 更深入了解 Spark 的內部運作,以避免常見的失誤