Practical Hadoop Ecosystem: A Definitive Guide to Hadoop-Related Frameworks and Tools
暫譯: 實用的 Hadoop 生態系統:Hadoop 相關框架與工具的權威指南

Deepak Vohra

  • 出版商: Apress
  • 出版日期: 2016-10-01
  • 售價: $2,400
  • 貴賓價: 9.5$2,280
  • 語言: 英文
  • 頁數: 421
  • 裝訂: Paperback
  • ISBN: 1484221982
  • ISBN-13: 9781484221983
  • 相關分類: Hadoop
  • 海外代購書籍(需單獨結帳)

相關主題

商品描述

This book is a practical guide on using the Apache Hadoop projects including MapReduce, HDFS, Apache Hive, Apache HBase, Apache Kafka, Apache Mahout and Apache Solr. From setting up the environment to running sample applications each chapter is a practical tutorial on using a Apache Hadoop ecosystem project. While several books on Apache Hadoop are available, most are based on the main projects MapReduce and HDFS and none discusses the other Apache Hadoop ecosystem projects and how these all work together as a cohesive big data development platform.


What you'll learn
  • How to set up environment in Linux for Hadoop projects using Cloudera Hadoop Distribution CDH 5. 
  • How to run a MapReduce job
  • How to store data with Apache Hive, Apache HBase
  • How to index data in HDFS with Apache Solr
  • How to develop a Kafka messaging system
  • How to develop a Mahout User Recommender System
  • How to stream Logs to HDFS with Apache Flume
  • How to transfer data from MySQL database to Hive, HDFS and HBase with Sqoop
  • How create a Hive table over Apache Solr

Who this book is for:

The primary audience is Apache Hadoop developers. Pre-requisite knowledge of Linux and some knowledge of Hadoop is required.

商品描述(中文翻譯)

這本書是一本實用指南,介紹如何使用 Apache Hadoop 專案,包括 MapReduce、HDFS、Apache Hive、Apache HBase、Apache Kafka、Apache Mahout 和 Apache Solr。從設置環境到運行範例應用程式,每一章都是使用 Apache Hadoop 生態系統專案的實用教程。雖然市面上有幾本關於 Apache Hadoop 的書籍,但大多數都是基於主要專案 MapReduce 和 HDFS,並且沒有討論其他 Apache Hadoop 生態系統專案以及這些專案如何作為一個整體的大數據開發平台協同工作。

你將學到的內容:
- 如何在 Linux 環境中設置 Hadoop 專案,使用 Cloudera Hadoop Distribution CDH 5。
- 如何運行 MapReduce 工作。
- 如何使用 Apache Hive 和 Apache HBase 儲存數據。
- 如何使用 Apache Solr 在 HDFS 中建立數據索引。
- 如何開發 Kafka 訊息系統。
- 如何開發 Mahout 使用者推薦系統。
- 如何使用 Apache Flume 將日誌串流到 HDFS。
- 如何使用 Sqoop 將數據從 MySQL 數據庫轉移到 Hive、HDFS 和 HBase。
- 如何在 Apache Solr 上創建 Hive 表。

本書的讀者對象:
主要讀者是 Apache Hadoop 開發者。需要具備 Linux 的基本知識以及對 Hadoop 的一些了解。