商品描述
Leverage Phoenix as an ANSI SQL engine built on top of the highly distributed and scalable NoSQL framework HBase. Learn the basics and best practices that are being adopted in Phoenix to enable a high write and read throughput in a big data space.
This book includes real-world cases such as Internet of Things devices that send continuous streams to Phoenix, and the book explains how key features such as joins, indexes, transactions, and functions help you understand the simple, flexible, and powerful API that Phoenix provides. Examples are provided using real-time data and data-driven businesses that show you how to collect, analyze, and act in seconds.
You will learn how to:
- Handle a petabyte data store by applying familiar SQL techniques
- Store, analyze, and manipulate data in a NoSQL Hadoop echo system with HBase
- Apply best practices while working with a scalable data store on Hadoop and HBase
- Integrate popular frameworks (Apache Spark, Pig, Flume) to simplify big data analysis
- Demonstrate real-time use cases and big data modeling techniques
商品描述(中文翻譯)
利用 Phoenix 作為一個基於高度分散且可擴展的 NoSQL 框架 HBase 的 ANSI SQL 引擎。學習在大數據領域中,Phoenix 所採用的基本概念和最佳實踐,以實現高寫入和讀取吞吐量。
本書包含了實際案例,例如持續向 Phoenix 發送數據流的物聯網設備,並解釋了如何利用關聯、索引、事務和函數等關鍵特性,幫助您理解 Phoenix 提供的簡單、靈活且強大的 API。書中提供了使用實時數據和數據驅動業務的範例,展示如何在幾秒鐘內收集、分析和採取行動。
Pro Apache Phoenix 涵蓋了使用 Phoenix 函式庫設置分散式 HBase 集群的細節,執行性能基準測試,為生產場景配置參數,並查看結果。本書還展示了 Phoenix 如何與 Hadoop 生態系統中的其他關鍵框架(如 Apache Spark、Pig、Flume 和 Sqoop)良好協作。
您將學習如何:
- 通過應用熟悉的 SQL 技術來處理一個 PB 級的數據存儲
- 在 NoSQL Hadoop 生態系統中使用 HBase 存儲、分析和操作數據
- 在 Hadoop 和 HBase 上的可擴展數據存儲中應用最佳實踐
- 整合流行框架(Apache Spark、Pig、Flume)以簡化大數據分析
- 演示實時用例和大數據建模技術
本書適合對象:
數據工程師、大數據管理員和架構師。