Streaming Data Mesh: A Model for Optimizing Real-Time Data Services
暫譯: 串流數據網格:優化即時數據服務的模型

Dulay, Hubert, Mooney, Stephen

  • 出版商: O'Reilly
  • 出版日期: 2023-06-20
  • 定價: $2,360
  • 售價: 8.0$1,888
  • 語言: 英文
  • 頁數: 223
  • 裝訂: Quality Paper - also called trade paper
  • ISBN: 1098130723
  • ISBN-13: 9781098130725
  • 相關分類: 大數據 Big-data資料庫Data Science
  • 立即出貨

買這商品的人也買了...

相關主題

商品描述

Data lakes and warehouses have become increasingly fragile, costly, and difficult to maintain as data gets bigger and moves faster. Data meshes can help your organization decentralize data, giving ownership back to the engineers who produced it. This book provides a concise yet comprehensive overview of data mesh patterns for streaming and real-time data services.

Authors Hubert Dulay and Stephen Mooney examine the vast differences between streaming and batch data meshes. Data engineers, architects, data product owners, and those in DevOps and MLOps roles will learn steps for implementing a streaming data mesh, from defining a data domain to building a good data product. Through the course of the book, you'll create a complete self-service data platform and devise a data governance system that enables your mesh to work seamlessly.

With this book, you will:

  • Design a streaming data mesh using Kafka
  • Learn how to identify a domain
  • Build your first data product using self-service tools
  • Apply data governance to the data products you create
  • Learn the differences between synchronous and asynchronous data services
  • Implement self-services that support decentralized data

商品描述(中文翻譯)

資料湖和資料倉庫隨著資料量的增大和移動速度的加快,變得越來越脆弱、成本高昂且難以維護。資料網格可以幫助您的組織去中心化資料,將擁有權歸還給產生資料的工程師。本書提供了有關串流和即時資料服務的資料網格模式的簡明而全面的概述。

作者 Hubert Dulay 和 Stephen Mooney 探討了串流資料網格和批次資料網格之間的巨大差異。資料工程師、架構師、資料產品負責人以及從事 DevOps 和 MLOps 角色的人將學習實施串流資料網格的步驟,從定義資料領域到建立良好的資料產品。在本書的過程中,您將創建一個完整的自助式資料平台,並設計一個資料治理系統,使您的網格能夠無縫運作。

通過本書,您將:

- 使用 Kafka 設計串流資料網格
- 學習如何識別一個領域
- 使用自助工具建立您的第一個資料產品
- 對您創建的資料產品應用資料治理
- 學習同步和非同步資料服務之間的差異
- 實施支持去中心化資料的自助服務