The Data Warehouse ETL Toolkit : Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data
暫譯: 數據倉儲ETL工具包:提取、清理、標準化和交付數據的實用技術
Ralph Kimball, Joe Caserta
- 出版商: Wiley
- 出版日期: 2004-10-01
- 定價: $1,700
- 售價: 8.5 折 $1,445
- 語言: 英文
- 頁數: 528
- 裝訂: Paperback
- ISBN: 8126505540
- ISBN-13: 9780764567575
-
相關分類:
大數據 Big-data、資料庫、Data Science
立即出貨
買這商品的人也買了...
-
$680$537 -
$980$774 -
$2,410$2,290 -
$650$514 -
$1,930$1,834 -
$780$741 -
$590$466 -
$580$458 -
$750$638 -
$560$476 -
$2,390$2,271 -
$850$723 -
$480$379 -
$750$593 -
$780$616 -
$490$382 -
$990$782 -
$480$379 -
$650$514 -
$640$506 -
$675LPIC 1 Exam Cram 2: Linux Professional Institute Certification Exams 101 and 102 (Paperback)
-
$650$507 -
$880$695 -
$620$527 -
$650$514
商品描述
Description:
* Cowritten by Ralph Kimball, the world's leading data warehousing authority, whose previous books have sold more than 150,000 copies
* Delivers real-world solutions for the most time- and labor-intensive portion of data warehousing-data staging, or the extract, transform, load (ETL) process
* Delineates best practices for extracting data from scattered sources, removing redundant and inaccurate data, transforming the remaining data into correctly formatted data structures, and then loading the end product into the data warehouse
* Offers proven time-saving ETL techniques, comprehensive guidance on building dimensional structures, and crucial advice on ensuring data quality
Table of Contents:
Acknowledgments.
About the Authors.
Introduction.
Part I: Requirements, Realities, and Architecture.
Chapter 1: Surrounding the Requirements.
Chapter 2: ETL Data Structures.
Part II: Data Flow.
Chapter 3: Extracting.
Chapter 4: Cleaning and Conforming.
Chapter 5: Delivering Dimension Tables.
Chapter 6: Delivering Fact Tables.
Part III: Implementation and operations.
Chapter 7: Development.
Chapter 8: Operations.
Chapter 9: Metadata.
Chapter 10: Responsibilities.
Part IV: Real Time Streaming ETL Systems.
Chapter 11: Real-Time ETL Systems.
Chapter 12: Conclusions.
Index.
商品描述(中文翻譯)
**描述:**
* 本書由全球領先的資料倉儲權威 Ralph Kimball 共同撰寫,其前作已售出超過 150,000 本
* 提供針對資料倉儲中最耗時且勞力密集的部分——資料階段(即提取、轉換、加載 ETL 過程)的實際解決方案
* 描述從分散的來源提取資料、去除冗餘和不準確資料、將剩餘資料轉換為正確格式的資料結構,然後將最終產品加載到資料倉儲中的最佳實踐
* 提供經驗證的節省時間的 ETL 技術、建立維度結構的全面指導,以及確保資料品質的重要建議
**目錄:**
致謝。
關於作者。
導言。
**第一部分:需求、現實與架構。**
第 1 章:需求的周邊。
第 2 章:ETL 資料結構。
**第二部分:資料流。**
第 3 章:提取。
第 4 章:清理與一致性。
第 5 章:交付維度表。
第 6 章:交付事實表。
**第三部分:實施與操作。**
第 7 章:開發。
第 8 章:操作。
第 9 章:元資料。
第 10 章:責任。
**第四部分:即時串流 ETL 系統。**
第 11 章:即時 ETL 系統。
第 12 章:結論。
索引。