資料工程基礎|規劃和建構強大、穩健的資料系統 (Fundamentals of Data Engineering)

Joe Reis, Matt Housley 著 蔣大偉 譯

  • 資料工程基礎|規劃和建構強大、穩健的資料系統 (Fundamentals of Data Engineering)-preview-1
  • 資料工程基礎|規劃和建構強大、穩健的資料系統 (Fundamentals of Data Engineering)-preview-2
  • 資料工程基礎|規劃和建構強大、穩健的資料系統 (Fundamentals of Data Engineering)-preview-3
  • 資料工程基礎|規劃和建構強大、穩健的資料系統 (Fundamentals of Data Engineering)-preview-4
  • 資料工程基礎|規劃和建構強大、穩健的資料系統 (Fundamentals of Data Engineering)-preview-5
  • 資料工程基礎|規劃和建構強大、穩健的資料系統 (Fundamentals of Data Engineering)-preview-6
  • 資料工程基礎|規劃和建構強大、穩健的資料系統 (Fundamentals of Data Engineering)-preview-7
  • 資料工程基礎|規劃和建構強大、穩健的資料系統 (Fundamentals of Data Engineering)-preview-8
  • 資料工程基礎|規劃和建構強大、穩健的資料系統 (Fundamentals of Data Engineering)-preview-9
資料工程基礎|規劃和建構強大、穩健的資料系統 (Fundamentals of Data Engineering)-preview-1

買這商品的人也買了...

相關主題

商品描述

🏆🏆🏆 Amazone 400+ 五星好評 🏆🏆🏆

👉 資料領域的必讀書單📚 ,適合IT專業人士和學生,尤其適合希望深入了解資料工程的讀者。
👉 書中提供資料工程的基本和進階概念,對於理解當前和未來的資料工程趨勢和技術非常有幫助。
👉 作者的寫作風格值得讚賞,使用的比喻和舉例能將複雜的概念有效簡化,更易理解。
👉 提供清晰的資料工程生命週期概念,有助提升資料管理和專案管理的能力。


「資料世界發展到現在已經有一段時間。首先從設計師開始,然後是資料庫管理員,接著是首席資訊官,然後是資料架構師。這本書將促使該行業朝著更加成熟和先進的方向發展。對於每一位認真對待自己的專業和職業的人來說,這都是一本必讀之作。」
—Bill Inmon
資料倉儲創建者

「《資料工程基礎》是一本絕佳的入門書籍,涵蓋了資料遷移、處理和管理的相關業務。我要強力推薦給任何想要快速瞭解資料工程或分析方面的人,或者想要填補自己知識漏洞的現有從業人員。」
—Jordan Tigani
MotherDuck創始人和首席執行官 / BigQuery創始工程師和共同創始人

過去十年來,資料工程發展迅速,讓許多軟體工程師、資料科學家及分析師渴望全面了解這個領域的全貌。這本實用的書籍將告訴你,如何在資料工程生命週期的框架下,評估並選擇最適合的技術,規劃和建構系統能滿足你的組織與客戶需求的資料系統。

本書作者Joe Reis和Matt Housley將帶您深入瞭解資料工程生命週期,並解說如何把各種雲端技術接合起來,以滿足下游資料消費者的需求。你將瞭解如何應用資料產生、攝取、編排、轉換、儲存和治理等概念,這些概念在任何資料環境中都至關重要,而且與底層技術無關。

本書將助您:
‧掌握資料工程領域的精要與全貌。
‧使用端到端的最佳實踐框架評估資料工程問題。
‧正確選擇資料技術、架構和流程,避開誇大的行銷手法。
‧使用資料工程生命週期來設計和建構強大、穩健的架構。
‧將資料治理與安全性融入整個資料工程的生命週期。

 

<序>

這本書是怎麼來的?它的源頭深植於我們從資料科學轉向資料工程的旅程中。我們常開玩笑地稱自己為「康復中的資料科學家」。我們兩人都有過被指派參與資料科學專案的經驗,但由於缺乏適當的基礎而無法順利進行這些專案。我們的資料工程之旅始於我們承擔資料工程任務以建構基礎架構和基礎設施。

本書的主要目標讀者包括技術從業者、中高級軟體工程師、資料科學家、有興趣進入資料工程領域的分析師,或者在特定技術領域內希望發展更全面的視角的資料工程師。次要目標讀者是與技術從業人員相關的資料利益相關者,例如,具有技術背景並負責監督資料工程師的團隊負責人,或者希望從本地技術(on-premises technology)遷移到雲端解決方案(cloud-based solution)的資料倉儲主管。

本書的目的是在幫助你建構解決真實世界之資料工程問題的堅實基礎。

閱讀完本書後,你將能夠瞭解:
• 資料工程如何影響你目前的角色(資料科學家、軟體工程師或資料團隊負責人)
• 如何避免被行銷宣傳所迷惑,選擇正確的技術、資料架構和流程
• 如何使用資料工程生命週期來設計和建構堅實的架構
• 資料生命週期每個階段的最佳作法

而且你將能夠:
• 在你目前的角色(資料科學家、分析師、軟體工程師、資料團隊負責人等)中融入資料工程原則
• 將多種雲端技術整合在一起,以滿足下游資料消費者的需求
• 使用端到端的最佳實踐框架來評估資料工程問題
• 在整個資料工程生命週期中融入資料治理和安全性

作者簡介

Joe Reis 是一位具有商業頭腦的資料狂熱者,已在資料行業工作了 20 年,職責範圍包括統計建模、預測、機器學習、資料工程、資料架構等幾乎所有相關領域。Joe是Ternary Data的CEO和共同創辦人,這是一家位於猶他州鹽湖城的資料工程和架構諮詢公司。此外,他還在多個技術團體擔任志願者,並在猶他大學任教。閒暇時間,Joe喜歡攀岩、製作電子音樂,並帶著他的孩子進行瘋狂的冒險。

Matt Housley 是一位資料工程顧問和雲端專家。在早年學習過Logo、Basic和6502組合語言及其程式設計經驗,之後他在猶他大學獲得了數學博士學位。Matt隨後開始從事資料科學工作,最終專攻基於雲端的資料工程。他與Joe Reis共同創立了Ternary Data公司,在那裡他利用自己的教學經驗培訓未來的資料工程師,並就強大的資料架構向團隊提供建議。Matt 和 Joe 還在「週一早上的資料聊天室」(The Monday Morning Data Chat)節目中就所有資料議題發表見解。

目錄大綱

第一篇 基本概念和構成要素
第一章 資料工程概述
第二章 資料工程生命週期
第三章 設計良好的資料架構
第四章 在資料工程生命週期中的各個階段,選擇適合的技術

第二篇 資料工程生命週期深入解析
第五章 來源系統中資料的產生
第六章 儲存
第七章 攝取
第八章 查詢、建模和轉換
第九章 為分析、機器學習和反向 ETL 提供資料

第三篇 安全性、隱私以及資料工程的未來
第十章 安全性和隱私
第十一章 資料工程的未來
附錄A 序列化和壓縮技術細節
附錄B 雲端網路