數據血緣分析原理與實踐

成于念; 賽助力

  • 出版商: 機械工業
  • 出版日期: 2024-06-01
  • 售價: $594
  • 貴賓價: 9.5$564
  • 語言: 簡體中文
  • 頁數: 200
  • 裝訂: 平裝
  • ISBN: 7111757017
  • ISBN-13: 9787111757016
  • 立即出貨

買這商品的人也買了...

相關主題

商品描述

這是一本可以幫助讀者從0開始理解、建立並深度實踐資料血緣及其係統的專業指導手冊。
全書所有內容均來自兩位作者長期在世界500強企業從事數據相關工作的經驗總結,
書中不僅從原理層面帶領讀者深挖資料血緣本質,還有從實務層面對資料血緣的建構方法、核心技術、主流工具、
在資料治理中的應用、典型產業應用案例進行了全方位剖析。
本書得到了美國南卡羅來納大學教授、DAMA大中華區主席、
中國大數據技術標準推進委員會專家、招商蛇口數位化管理及營運負責人、PowerData社群主理人等多位業界專家的鼎力推薦。
本書包括4篇14章,具體內容如下。
概念篇從企業面臨的主要資料問題著手,逐漸延伸到資料血緣的相關定義、特徵、價值,以及資料組成的深度解讀。
這部分是真正落地資料血緣計畫的基礎,只有充分了解這部分內容,才知道如何與上下游溝通協作。
建設篇先完整展示了一個可落地的資料血緣框架模型-「1355」框架模型,分別是1個週期、3種實體、5個類型、5個層級,
這是資料血緣建設的基礎模型;然後詳細介紹了資料血緣實施路徑,其中包括可能面臨的問題、具體建設方式和具體建設步驟。
技術篇重點資料血緣相關技術與產品,以及資料血緣分析的主要應用情境-資料治理。
其中,包括3大數據血緣應用情境、7大資料血緣核心技術、9款主流的資料血緣產品,以及資料血緣在資料治理中的深度實踐。
案例篇主要分享了網路、服務、製造、零售快消等產業中資料血緣建設案例,
幫助大家了解典型產業數據血緣的落地情況,以求獲得一些啟發。

目錄大綱

前言

概念篇
第1章 走進資料血緣2
1.1 企業目前面臨的問題與挑戰2
1.1.1 網路產業:數據面臨嚴峻挑戰3
1.1.2 能源化工產業:數據共享互通待加強4
1.1.3 裝備製造業:產品資料採集難5
1.1.4 零售業:數據分析勢在行5
1.1.5 建築業:大數據治理亟須提升6
1.1.6 從問題與挑戰中找出解決方案7
1.2 揭開數據血緣的面紗8
1.2.1 什麼是資料與資料管理8
1.2.2 什麼是資料血緣10
1.2.3 什麼是資料血緣分析11
1.2.4 什麼是資料血緣可視化14
1.2.5 資料血緣的徵16
1.2.6 與資料血緣相關的概念20
1.3 資料血緣分析是解決資料問題的靈丹妙藥23
1.3.1 破除資料質疑23
1.3.2 資料變更影響範圍快速評估24
1.3.3 資料資產值評估度量工具25
1.3.4 為資料濫用加上一把「道德」之鎖26
1.4 本章小結27
第2章 資料血緣中的資料組成分29
2.1 溯源血緣關係的重要依據—元資料29
2.1.1 元資料的概念29
2.1.2 元資料的資料血緣徵31
2.2 確定血緣關係的黃金資料—主資料32
2.2.1 主資料的概念32
2.2.2 主資料的資料血緣徵34
2.3 記錄業務動態發生的資料—業務資料35
2.3.1 業務資料的概念35
2.3.2 業務資料的資料血緣徵35
2.4 提供分析決策的重要成果—指標資料36
2.4.1 指標資料的概念36
2.4.2 指標資料的資料血緣徵37
2.5 本章小結37
建設篇
第3章 資料血緣分析架構模型40
3.1 1個週期:資料全生命週期管理40
3.2 3種實體:資料血緣實體結構43
3.2.1 資料庫血緣44
3.2.2 資料表血緣44
3.2.3 字段血緣46
3.3 5個類型:資料血緣分類48
3.3.1 邏輯血緣48
3.3.2 物理血緣48
3.3.3 時間血緣48
3.3.4 作血緣48
3.3.5 業務血緣49
3.4 5個層級:建構基礎平台,支撐資料血緣分析49
3.4.1 血緣採集層50
3.4.2 血緣處理層52
3.4.3 血緣儲存層52
3.4.4 血緣接口層53
3.4.5 血緣應用層53
3.5 本章小結57
第4章 資料血緣實施路徑59
4.1 資料血緣實施過程中的問題與困難點59
4.1.1 血緣質量不高59
4.1.2 實施路徑不清晰61
4.1.3 資料血緣關係自動解析難62
4.2 資料血緣建設方式63
4.2.1 常見的3種建設方式的劣勢63
4.2.2 建設方式註意事項65
4.3 資料血緣建設步驟65
4.3.1 明確資料血緣目標66
4.3.2 制定資料血緣需求範圍75
4.3.3 建構資料血緣系統77
4.3.4 完成資料血緣收集85
4.3.5 完成資料血緣初始化92
4.3.6 實現資料血緣的可視化93
4.4 本章小結98
技術篇
第5章 資料血緣分析應用100
5.1 資料開發應用場景100
5.2 資料資產應用情境102
5.3 資料應用場景103
5.4 本章小結106
第6章 資料血緣技術107
6.1 概述107
6.2 資料擷取技術108
6.2.1 ETL技術應用108
6.2.2 SQL解析應用109
6.3 資料建模110
6.3.1 概念建模111
6.3.2 邏輯建模111
6.3.3 物理建模112
6.4 資料視覺化技術112
6.4.1 資料視覺化工具113
6.4.2 圖形庫和框架114
6.5 其他相關技術115
6.5.1 資料探勘技術115
6.5.2 區塊鏈技術116
6.5.3 人工智慧技術117
6.5.4 大數據技術118
6.6 本章小結119
第7章 資料血緣產品121
7.1 國外主流資料血緣產品介紹121
7.1.1 開源的Apache Atlas平台121
7.1.2 社群網站LinkedIn的數據平台123
7.2 國內主流資料血緣產品介紹126
7.2.1 馬哈魚資料血緣平台126
7.2.2 FineBI資料視覺化工具129
7.2.3 億信元資料管理平台129
7.2.4 飛算SoData資料機器人130
7.3 其他數據血緣產品介紹131
7.3.1 Informatica資料平台131
7.3.2 Alation資料平台131
7.3.3 Collibra資料平台132
7.4 本章小結133
第8章 資料治理中的資料血緣應用134
8.1 資料治理體系簡介134
8.1.1 資料管理、資料治理與資料資產管理134
8.1.2 DAMA的資料治理體系136
8.1.3 DMM和DCMM138
8.1.4 華為的資料治理體系139
8.1.5 阿里的資料治理體系140
8.2 資料治理與資料血緣的關係140
8.3 資料血緣在資料治理的應用141
8.3.1 資料血緣在資料品質提升的應用141
8.3.2 資料血緣在資料架構的應用143
8.3.3 資料血緣在資料建模與設計的應用144
8.3.4 資料血緣在資料中的應用145
8.4 本章小結146
第9章 資料血緣的平台建置147
9.1 資料血緣相關平台介紹147
9.1.1 元資料管理平台147
9.1.2 主資料管理平台149
9.1.3 資料倉儲155
9.1.4 資料治理平台158
9.1.5 資料管理駕駛艙161
9.2 資料相關平台建置路徑163
9.2.1 需求分析及研究164
9.2.2 開發與測試165
9.2.3 上線試運行166
9.2.4 開展計畫驗收168
9.2.5 持續化迭代169
9.3 本章小結171
案例篇
第10章 網路產業:位元組跳動的資料血緣建構案例174
10.1 資料血緣建設背景175
10.2 資料血緣建構解析175
10.2.1 資料血緣採集175
10.2.2 資料血緣的關鍵指標176
10.3 資料血緣的未來趨勢177
第11章 服務業:四大全球企業的資料實踐179
11.1 民宿短租公寓預訂平台Airbnb179
11.2 電子商務平台Amazon180
11.3 會員訂閱制的串流播放平台Netflix180
11.4 叫車服務公司Uber181
第12章 製造業:全球企業的資料實務182
12.1 百年企業通用電氣182
12.2 「歐洲工業之母」西門子183
第13章 零售快消產業:全球企業的數據實踐184
13.1 大型零售商沃爾瑪185
13.2 西班牙快時尚零售商Zara185
展望篇
第14章 未來展望188
14.1 資料血緣與資料智能的結合189
14.2 資料血緣與資料隱私的平衡189
14.3 資料血緣在人工智慧的應用190
14.4 資料血緣在模型發展與模型審計的應用191
14.5 資料血緣在模型解釋與模型可解釋性的應用191
14.6 資料血緣在智慧決策的應用192
14.7 資料血緣與區塊鏈的關係192
14.7.1 資料的確權問題192
14.7.2 資料的經濟徵問題193
14.7.3 資料的數值測量問題194
後記1 資料血緣救贖之路196
後記2 從ERP諮詢到資料治理199