數據質量實踐手冊 4步構建高質量數據體系
巫雪輝
- 出版商: 機械工業
- 出版日期: 2024-10-01
- 定價: $594
- 售價: 8.5 折 $505
- 語言: 簡體中文
- 頁數: 216
- ISBN: 7111764668
- ISBN-13: 9787111764663
下單後立即進貨 (約4週~6週)
買這商品的人也買了...
-
$450$383 -
$550$435 -
$880$695 -
$590$531 -
$490$441 -
$500$450 -
$560$437 -
$580$458 -
$719$683 -
$450$356 -
$680$530 -
$580$458 -
$980$882 -
$520$410 -
$600$468 -
$500$395 -
$620$489
商品描述
高質量的數據關乎企業運營、合規、決策和業績的關鍵,哈佛商業評論的一項研究發現,企業中只有3%的數據符合質量標準,絕大多數公司都在尋求切實可行的指導來提高數據質量。 本書作者基於多年在數據、數據分析和人工智能方面的實踐經驗,闡述了4步構建高質量數據體系。他提出了高質量數據的四階段DARS方法(定義、評估、實現、持續)和10個數據質量最佳實踐案例,以此來提高業務中的數據質量水平,為業務提供數據價值,保證生成的數據可以有效支持高級分析和人工智能。 在本書中,您將學習定義和評估數據質量的技術、標準和度量指標,瞭解如何確保公司的數據收集實踐避免常見的陷阱。本書適合數據科學家、數據分析師、商業智能專業人士、首席技術官和數據官,以及對收集和使用高質量數據感興趣的人士。對於有志成為首席數據官的各位讀者,這是一本難得的寶典級書籍!
作者簡介
普拉桑特·蘇特卡爾,博士,知名的數據分析和人工智能顧問、作家和教授,曾為包括寶潔、通用電氣、殼牌、蘋果、聯邦快遞和SAP在內的80多家公司提供咨詢服務。他是Data for Business Performance和Analytics Best Practices的作者,定期在Forbes和CFO University上發表關於數據分析和人工智能的文章。他是麻省理工學院CDOIQ研討會的編輯委員會成員,也是硅谷風險投資公司BGV(Benhamou Global Ventures)的顧問委員會成員,還是IE商學院(西班牙馬德里》的數據和分析副教授。CDO Magazine將他列入2022年全球75位學術數據領導者之列。除了從事咨詢和顧問工作外,他還在全球培訓了3000多名數據和分析專業人員。
目錄大綱
推薦序
前言
致謝
第1篇 定義階段
第1章 概述
1.1 引言
1.2 數據、數據分析、人工智能和業務績效
1.3 數據作為業務資產或負債
1.4 數據治理、數據管理和數據質量
1.5 領導層對數據質量的承諾
1.6 關鍵要點
1.7 結論
參考文獻
第2章 業務數據
2.1 引言
2.2 業務中的數據
2.3 遙測數據
2.4 數據在業務中的用途
2.5 業務數據視角
2.6 業務數據的關鍵特徵
2.7 關鍵數據元素
2.8 關鍵要點
2.9 結論
參考文獻
第3章 業務中的數據質量
3.1 引言
3.2 數據質量維度
3.3 上下文中的數據質量
3.4 數據質量不佳所產生的影響
3.5 數據貶值及其影響因素
3.6 IT系統中的數據
3.7 數據質量和可信信息
3.8 關鍵要點
3.9 結論
參考文獻
第2篇 評估階段
第4章 數據質量差的原因
4.1 引言
4.2 數據質量問題根本原因分析工具
4.3 數據質量不佳的典型原因
4.4 關鍵要點
4.5 結論
參考文獻
第5章 數據生命周期和數據血緣
5.1 引言
5.2 數據生命周期
5.3 數據血緣
5.4 關鍵要點
5.5 結論
參考文獻
第6章 數據質量分析
6.1 引言
6.2 數據剖析的標準
6.3 測量中心性的數據剖析技術
6.4 測量變異性的數據剖析技術
6.5 整合中心性和變異性KPI
6.6 關鍵要點
6.7 結論
參考文獻
第3篇 實現階段
第7章 數據質量參考架構
7.1 引言
7.2 數據質量解決方案
7.3 DataOps
7.4 數據產品
7.5 數據編織和數據網格
7.6 數據增強
7.7 關鍵要點
7.8 結論
參考文獻
第8章 數據質量最佳實踐(一)
8.1 引言
8.2 最佳實踐概述
8.3 BP 1:確定業務KPI以及這些KPI和相關數據的所有權
8.4 BP 2:建立和提高組織中的數據文化和素養
8.5 BP 3:確定當前和期望的數據質量的狀態
8.6 BP 4:遵循極簡主義原則的數據採集方法
8.7 BP 5:選擇並定義用於提高質量的數據屬性
8.8 BP 6:使用MDM系統中的數據標準採集和管理關鍵數據
8.9 關鍵要點
8.10 結論
參考文獻
第9章 數據質量最佳實踐(二)
9.1 引言
9.2 BP 7:合理化和自動化關鍵數據元素的集成
9.3 BP 8:定義SoR並在SoR/OLTP系統中安全地採集交易數據
9.4 BP 9:構建和管理強大的數據集成能力
9.5 BP 10:分發數據來源與洞察消費
9.6 關鍵要點
9.7 結論
參考文獻
第4篇 持續階段
第10章 數據治理
10.1 引言
10.2 數據治理原則
10.3 數據治理設計組件
10.4 實施數據治理計劃
10.5 數據可觀察性
10.6 數據合規性——ISO 27001、SOC1和SOC
10.7 關鍵要點
10.8 結論
參考文獻
第11章 數據保護
11.1 引言
11.2 數據分類
11.3 存儲相關的數據安全
11.4 訪問相關的數據安全
11.5 關鍵要點
11.6 結論
參考文獻
第12章 數據倫理
12.1 引言
12.2 數據倫理的定義
12.3 數據倫理的重要性
12.4 數據倫理的原則
12.5 模型漂移中的數據倫理
12.6 數據隱私
12.7 管理數據倫理
12.8 關鍵要點
12.9 結論
參考文獻