工業數據分析工程

田春華

  • 出版商: 機械工業
  • 出版日期: 2024-09-01
  • 定價: $594
  • 售價: 8.5$505
  • 語言: 簡體中文
  • 頁數: 235
  • 裝訂: 平裝
  • ISBN: 7111759796
  • ISBN-13: 9787111759799
  • 相關分類: Data Science
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

在「數據資產化」「工業互聯網」「工業大數據」的推進中,工業大數據分析仍缺乏統一的指導方法,
造成工業大數據分析專案品質波動大,落地成功率低。
CRISP-DM方法是機器學習領域的行業事實標準,但CRISP-DM只是過程方法,對於每個階段或關鍵活動,並沒有給出具體的行動指導。
本書在CRISP-DM基礎上,細化了工業資料分析中的具體活動,針對關鍵活動提出了明確的形式化方法
(例如,以系統動力學模型刻畫工業物理系統的操作機制,以領域模型描述物理系統間的概念關係,
以資料處理流程圖描述分析模型間的資料處理與依賴關係),並以具體的產業案例進行闡述,
嘗試為工業大數據分析建構一套實操性的工程方法體系。
本書分為10章:
第1章概要介紹工業資料分析方法體系;
第2-7章討論了分析場景定義、業務理解、資料理解、資料準備、模型建立、
模型評估和模型部署7個階段的關鍵活動、關鍵角色和成功標準,給出實操形式化方法,並用具體工業案例進行展示;
第8-10章用3個不同類型產業案例,端到端展示了工業資料分析方法的應用流程。
本書是實操性方法的系統性總結,用實際案例將讀者代入,更能理解問題的挑戰和解決過程,
在此基礎上,進行系統化總結,方便方法的傳承。

目錄大綱

前言
第1章 工業資料分析方法概述
1.1 方法論內涵與作用
1.2 工業大數據專案落地的載體
1.2.1 工業資料分析的3種載體形式:資料服務、模型服務、智慧應用
1.2.2 工業大數據專案的價值落地
1.2.3 智慧化專案管理
1.3 工業資料分析過程方法
1.4 如何用好工業資料分析方法
1.4.1 大數據分析法的應用範疇
1.4.2 大數據分析方法與專案管理
1.4.3 大數據分析專案階段劃分
參考文獻
第2章 分析場景定義
2.1 什麼是分析場景
2.2 分析場景識別
2.2.1 自頂向下的結構化分解法
2.2.2 自下向上的歸納剖析法
2.2.3 數據驅動的業務能力匹配法
2.2.4 分析場景辨識中常見的問題
2.3 分析場景篩選
2.3.1 基於基線思考的場景篩選法
2.3.2 基於要素-認知矩陣的場景篩選法
2.3.3 分析場景篩選的常見問題
2.4 分析場景定義範例
2.4.1 智慧運維:自頂向下的結構化分解法
2.4.2 汽車製造:自下向上的歸納剖析法
2.4.3 電動礦卡智慧管理:數據驅動的業務能力匹配法
參考文獻
第3章 業務理解
3.1 業務理解的目標
3.1.1 形成分析課題描述
3.1.2 提出資料需求清單
3.2 業務理解的主要內容
3.2.1 決策邏輯
3.2.2 決策場景
3.2.3 領域概念
3.3 業務理解的形式化模型
3.3.1 層次分解模型-列表
3.3.2 層次分解模型—樹狀結構
3.3.3 系統動力學模型
3.3.4 專家規則
3.3.5 運籌學模型
3.4 系統動力學的建模方法
3.4.1 系統動力學的建模過程
3.4.2 系統動力學建模背後的支撐技術
3.4.3 系統動力模型的概念辨析
3.5 專家規則的建模方法
3.5.1 基於規則流的規則描述方法
3.5.2 基於邏輯表達式的規則檢定方法
3.6 領域模型的建模方法
3.6.1 數據驅動的領域建模
3.6.2 業務驅動的領域建模
3.7 業務理解的執行策略
3.7.1 了解性訪談
3.7.2 基於範例資料的業務理解
3.7.3 確認性訪談
3.8 思考:業務理解中形式化模型的必要性
3.8.1 水箱水位預測的例子
3.8.2 發電機冷卻水溫度區間估計的例子
參考文獻
第4章 數據理解
4.1 數據收集
4.1.1 明確資料來源系統與存取方式
4.1.2 明確資料更新與儲存週期
4.2 資料描述-資料集層面的理解
4.2.1 樣本資料的人工閱讀
4.2.2 數據概覽
4.2.3 領域模型與資料模型互動理解
4.3 資料探索-資料欄位層面的理解
4.3.1 統計分佈
4.3.2 數據視覺化
4.4 資料探索-業務層面的理解
4.4.1 業務維度組合的探索(基於領域模型)
4.4.2 業務過程理解(基於系統動力學模型)
4.4.3 專家知識的復現
4.5 數據品質審查
4.5.1 範例案例
4.5.2 基於領域模型的品質審查方法
4.5.3 分析項目中數據品質突出的原因
4.5.4 資料品質評估與影響分析
4.6 資料理解階段的執行策略
4.6.1 執行路徑
4.6.2 軟體工具
4.6.3 典型的資料處理技巧
參考文獻
第5章 資料準備
5.1 資料流設計
5.1.1 資料倉儲建模
5.1.2 領域模型驅動的工業資料組織方法
5.1.3 工業資料分析的資料流程圖
5.1.4 分析資料流程圖範例
5.2 資料選擇與清洗
5.3 數據融合
5.4 特徵提取與選擇
5.4.1 特徵的來源
5.4.2 特徵提取的推進思路
5.5 資料資源化:資料分析師的視角
參考文獻
第6章 模型建立
6.1 常用演算法及問題類型轉換方法
6.2 目標變數的相關問題
6.2.1 目標變數的構建
6.2.2 目標變數變換
6.2.3 不均衡問題
6.3 預測變數的相關問題
6.3.1 工況切分
6.3.2 變數的離散化
6.3.3 移除沒有業務意義的高相關特徵量
6.3.4 特徵變數組合
6.3.5 類別變數的完備度
6.4 工業分析建模問題
6.4.1 基準模型
6.4.2 大量測點的穩定過程建模
6.4.3 基於樸素道理的深度網路結構參數優化
6.4.4 時序分類問題
6.4.5 非監督學習問題
6.4.6 優化問題
6.4.7 評價型問題
6.4.8 淺機理、高維度的診斷型問題
6.5 機理模型與統計模型的結合方法
6.5.1 機理模型的範疇:定性與定量機制
6.5.2 統計模型與數學模型的4種融合範式
6.5.3 統計模型與模擬模型的2種融合模式
6.5.4 統計模型與經驗性機制模型的融合
參考文獻
第7章 模型評價與部署
7.1 模型評價的內容
7.2 技術評價
7.3 業務評價
7.4 下一步工作規劃
7.5 模型部署的內容
7.6 部署包的設計
7.6.1 分析任務的邏輯審查
7.6.2 資料異常的影響分析與因應措施
7.6.3 分析模型打包
7.