可解釋機器學習：模型、方法與實踐

索信達控股邵平楊健穎蘇思达等

出版商: 機械工業
出版日期: 2022-01-01
定價: $474
售價: 8.5 折 $403
語言: 簡體中文
頁數: 232
裝訂: 平裝
ISBN: 7111695712
ISBN-13: 9787111695714
相關分類: Machine Learning

立即出貨

買這商品的人也買了...

$352

機器學習實戰
~~$648~~ $616

機器學習
~~$210~~ $200

人工智能基礎 (高中版)
~~$420~~ $328

PyTorch 深度學習與自然語言中文處理
~~$450~~ $338

圖解AI｜機器學習和深度學習的技術與原理
$811

統計學習要素：機器學習中的數據挖掘、推斷與預測, 2/e (The Elements of Statistical Learning: Data Mining, Inference, and Prediction, 2/e)
$297

可解釋機器學習：黑盒模型可解釋性理解指南
$454

架構師的自我修煉：技術、架構和未來
~~$680~~ $537

機器學習設計模式 (Machine Learning Design Patterns: Solutions to Common Challenges in Data Preparation, Model Building, and Mlops)
~~$599~~ $509

資料科學的建模基礎 : 別急著 coding！你知道模型的陷阱嗎？
$509

機器學習算法競賽實戰
$305

Python 中文自然語言處理基礎與實戰
$662

深度學習時代的電腦視覺算法
~~$750~~ $593

集成式學習：Python 實踐！整合全部技術，打造最強模型 (Hands-On Ensemble Learning with Python: Build highly optimized ensemble machine learning models using scikit-learn and Keras)
~~$948~~ $901

可解釋人工智能導論
~~$359~~ $341

AI 可解釋性 (Python語言版)
~~$450~~ $351

數位孿生：虛實融合打造元宇宙的關鍵技術
$602

因果推斷與機器學習
$510

看漫畫學 Python：有趣、有料、好玩、好用 (全彩修訂版)
~~$474~~ $450

Python 圖像處理與採集, 2/e
~~$1,280~~ $1,011

完全 OS 核心精修 - 熟稔 Windows API 高級篇
~~$980~~ $774

完全 OS 核心精修 - 熟稔 Windows API 基礎篇
~~$880~~ $748

從硬體到 APP 層級 – IT 系統全平台完整監控
~~$474~~ $450

一本書讀懂 AIGC：ChatGPT、AI繪畫、智能文明與生產力變革
~~$680~~ $537

可解釋的機器學習 - 用因果推斷來學習箇中奧祕

商品描述

本書先從背景出發，
闡述黑盒模型存在的問題以及不解決黑盒問題模型可能帶來的後果，
引出可解釋機器學習的重要性；
隨後，我們從可解釋機器學習的研究方向，
分為內在可解釋模型算法和模型事後解析方法兩部分進行介紹，
闡述不同模型的原理、應用及其可解釋性。
z後通過三個不同的應用場景，介紹在銀行實戰中的數據挖掘方法，由問題、處理方法出發，
結合可解釋機器學習模型結果，證明模型的有效性和實用性，期望讀者通過對本書的閱讀，
可以更快更好的解決實際業務問題，而非紙上談兵。
業務場景均為業內的典型案例，希望能夠對讀者有所啟發。
同時，本書中還會有大量的公式與代碼，保證內容的豐富與嚴謹，
經得起推敲，使得讀者知其然且知其所以然。

作者簡介

邵平

資深數據科學家，索信達控股金融AI實驗室總監。
在大數據、人工智能領域有十多年技術研發和行業應用經驗。
技術方向涉及可解釋機器學習、深度學習、時間序列預測、智能推薦、自然語言處理等。
現主要致力於可解釋機器學習、推薦系統、銀行智能營銷和智能風控等領域的技術研究和項目實踐。

楊健穎

雲南財經大學統計學碩士，高級數據挖掘工程師，
一個對數據科學有堅定信念的追求者，目前重點研究機器學習模型的可解釋性。

蘇思达

美國天普大學統計學碩士，機器學習算法專家，
長期為銀行提供大數據與人工智能解決方案和技術服務。
主要研究方向為可解釋機器學習與人工智能，曾撰寫
《可解釋機器學習研究報告》和多篇可解釋機器學習相關文章。

目錄大綱

前言
第一部分背景
第1章引言2
1.1 可解釋機器學習研究背景2
1.1.1 機器學習面臨的挑戰2
1.1.2 黑盒模型存在的問題4
1.2 模型可解釋性的重要性8
1.3 國內外的模型監管政策10
1.4 本章小結11

第2章可解釋機器學習12
2.1 模型的可解釋性12
2.1.1 可解釋性的定義13
2.1.2 可解釋性的分類14
2.1.3 可解釋機器學習的研究方向16
2.2 可解釋性的作用18
2.2.1 產生信任19
2.2.2 提供因果關係依據19
2.2.3 幫助模型診斷20
2.2.4 安全使用模型22
2.2.5 避免發生偏見與歧視22
2.3 可解釋性的實現23
2.3.1 建模前的可解釋性實現23
2.3.2 建模中的可解釋性實現26
2.3.3 建模後的可解釋性實現28
2.4 本章小結29

第二部分理論
第3章內在可解釋機器學習模型32
3.1 傳統統計模型33
3.1.1 線性回歸33
3.1.2 廣義線性模型37
3.1.3 廣義加性模型41
3.1.4 決策樹48
3.2 EBM模型52
3.2.1 模型定義52
3.2.2 識別二階交互項53
3.2.3 實現算法56
3.2.4 模型解釋性59
3.2.5 模型的優勢與不足62
3.3 GAMINet模型63
3.3.1 模型定義64
3.3.2 GAMINet的3個重要準則66
3.3.3 實現算法70
3.3.4 模型解釋性72
3.3.5 模型的優勢與不足77
3.4 RuleFit模型77
3.4.1 模型定義78
3.4.2 規則提取79
3.4.3 實現算法81
3.4.4 模型解釋性81
3.4.5 模型的優勢與不足84
3.5 Falling Rule Lists模型85
3.5.1 模型定義85
3.5.2 模型參數估計87
3.5.3 實現算法88
3.5.4 模型解釋性89
3.5.5 模型的優勢與不足90
3.6 GAMMLI模型91
3.6.1 傳統推薦算法的不足92
3.6.2 交互項效應擬合方法94
3.6.3 自適應軟填充95
3.6.4 模型解釋性97
3.6.5 模型的優勢與不足99
3.7 本章小結99

第4章複雜模型事後解析方法101
4.1 部分依賴圖102
4.1.1 部分依賴函數102
4.1.2 估計方法103
4.1.3 部分依賴圖的局限105
4.1.4 個體條件期望圖106
4.1.5 實例演示107
4.2 累積局部效應圖111
4.2.1 從部分依賴圖到累積局部效應圖112
4.2.2 累積局部效應方程114
4.2.3 實例演示116
4.2.4 ALE方法的優劣118
4.3 LIME事後解析方法118
4.3.1 局部代理模型119
4.3.2 LIME方法的基本流程120
4.3.3 LIME方法的解釋121
4.3.4 LIME方法的優劣123
4.4 SHAP事後解析方法124
4.4.1 SHAP的基本思想125
4.4.2 Shapley Value126
4.4.3 SHAP的實現算法128
4.4.4 SHAP方法的解釋137
4.4.5 SHAP方法的優劣140
4.4.6 擴展閱讀141
4.5 本章小結143

第三部分實例
第5章銀行VIP客戶流失預警及歸因分析146
5.1 案例背景146
5.2 數據介紹147
5.3 建模分析148
5.3.1 目標定義148
5.3.2 數據處理149
5.3.3 模型構建150
5.3.4 流失歸因151
5.4 營銷建議157
5.5 代碼展示159
5.6 本章小結162

第6章銀行個人客戶信用評分模型研究163
6.1 案例背景163
6.2 數據介紹164
6.3 建模分析165
6.3.1 目標定義165
6.3.2 數據處理166
6.3.3 模型構建167
6.4 三種方法對比180
6.5 代碼展示182
6.6 擴展思考：基於規則的特徵衍生186
6.7 本章小結188

第7章銀行理財產品推薦建模分析189
7.1 場景介紹189
7.1.1 推薦系統190
7.1.2 銀行中的推薦系統193
7.2 數據介紹196
7.2.1 推薦場景數據特點196
7.2.2 Santander數據集197
7.3 建模分析199
7.3.1 數據處理199
7.3.2 模型構建200
7.3.3 模型結果評估204
7.4 案例分析208
7.5 本章小結211