數據挖掘 : 商業數據分析技術與實踐 (Data Mining for Business Analytics: Concepts, Techniques, and Applications with JMP Pro)

Name: 數據挖掘 : 商業數據分析技術與實踐 (Data Mining for Business Analytics: Concepts, Techniques, and Applications with JMP Pro)
Price: 602 TWD
Availability: OnlineOnly
Author: 蓋麗特·徐茉莉 (Galit Shmueli), 等
ISBN: 7302497664

蓋麗特·徐茉莉 (Galit Shmueli), 等

出版商: 清華大學
出版日期: 2018-06-01
定價: $708
售價: 8.5 折 $602
語言: 簡體中文
頁數: 399
裝訂: 平裝
ISBN: 7302497664
ISBN-13: 9787302497660
相關分類: Data Science
此書翻譯自: Data Mining for Business Analytics: Concepts, Techniques, and Applications with JMP Pro (Hardcover)

下單後立即進貨 (約4週~6週)

買這商品的人也買了...

~~$450~~ $351

從範例學 SPSS 統計分析與應用
~~$800~~ $632

鳥哥的 Linux 私房菜－伺服器架設篇, 3/e
~~$495~~ $470

資料分析 : SPSS 軟體之應用
~~$520~~ $442

SPSS 統計分析與應用學習實務, 2/e
~~$650~~ $553

SPSS 統計應用學習實務--問卷分析與應用統計
~~$620~~ $608

資料探勘 (Han: Data Mining: Concepts and Techniques, 3/e )
~~$580~~ $551

SPSS 與應用統計學, 2/e
~~$550~~ $435

SPSS 22 統計分析嚴選教材 (適用SPSS17~22)
~~$680~~ $537

資料科學的商業運用 (Data science for business)
~~$380~~ $300

鄉民到底在想什麼？｜網路輿情分析術
$352

數據可視化與數據挖掘：基於Tableau和SPSS Modeler
$296

跟韓老師學 SQL Server 數據庫設計與開發
$248

輕松學大數據挖掘：算法、場景與數據產品
$352

白話統計
~~$594~~ $564

數據挖掘：實用機器學習工具與技術 (Data Mining : Practical Machine Learning Tools and Techniques, 4/e)
~~$580~~ $458

設計聊天機器人｜建立對話式體驗 (Designing Bots: Creating Conversational Experiences)
$505

大數據、數據挖掘與智慧運營
$352

妙趣橫生的統計學:培養大數據時代的統計思維(第四版)
$454

基於 SAS 的供應鏈管理與分析
~~$690~~ $538

資料探勘：人工智慧與機器學習發展以 SPSS Modeler 為範例
$403

SAS 統計分析及應用與 JMP 實驗設計, 2/e
$250

UiPath Studio 開發入門
~~$890~~ $703

矽谷工程師爬蟲手冊：用 Python 成為進階高手
~~$690~~ $545

演算法：最強彩色圖鑑 + Python 程式實作 -- 王者歸來 (全彩印刷第二版)
$421

SiC/GaN 功率半導體封裝和可靠性評估技術

商品描述

本書採用SAS公司的統計軟件包JMP Pro進行實踐性應用，使用引人入勝的實際案例來構建關鍵數據挖掘方法（尤其是分類和預測的預測模型）的理論及其實踐理解。本書所討論的主題包括數據可視化、降維、聚類、線性和邏輯回歸、分類和回歸樹、判別分析、樸素貝葉斯、人工神經網絡、增量模型、集成算法以及時間序列預測等。

海報：

作者簡介

作者：蓋麗特.徐茉莉
蓋麗特.徐茉莉博士是中國台灣清華大學服務科學研究所的特聘教授。自2004年以來，她在馬里蘭大學、Statistics.com、印度商學院和中國台灣清華大學設計並指導了數據挖掘課程。徐茉莉教授以她在商業分析領域的研究和教學而聞名，她的研究方向是在信息系統和醫療保健方面的統計和數據挖掘方法。她撰寫了70篇期刊文章、書籍、教材和圖書章節，包括Wiley出版的《商業數據挖掘：概念、技術和應用程序XLMiner（第三版）》。

彼得.布魯斯是統計教育研究所的創始人。他撰寫了多篇期刊文章，並且是重採樣統計軟件的開發者。他是《統計分析導論：基於重採樣角度》一書的作者以及《商業數據挖掘:概念、技術和應用程序XLMiner（第三版）》的合著者之一。

米婭·斯蒂芬斯是SAS/JMP的學術顧問。在加入SAS公司之前，她曾是新罕布什爾大學的統計學兼職教授，也是North Haven Group有限責任公司（一家統計培訓和諮詢公司）的創始成員。同時是另外三本書的合著者，包括由Wiley出版的《六西格瑪可視化：更精益化的數據分析（第二版）》。

尼廷·帕特爾博士是位於馬薩諸塞州劍橋市的Cytel有限公司的聯合創始人，美國統計協會會士，同時也是麻省理工學院和哈佛大學的客座教授。他是印度計算機學會會士，並在印度管理學院艾哈邁德巴德分校擔任15年教授工作。他也是Wiley出版的《商業數據挖掘:概念、技術和應用程序XLMiner（第三版）》的合著者之一。

目錄大綱

第一部分預備知識

1導論002

1.1什麼是商業分析？002

1.2什麼是數據挖掘？004

1.3數據挖掘及相關用語004

1.4大數據005

1.5數據科學006

1.6為什麼會有這麼多不同的方法？007

1.7術語和符號007

1.8本書框架009

2數據挖掘概述·013

2.1引言013

2.2數據挖掘的核心思想014

2.3數據挖掘步驟016

2.4初步步驟018

2.5預測能力和過擬合024

2.6用JMP Pro建立預測模型029

2.7用JMP Pro進行數據挖掘036

2.8自動化數據挖掘解決方案037

第二部分數據探索與降維

3數據可視化046

3.1數據可視化的用途046
3.2數據實例047
3.3基本圖形：條形圖、折線圖和散點圖049
3.4多維可視化056
3.5特殊可視化068
3.6基於數據挖掘目標的主要可視化方案和操作概要072
4降維076

4.1引言076
4.2維度災難077
4.3實際考慮077
4.4數據匯總078
4.5相關分析082
4.6減少分類變量中的類別數量082
4.7將分類型變量轉換為連續型變量084
4.8主成分分析084
4.9利用回歸模型降維094
4.10利用分類和回歸樹降維094
第三部分性能評估

5評估預測效果·098

5.1引言098
5.2評價預測性能099

5.3評判分類效果101

5.4評判分類性能112

5.5過採樣115

第四部分預測與分類方法

6多元線性回歸·122

6.1引言122

6.2解釋模型與預測模型123

6.3估計回歸方程和預測124

6.4線性回歸中的變量選擇129

7 k近鄰法142

7.1 k-NN分類（分類型結果變量）142

7.2數值型結果變量下的k-NN方法·147

7.3 k-NN算法的優點和缺點149

8樸素貝葉斯分類器153

8.1引言153

8.2使用完全（精確）貝葉斯分類器155

8.3樸素貝葉斯方法的優點和缺點163

9分類和回歸樹·168

9.1引言168

9.2分類樹169

9.3生成樹172

9.4評估分類樹的效果176

9.5避免過擬合178

9.6樹中的分類準則181

9.7多分類的分類樹182

9.8回歸樹182

9.9樹的優點和缺點184

9.10預測方法的提高：組合多棵樹186

9.11不純度的提取和度量188

10邏輯回歸193

10.1引言·193

10.2邏輯回歸模型·195

10.3評價分類性能·202

10.4完整分析案例：預測航班延誤·205

10.5附錄：邏輯回歸的概括·214

11神經網絡225

11.1引言·225

11.2神經網絡的概念和結構·226

11.3擬合數據·226

11.4 JMP Pro用戶輸入·240

11.5探索預測變量和響應變量的關係·242

11.6神經網絡的優點和缺陷·243

12判別分析247

12.1引言·247

12.2觀測值到類的距離·249

12.3從距離到傾向和分類·251

12.4判別分析的分類性能·254

12.5先驗概率·255

12.6多類別分類·256

12.7優點和缺點·258

13組合方法：集成算法和增量模型263

13.1集成算法·263

13.2增量（說服）模型· 268

13.3總結·274

第五部分挖掘記錄之間的關係

14聚類分析280

14.1引言·280

14.2定義兩個觀測值之間的距離·284

14.3定義兩個類之間的距離·288

14.4系統（凝聚）聚類·290

14.5非系統聚類：k-means算法·299

第六部分時間序列預測

15時間序列處理·310

15.1引言·310

15.2描述性與預測性建模·311

15.3商業中的主流預測方法·312

15.4時間序列的構成·312

15.5數據分割和性能評價·316

16回歸預測模型·321

16.1趨勢模型·321

16.2季節模型·327

16.3趨勢和季節模型·330

16.4自相關和ARIMA模型331

17平滑法·350

17.1引言·350

17.2移動平均法·351

17.3簡單指數平滑法·355

17.4高級指數平滑法·358

第七部分案例

18案例·372

18.1查爾斯圖書俱樂部·372

18.2德國信貸·378

18.3太古軟件編目·382

18.4政治說教·385

18.5出租車訂單取消·388

18.6浴皂的消費者細分·390

18.7直郵籌款·393

18.8破產預測·395

18.9時間序列案例：預測公共交通需求·398