大數據分析基礎及應用案例(微課版)
孫青、譚嶠、王禕
- 出版商: 清華大學
- 出版日期: 2025-01-01
- 定價: $294
- 售價: 8.5 折 $250
- 語言: 簡體中文
- 頁數: 151
- ISBN: 7302680957
- ISBN-13: 9787302680956
-
相關分類:
大數據 Big-data、Data Science
下單後立即進貨 (約4週~6週)
商品描述
"本書是一本全面介紹大數據分析理論基礎、方法、技術及其應用實踐的專業書籍,以數據分析的基礎理論為出發點,詳細闡述了數據採集、清洗、預處理、探索性數據分析等前期準備工作,為讀者揭示了數據分析的全過程和方法論。 本書著重介紹線性回歸、邏輯回歸、決策樹、隨機森林、神經網絡等常用的數據分析方法,並通過TensorFlow等工具的應用,展示如何在實際項目中應用這些技術進行數據挖掘和預測分析。此外,作者還精選了金融、電商、物流等行業的大數據分析案例,詳細講解了從數據處理到模型構建,再到結果解釋的完整流程,旨在幫助讀者深入理解大數據分析在不同領域的應用場景和價值。 本書適合數據科學、金融科技、電子商務、物流等相關專業的學生和教師,以及對數據分析感興趣的企業管理人員和技術開發人員閱讀。本書內容豐富、案例實用、理論與實踐相結合,是進入大數據分析領域不可多得的參考書籍。 "
作者簡介
孫青,副教授,山東省人工智能學會會員,從事數據挖掘與機器學習研究,並承擔數據挖掘與機器學習等課程的教學工作,參與編寫《管理信息系統》《大學信息技術基礎教程》《數據庫應用基礎教程》等多部教材。
目錄大綱
目錄
第1章數據分析基礎1
1.1數據分析概述1
1.1.1數據分析的概念1
1.1.2數據分析流程與方法論2
1.2數據獲取與預處理4
1.2.1數據採集方法4
1.2.2數據清洗與預處理技術5
1.3探索性數據分析7
1.3.1數據可視化基礎7
1.3.2描述性統計分析8
1.3.3數據探索技術與工具9
習題10
第2章數據分析方法11
2.1線性回歸11
2.2邏輯回歸12
2.3決策樹13
2.4隨機森林14
2.5XGBoost15
2.6聚類16
2.7神經網絡17
2.8TensorFlow18
2.9Keras19
2.10LSTM20
2.11自編碼器21
2.12情感計算22
2.13RFM模型222.14遺傳算法23
2.15蟻群優化算法24
習題25
目錄〖3〗第3章金融大數據分析案例27
3.1證券文本信息情感分析27
3.1.1案例背景27
3.1.2數據來源與運行環境27
3.1.3分析過程與代碼實現28
3.1.4小結39
3.2信貸風險預測39
3.2.1案例背景39
3.2.2數據來源與運行環境40
3.2.3分析過程與代碼實現40
3.2.4小結62
3.3股票價格預測62
3.3.1案例背景62
3.3.2數據來源與運行環境63
3.3.3分析過程與代碼實現63
3.3.4小結71
3.4信用卡欺詐檢測71
3.4.1案例背景71
3.4.2數據來源與運行環境72
3.4.3分析過程與代碼實現72
3.4.4小結86
習題87
第4章電商大數據分析案例88
4.1電商企業銷售數據分析與預測88
4.1.1案例背景88
4.1.2數據來源與運行環境88
4.1.3項目分析方法88
4.1.4項目實現過程89
4.1.5小結100
4.2電商企業廣告投放效果分析100
4.2.1案例背景100
4.2.2數據來源與運行環境100
4.2.3項目實現過程101
4.2.4小結112
4.3電商企業客戶分析112
4.3.1案例背景112
4.3.2項目分析目標112
4.3.3數據準備112
4.3.4目標分析118
4.3.5案例結論136
4.3.6小結137
習題138
第5章物流大數據分析案例139
5.1運輸路線優化139
5.1.1案例背景139
5.1.2數據集介紹140
5.1.3分析過程與代碼實現140
5.1.4小結146
5.2智能倉庫管理147
5.2.1案例背景147
5.2.2數據集介紹147
5.2.3分析過程與代碼實現147
5.2.4小結150
習題150
參考文獻152