大數據綜合應用實踐
陳靜、楊美紅、張虎、李娜、郭瑩
- 出版商: 清華大學
- 出版日期: 2022-12-01
- 定價: $354
- 售價: 8.5 折 $301
- 語言: 簡體中文
- ISBN: 7302614520
- ISBN-13: 9787302614524
-
相關分類:
大數據 Big-data
下單後立即進貨 (約4週~6週)
相關主題
商品描述
目錄大綱
目錄
第1章大數據綜合應用概述001
1.1大數據技術概述001
1.1.1大數據基本概念001
1.1.2大數據技術的發展歷程001
1.1.3大數據的技術框架002
1.1.4大數據生態圈及處理工具003
1.1.5大數據技術的發展趨勢006
1.2大數據綜合應用概述007
1.2.1大數據產業007
1.2.2大數據的應用領域008
1.2.3大數據的典型應用及特徵009
1.2.4大數據應用前景與展望011
1.3本章小結012
第2章基於Python+MySQL+Kettle的點評網數據採集分析及可視化013
2.1項目概述013
2.2項目環境部署014
2.2.1模擬點評網站的部署014
2.2.2項目實踐環境部署020
2.3項目技術知識030
2.3.1網頁解析030
2.3.2網絡爬蟲037
2.3.3數據清洗042
2.3.4數據統計分析與可視化045
2.4項目實踐046
2.4.1點評網網頁分析046
2.4.2Python爬取點評網數據050
2.4.3Kettle數據清洗064
2.4.4統計分析與PyEcharts可視化079
2.5項目小結090
2.6項目拓展訓練090大數據綜合應用實踐
目錄
第3章基於Hive+MySQL+Spark的零售數據分析及可視化091
3.1項目概述091
3.2項目環境部署092
3.2.1安裝Java092
3.2.2安裝Hadoop098
3.2.3安裝MySQL102
3.2.4安裝Hive107
3.2.5安裝Sqoop113
3.2.6安裝Spark115
3.2.7利用Echarts可視化117
3.3項目技術知識123
3.3.1Spark基本原理123
3.3.2Hive數據倉庫130
3.3.3PySpark簡介134
3.3.4Spark SQL概述137
3.3.5MLlib和關聯分析138
3.4項目實踐141
3.4.1基於Hive+MySQL+Sqoop的數據存儲與傳輸142
3.4.2基於零售交易數據的Spark數據處理與分析150
3.4.3可視化展示161
3.5項目小結189
3.6項目拓展訓練190
第4章基於Elasticsearch+Logstash+Kibana+Filebeat的日誌收集分析及可視化191
4.1項目概述191
4.2項目環境部署192
4.2.1Elasticsearch安裝193
4.2.2Logstash安裝194
4.2.3Kibana安裝195
4.2.4Filebeat安裝195
4.2.5Kafka安裝196
4.3項目技術知識198
4.3.1ELKF Stack數據處理工具198
4.3.2Beats輕量級日誌採集器198
4.3.3Logstash日誌分析過濾工具204
4.3.4Elasticsearch分佈式日誌搜索引擎213
4.3.5Kibana日誌匯總、分析和搜索展示系統227
4.3.6Kafka分佈式消息系統234
4.4項目實踐235
4.4.1網約車平臺日誌數據收集236
4.4.2網約車平臺日誌數據傳輸和過濾238
4.4.3日誌數據匯集及存儲240
4.4.4日誌數據分析及可視化展示240
4.5項目小結252
4.6項目拓展訓練252
參考文獻253