大數據項目實戰(第2版)

黑馬程序員

  • 出版商: 清華大學
  • 出版日期: 2025-03-01
  • 售價: $234
  • 語言: 簡體中文
  • ISBN: 7302685371
  • ISBN-13: 9787302685371
  • 相關分類: 大數據 Big-data
  • 下單後立即進貨 (約4週~6週)

  • 大數據項目實戰(第2版)-preview-1
  • 大數據項目實戰(第2版)-preview-2
  • 大數據項目實戰(第2版)-preview-3
大數據項目實戰(第2版)-preview-1

商品描述

"本書以某招聘網站中的大數據職位招聘信息為數據源,系統地介紹了使用 Hadoop 生態系統進行大數據離線分析的方法和步驟。全書共6章,分別講解項目需求、項目架構、項目實現流程、Hadoop集群環境搭建、使用Flume實現數據採集、使用MapReduce實現數據預處理、使用Hive實現數據分析和使用FineBI實現數據可視化。 本書附有配套視頻、教學PPT、教學設計等資源。同時,為了幫助初學者更好地學習本書中的內容,還提供了在線答疑,歡迎讀者關註。 本書適合作為高等學校的數據科學與大數據技術及相關專業的教材,也適合數據分析、數據可視化、數據倉庫等領域的從業者閱讀。"

目錄大綱

目錄

第1章項目概述1

1.1項目需求和目標1

1.2預備知識2

1.3項目架構2

1.4開發環境和工具3

1.5項目開發流程4

1.6本章小結5

第2章搭建Hadoop集群環境6

2.1基礎環境搭建6

2.1.1創建虛擬機6

2.1.2安裝Linux操作系統14

2.1.3克隆虛擬機22

2.1.4配置虛擬機25

2.1.5安裝JDK37

2.2部署ZooKeeper集群40

2.3部署Hadoop集群45

2.4本章小結57

第3章數據採集58

3.1數據採集概述58

3.2部署Flume59

3.3採集招聘信息62

3.4本章小結66

第4章數據預處理67

4.1數據預處理概述67

4.2招聘信息分析68

4.3設計數據預處理方案69

4.4實現數據預處理69

4.4.1數據預處理環境準備69

4.4.2創建工具類71

4.4.3實現Map過程74

4.4.4實現驅動類75

4.4.5運行MapReduce程序76

4.5本章小結79

第5章數據分析80

5.1數據分析概述80

5.2部署Hive81

5.3數據倉庫88

5.3.1數據倉庫簡介88

5.3.2數據倉庫設計89

5.3.3構建數據倉庫92

5.4分析招聘信息97

5.4.1分析大數據職位的區域分佈97

5.4.2分析大數據職位的薪資區間98

5.4.3分析大數據職位的學歷要求99

5.4.4分析大數據職位的職位標簽99

5.5本章小結101

第6章數據可視化102

6.1數據可視化概述102

6.2數據遷移103

6.2.1部署Sqoop103

6.2.2創建表105

6.2.3實現數據遷移107

6.3FineBI的安裝與配置111

6.4實現數據可視化120

6.4.1新建數據集120

6.4.2實現區域分佈的可視化123

6.4.3實現薪資區間的可視化131

6.4.4實現學歷要求的可視化136

6.4.5實現職位標簽的可視化140

6.5本章小結143