Hadoop大數據平臺構建

孟瑞軍、哈里白、高榮貴、宋海燕

  • 出版商: 清華大學
  • 出版日期: 2024-12-01
  • 定價: $348
  • 售價: 8.5$296
  • 語言: 簡體中文
  • ISBN: 7302677158
  • ISBN-13: 9787302677154
  • 相關分類: Hadoop大數據 Big-data
  • 下單後立即進貨 (約4週~6週)

  • Hadoop大數據平臺構建-preview-1
  • Hadoop大數據平臺構建-preview-2
  • Hadoop大數據平臺構建-preview-3
Hadoop大數據平臺構建-preview-1

商品描述

"  本書以Hadoop 及其周邊框架為主線,介紹了整個Hadoop 生態系統主流的大數據組件以及平臺運維。本書從零開始逐一講解大數據體系中的各種技術,通過豐富的實戰案例闡述重點、難點知識,為初學者進入大數據領域打好基礎。書中各個項目設計合理,在每個項目開頭設置導讀,首先介紹知識點,然後緊跟實踐操作,最後在每個項目末尾通過課後練習幫助讀者鞏固所學知識。   本書既可作為Hadoop 新手入門的指導用書,也可作為職業院校大數據技術、雲計算應用技術和人工智能應用技術等電腦類專業的教材,還可供從事電腦相關工作的技術人員參考。"

目錄大綱

目 錄

項目1  大數據及Hadoop 概述 …………………………………………………………… 1

任務1.1 大數據概述 ……………………………………………………………………… 2

任務1.2 Hadoop 概述 …………………………………………………………………… 5

課後練習 ………………………………………………………………………………… 8

項目2 Hadoop 分佈式集群安裝及部署 …………………………………………………10

任務2.1 Linux 系統基礎環境安裝及配置 ………………………………………………11

任務2.2 偽分佈式系統安裝 ………………………………………………………………22

任務2.3 完全分佈系統安裝 ………………………………………………………………33

課後練習 ………………………………………………………………………………… 47

項目3 分佈式文件系統HDFS ……………………………………………………………49

任務3.1 HDFS 概述 ………………………………………………………………………50

任務3.2 HDFS 命令行客戶端 ……………………………………………………………54

課後練習 ………………………………………………………………………………… 62

項目4 分佈式計算框架MapReduce ………………………………………………………64

任務4.1 認識MapReduce ………………………………………………………………65

任務4.2 分佈式資源調度平臺Yarn ………………………………………………………72

課後練習 ………………………………………………………………………………… 77

項目5 分佈式協調框架ZooKeeper ………………………………………………………79

任務5.1 認識ZooKeeper …………………………………………………………………80

Hadoop 大數據平臺構建

任務5.2 部署ZooKeeper 集群 ……………………………………………………………86

任務5.3 ZooKeeper Shell …………………………………………………………………93

課後練習 ………………………………………………………………………………… 97

項目6 Hadoop 高可用集群 ………………………………………………………………99

任務6.1 認識Hadoop 高可用 ………………………………………………………… 100

任務6.2 部署Hadoop HA 集群 ……………………………………………………… 103

課後練習 ……………………………………………………………………………… 117

項目7 分佈式存儲數據庫HBase ……………………………………………………… 119

任務7.1 初識HBase …………………………………………………………………… 120

任務7.2 部署HBase 集群 ……………………………………………………………… 125

任務7.3 HBase Shell 操作 …………………………………………………………… 131

課後練習 ……………………………………………………………………………… 138

項目8 數據倉庫Hive …………………………………………………………………… 140

任務8.1 Hive 簡介 ……………………………………………………………………… 141

任務8.2 Hive 安裝部署 ………………………………………………………………… 146

任務8.3 Hive 操作 ……………………………………………………………………… 156

任務8.4 Hive 和HBase 整合 ………………………………………………………… 167

課後練習 ……………………………………………………………………………… 170

項目9 數據遷移工具Sqoop …………………………………………………………… 172

任務9.1 部署Sqoop …………………………………………………………………… 173

任務9.2 Sqoop 應用 …………………………………………………………………… 178

課後練習 ……………………………………………………………………………… 186

項目10 日誌採集工具Flume …………………………………………………………… 188

任務10.1 認識Flume …………………………………………………………………… 189

任務10.2 Flume 安裝部署 ……………………………………………………………… 193

任務10.3 Flume 多點採集數據 ………………………………………………………… 200

課後練習 ……………………………………………………………………………… 205

目 錄

V

目 錄

項目11 分佈式消息隊列Kafka ………………………………………………………… 207

任務11.1 認識Kafka …………………………………………………………………… 208

任務11.2 部署Kafka 集群 …………………………………………………………… 212

任務11.3 Kafka 和Flume 整合 ……………………………………………………… 219

課後練習 ……………………………………………………………………………… 221

項目12 內存計算框架Spark …………………………………………………………… 223

任務12.1 認識Spark …………………………………………………………………… 224

任務12.2 部署Spark …………………………………………………………………… 228

課後練習 ……………………………………………………………………………… 234

項目13 內存計算框架Flink …………………………………………………………… 237

任務13.1 認識Flink …………………………………………………………………… 238

任務13.2 部署Flink …………………………………………………………………… 243

課後練習 ……………………………………………………………………………… 255

項目14 大數據平臺的管理與監控 ……………………………………………………… 257

任務14.1 大數據平臺的管理與監控概述 …………………………………………… 258

任務14.2 Nagios 監控 ………………………………………………………………… 259

任務14.3 Ganglia 監控 ………………………………………………………………… 279

任務14.4 Prometheus 監控 …………………………………………………………… 297

課後練習 ……………………………………………………………………………… 306

參考文獻 …………………………………………………………………………………… 308