大數據原理與實戰
趙渝強
- 出版商: 中國水利水電
- 出版日期: 2022-01-01
- 定價: $599
- 售價: 8.5 折 $509
- 語言: 簡體中文
- 頁數: 463
- 裝訂: 平裝
- ISBN: 7522600111
- ISBN-13: 9787522600116
-
相關分類:
大數據 Big-data
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
$520$411 -
$730實現領域驅動設計 (Implementing Domain-Driven Design)
-
$860$731 -
$352大話代碼架構 (項目實戰版)
-
$403SQL 優化核心思想
-
$301Spring Data JPA 從入門到精通
-
$390$371 -
$520$411 -
$680$578 -
$350$298 -
$454Spring 微服務架構設計, 2/e
-
$1,710$1,625 -
$536精通Spring Cloud微服務架構
-
$403Vue.js 入門與商城開發實戰
-
$714$678 -
$534$507 -
$500$390 -
$780$608 -
$780$616 -
$403Xamarin 全棧開發技術與實踐 (微課版)
-
$400$340 -
$800$680 -
$458Spring Boot 企業級項目開發實戰
-
$650$507 -
$690$538
商品描述
《大數據原理與實戰》一書覆蓋完整的大數據生態圈體系,包括 Hadoop 生態圈體系、
Spark 生態圈體系、Flink 生態圈體系、 NoSQL 數據庫及相關組件。
本書側重動手實操,提供完整詳細的實驗步驟,可以讓讀者真實模擬大數據平臺體系的運行環境,
在虛擬機上構建自己的大數據集群;同時,本書也兼顧必要的理論講解,
深入淺出,讓讀者在瞭解大數據基本架構和原理機制的基礎上,
能夠通過實驗真正掌握大數據平臺體系中的技術組件。
《大數據原理與實戰》適合具有一定 Java 編程基礎的人員閱讀,
如平臺架構師、開發人員、運維管理人員等。
本書內容詳盡,不僅可以作為初學者的學習用書,
而且可以作為開發人員等工作中的參考手冊。
作者簡介
趙渝強(網名趙強老師)IT技術專家和培訓講師。18年以上的IT行業從業經歷,清華大學計算機軟件工程專業畢業,京東大學大數據學院院長,Oracle中國有限公司高級技術顧問,華為認證講師。曾在BEA、甲骨文、摩托羅拉等世界500強公司擔任高級軟件架構師或咨詢顧問等要職,精通大數據、數據庫、中間件技術和Java技術。培訓學員超過10萬人
目錄大綱
目錄
第1章 大數據核心理論基礎與架構
1.1 大數據概述
1.1.1 大數據的基本概念和特性
1.1.2 大數據平臺所要解決的核心問題
1.1.3 數據倉庫與大數據
1.2 大數據的理論基礎
1.2.1 Google文件系統
1.2.2 MapReduce分佈式計算模型
1.2.3 BigTable分佈式數據庫
1.3 大數據生態圈組件
1.3.1 Hadoop生態圈
1.3.2 Spark生態圈
1.3.3 Flink生態圈
1.4 基於大數據組件的平臺架構
第2章 部署大數據環境
2.1 準備大數據平臺環境
2.1.1 安裝Linux操作系統
2.1.2 配置Linux環境
2.2 部署Hadoop環境
2.2.1 Hadoop的目錄結構
2.2.2 部署Hadoop本地模式
2.2.3 部署Hadoop偽分佈模式
2.2.4 部署Hadoop全分佈模式
2.3 部署 Spark環境
2.3.1 部署Spark偽分佈模式
2.3.2 部署Spark全分佈模式
2.4 部署Flink環境
2.4.1 部署Flink偽分佈模式
2.4.2 部署Flink全分佈模式
2.5 大數據體系的單點故障問題
第3章 HDFS
3.1 HDFS體系架構詳解
3.1.1 NameNode
3.1.2 DataNode
3.1.3 SecondaryNameNode
3.2 使用不同方式操作HDFS
3.2.1 HDFS令令行
3.2.2 Java API
3.2.3 Web Console
3.3 HDFS的高級特性
3.3.1 回收站
3.3.2 快照
3.3.3 配額管理
3.3.4 安全模式
3.3.5 權限管理
3.4 聯盟
3.4.1 聯盟概述
3.4.2 聯盟的架構
3.4.3 部署聯盟
3.5 HDFS的底層通信方式RPC
3.5.1 RPC概述
3.5.2 開發服務器端程序和客戶端程庫
3.5.3 運行RPC服務器端程序和客戶端程序
……
第4章 NoSQL數據庫HBase
第5章 MapReduce編程
第6章 數據分析引擎Hive
第7章 數據分析引擎Pig
第8章 數據分析引擎Presto
第9章 大數據計算引擎Spark Core
第10章 數據分析引擎Spark SQL
第11章 流式計算引擎Spark Streaming
第12章 大數據計算引擎Flink基礎
第13章 大數據計算引擎Flink進階
第14章 分佈式協調服務ZooKeeper
第15章 大數據的ETL採集框