基於 Apache Kylin 構建大數據分析平臺基于Apache Kylin构建大数据分析平台

蔣守壯

出版商: 清華大學
出版日期: 2017-01-01
定價: $414
售價: 8.5 折 $352
語言: 簡體中文
頁數: 260
裝訂: 平裝
ISBN: 7302454523
ISBN-13: 9787302454526
相關分類: 大數據 Big-data、Data Science
相關翻譯: Apache Kylin 大數據入門 (舊名: 集華人智慧之大成：Apache Kylin 用中文處理大數據) (繁中版)

下單後立即進貨 (約4週~6週)

買這商品的人也買了...

~~$480~~ $379

人月神話：軟體專案管理之道 (20 週年紀念版)(The Mythical Man-Month: Essays on Software Engineering, Anniversary Edition, 2/e)
~~$880~~ $695

深入淺出設計模式 (Head First Design Patterns)
~~$420~~ $332

學徒模式－優秀軟體開發者的養成之路 (Apprenticeship Patterns: Guidance for the Aspiring Software Craftsman)
~~$580~~ $458

高效能網站開發指南 (High Performance Browser Networking: What every web developer should know about networking and web performance)
~~$780~~ $616

精通 Python｜運用簡單的套件進行現代運算 (Introducing Python: Modern Computing in Simple Packages)
$403

觸手可及的大數據分析工具：Tableau 案例集
$288

深度學習導論及案例分析
~~$720~~ $562

iOS 10 App 程式設計實力超進化實戰攻略 : 知名 iOS教學部落格 AppCoda 作家親授實作關鍵技巧讓你不NG
~~$480~~ $379

Python 初學特訓班 (附250分鐘影音教學/範例程式)
$403

深度學習 : Caffe 之經典模型詳解與實戰
~~$360~~ $238

深度學習快速入門 — 使用 TensorFlow (Getting started with TensorFlow)
$296

Rootkit 隱遁攻擊技術及其防範
$250

Apache Kylin 權威指南
~~$780~~ $616

JavaScript & JQuery : 網站互動設計程式進化之道 (JavaScript and JQuery: Interactive Front-End Web Development)
~~$780~~ $616

Laravel 啟動與運行 (Laravel: Up and Running: A Framework for Building Modern PHP Apps)
~~$590~~ $460

TensorFlow + Keras 深度學習人工智慧實務應用
~~$390~~ $308

寫程式前就該懂的演算法 ─ 資料分析與程式設計人員必學的邏輯思考術 (Grokking Algorithms: An illustrated guide for programmers and other curious people)
$403

大數據架構和算法實現之路:電商系統的技術實戰(Big Data Architecture and Algorithm in Action the Implementation in E-Commerce Systems)
~~$440~~ $374

完整學會 Git, GitHub, Git Server 的 24堂課, 2/e
~~$650~~ $553

集華人智慧之大成：Apache Kylin 用中文處理大數據
$505

Apache Kylin 權威指南, 2/e
$248

React Native 移動開發實戰, 2/e
~~$650~~ $507

和艦長一起 30 天玩轉 GitLab【第二版】（iT邦幫忙鐵人賽系列書）
~~$580~~ $458

Apache NiFi｜讓你輕鬆建立 Data Pipeline
~~$780~~ $616

Python + ChatGPT 零基礎 + 高效率學程式設計與運算思維, 3/e

商品描述

<內容簡介>

Apache Kylin是一個開源的分佈式分析引擎，提供Hadoop之上的SQL查詢接口及多維分析（OLAP）能力以支持超大規模數據，最初由eBay公司開發並貢獻至開源社區。它能在亞秒內查詢巨大的Hive表。
本書分為21章，詳細講解Apache Kylin概念、安裝、配置、部署，讓讀者對Apache Kylin構建大數據分析平臺有一個感性認識。同時，本書從應用角度，結合Dome和實例介紹了用於多維分析的Cube算法的創建、配置與優化。最後還介紹了Kyligence公司發布KAP大數據分析平臺，對讀者有極大的參考價值。
本書適合大數據技術初學者、大數據分析人員、大數據架構師等，也適合用於高等院校和培訓學校相關專業師生教學參考。

<章節目錄>

第—部分Apache Kylin基礎部分
第1章Apache Kylin前世今生
1.1Apache Kylin的背景
1.2Apache Kylin的應用場景
1.3Apache Kylin的發展歷程
第2章Apache Kylin前奏
2.1事實表和維表
2.2星型模型和雪花型模型
2.2.1星型模型
2.2.2雪花型模型
2.2.3星型模型示例
2.3OLAP
2.3.1OLAP分類
2.3.2OLAP的基本操作
2.4數據立方體（Data Cube）
第3章Apache Kylin工作原理和體系架構
3.1 Kylin工作原理
3.2Kylin體系架構
3.3Kylin中的核心部分：Cube構建
3.4Kylin的SQL查詢
3.5Kylin的特性和生態圈
第4章搭建CDH大數據平臺
4.1系統環境和安裝包
4.1.1系統環境
4.1.2安裝包的下載
4.2準備工作：系統環境搭建
4.2.1網絡配置（CDH集群所有節點1
4.2.2打通SSH，設置ssh無密碼登錄（所有節點）
4.3正式安裝CDH：準備工作
4.4正式安裝CDH5：安裝配置
4.4.1CDH5的安裝配置
4.4.2對Hive、HBase執行簡單操作
第5章使用Kylin構建企業大數據分析平臺的4種部署方式
5.1Kylin部署的架構
5.2Kylin的四種典型部署方式
第6章單獨為Kylin部署HBase集群
第7章部署Kylin集群環境
7.1部署Kylin的先決條件
7.2部署Kylin集群環境
7.3為Kylin集群搭建負載均衡器
7.3.1搭建Nginx環境
7.3.2配置Nginx實現Kylin的負載均衡
第二部分Apache Kylin進階部分
第8章Demo案例實戰
8.1Sample Cube案例描述
8.2Sample Cube案例實戰
8.2.1準備數據
8.2.2構建Cube
第9章多維分析的Cube創建實戰
9.1Cube模型
9.2創建Cube的流程
9.2， 1步驟一：Hive中事實表，以及多張維表的處理
9.2.2步驟二：Kylin中建立項目（Project）
9.2.3步驟三：Kylin中建立數據源（Data Source）
9.2.4步驟四：Kylin中建立數據模型（Model）
9.2.5步驟五：Kylin中建立Cube
9.2.6步驟六：Build Cube
9.2.7步驟七：查詢Cube
第10章Build Cube的來龍去脈
10.1流程分析
10.2小結
第三部分Apache Kylin高級部分
第11章Cube優化
第12章備份Kylin的Metadata
12.1Kylin的元數據
12.2備份元數據
12.3恢復元數據
第13章使用Hive視圖
13.1使用Hive視圖
13.2使用視圖實戰
第14章Kylin的垃圾清理
14.1清理元數據
14.2清理存儲器數據
第15章JDBC訪問方式
第16章通過RESTful訪問Kylin
第17章Kylin版本之間升級
17.1從1.5.2升級到最新版本1.5.3
17.2從1.5.1升級到1.5.2版本
17.3從Kylin l.5.2.1升級到Kylin 1.5.3實戰
17.4補充內容
第18章大數據可視化實踐
18.1可視化工具簡述
18.2安裝Kylin ODBC驅動
18.3通過Excel訪問Kylin
18.4通過Power BI訪問Kylin
18.4.1安裝配置Power BI
18.4.2實戰操作
18.5通過Tableau訪問Kylin
18.6Kylin+Mondrian+Saiku
18.7實戰演練：通過Saiku訪問Kylin
18.7.1第一個Schema例子：myproject_pvuv_cube的演示
18.7.2第二個Schema例子：kylin_sales_cube的演示
18.7.3Saiku使用的一些問題
18.8通過Apache Zepplin訪問Kylin
18.9通過Kylin的“Insight”查詢
第19章使用Streaming Table構建準實時Cube
第20章快速數據立方算法
20.1快速數據立方算法概述
20.2快速數據立方算法優點和缺點
20.3獲取Fast Cubing算法的優勢
第四部分Apache Kylin的擴展部分
第21章大數據智能分析平臺KAP
21.1大數據智能分析平臺KAP概述
21.2KAP的安裝部署