HAWQ數據倉庫與數據挖掘實戰 HAWQ数据仓库与数据挖掘实战

王雪迎

  • 出版商: 清華大學
  • 出版日期: 2018-03-17
  • 定價: $588
  • 售價: 8.5$500
  • 語言: 簡體中文
  • 頁數: 578
  • 裝訂: 平裝
  • ISBN: 7302498024
  • ISBN-13: 9787302498025
  • 相關分類: Hadoop大數據 Big-data
  • 立即出貨 (庫存 < 3)

相關主題

商品描述

Apache HAWQ是一個SQL-on-Hadoop產品,它非常適合用於Hadoop平臺上快速構建數據倉庫系統。HAWQ具有大規模並行處理、完善的SQL兼容性、支持存儲過程和事務、出色的性能表現等特性,還可與開源數據挖掘庫MADlib輕松整合,從而使用SQL就能進行數據挖掘與機器學習。
《HAWQ數據倉庫與數據挖掘實戰》內容分技術解析、實戰演練與數據挖掘三個部分共27章。技術解析部分說明HAWQ的基礎架構與功能特性,包括安裝、連接、對象與資源管理、查詢優化、備份恢復、高可用性等。實戰演練部分用一個完整的示例,說明如何使用HAWQ取代傳統數據倉庫,包括ETL處理、自動調度系統、維度表與事實表技術、OLAP與數據的圖形化表示等。數據挖掘部分用實例說明HAWQ與MADlib整合,實現降維、協同過濾、關聯規則、回歸、聚類、分類等常見數據挖掘與機器學習方法。
《HAWQ數據倉庫與數據挖掘實戰》適合數據庫管理員、大數據技術人員、Hadoop技術人員、數據倉庫技術人員,也適合高等院校和培訓機構相關專業的師生教學參考。

海報: