Flume(構建高可用可擴展的海量日誌採集系統) Flume:构建高可用、可扩展的海量日志采集系统
哈里·史瑞德哈倫 (Hari Shreedharan)
- 出版商: 電子工業
- 出版日期: 2015-08-01
- 定價: $414
- 售價: 8.5 折 $352
- 語言: 簡體中文
- 頁數: 232
- 裝訂: 平裝
- ISBN: 7121265583
- ISBN-13: 9787121265587
-
相關分類:
大數據 Big-data
下單後立即進貨 (約4週~6週)
買這商品的人也買了...
-
$1,250$1,225 -
$550$468 -
$650$553 -
$520$442 -
$650$585 -
$450$356 -
$490$417 -
$1,617Computer Organization and Design: The Hardware/Software Interface, 5/e (Asian Edition)(IE-Paperback)
-
$250Hadoop 集群與安全
-
$590$590 -
$980$774 -
$480$408 -
$654$621 -
$540$459 -
$750$675 -
$650$514 -
$680$537 -
$580$458 -
$620$558 -
$650$585 -
$620$527 -
$520$411 -
$580$452 -
$380$300 -
$980$774
相關主題
商品描述
<內容簡介>
史瑞德哈倫著的《Flume》從Flume的基本概念和設計原理開始講解,分別介紹了不同種類的組件、如何配置組件、如何運行Flume Agent等。同時,分別討論Source、Channel和Sink三種核心組件,不僅僅闡述每個組件的基本概念,而且結合實際的編程案例,深入、全面地介紹每個組件的詳細用法,並且這部分內容也是整個Flume框架的重中之重。之後,講解攔截器、Channel選擇器、Sink組和Sink處理器等內容,它們為Flume提供靈活的擴展支持。最後,介紹了Flume的高級使用,如何使用Flume軟件開發工具集(SDK)和Embedded Agent API,如何設計、部署和監控Flume生產集群。
總而言之,本書是一本理論結合實戰,深度、廣度兼備的海量日誌採集系統的著作。
<章節目錄>
譯者序
序
前言
第1章 認識Apache Hadoop和Apache HBase
分佈式文件系統HDFS
HDFS的數據格式
處理HDFS中的數據
Apache HBase
總結
參考文獻
第2章 用Apache Flume處理流數據
我們需要Flume
F1ume是否適合呢?
Flume Agent內部原理
配置Flume Agent
Flume Agent之間的相互通信
複雜的流
複製數據到不同目的地
動態路由
Flume的無數據丟失保證,Channel和事務
Flume Channel中的事務
Agent失敗和數據丟失
批量的重要性
重複怎麼樣?
運行Flume Agent
總結
參考文獻
第3章 源(Source)
Source的生命周期
Sink-to-Source通信
Avro Source
Thrift Source
RPC Sources的失敗處理
HTTP Source
針對HTTP Source寫處理程序*
Spooling Directory Source
使用Deserializers讀取自定義格式*
Spooling Directory Source性能
Syslog Source
Exec Source
JMS Source
轉換JMS消息為Flume事件*
編寫自定義Source*
Event-Driven Source和Pollable Source
總結
參考文獻
第4章 Channel
事務工作流
F1ume自帶的Channel
Memory Channel
File Channel
總結
參考文獻
第5章 Sink
Sink的生命周期
優化Sink的性能
寫入到HDFS:HDFS Sink
理解Bucket
配置HDFS Sink
使用序列化器控制數據格式*
HBase Sink
用序列化器將Flume事件轉換成HBase Put和Increment*
RPC Sink
Avro Sink
Thrift Sink
Morphline Solr Sink
Elastic Search Sink
自定義數據格式*
其他Sink:Null Sink、Rolling File Sink和Logger Sink
編寫自定義Sink*
總結
參考文獻
第6章 攔截器、Channel選擇器、Sink組和Sink處理器
攔截器
時間戳攔截器
主機攔截器
靜態攔截器
正則過濾攔截器
Morphline攔截器
UUID攔截器
編寫攔截器
Channel選擇器
複製Channel選擇器
多路復用Channel選擇器
自定義Channel選擇器
Sink組和Sink處理器
Load-Balancing Sink處理器
Failover Sink處理器
總結
參考文獻
第7章 發送數據到Flume
構建Flume事件
Flume客戶端SDK
創建Flume RPC客戶端
RPC客戶端接口
所有RPC客戶端的公共配置參數
默認RPC客戶端
Load-Balancing RPC客戶端
Failover RPC客戶端
Thrift RPC客戶端
嵌入式Agent
配置嵌入式Agent
log4j Appender
Load-Balancing log4j Appender
總結
參考文獻
第8章 規劃、部署和監控Flume
規劃一個Flume部署
修復時間
我的Flume Channel需要多少容量?
多少層?
通過跨數據中心鏈接發送數據
層分片
部署Flume
部署自定義代碼
監控Flume
從自定義組件報告度量
總結
參考文獻
索引