花费 33 ms
Flume-NG之KafkaChannel

  apache下一个版本(1.6)将会带来一个新的组件KafKaChannel,顾名思义就是使用kafka做channel,当然在CDH5.3版本已经存在这个channel。   大伙知道,常用的 ...

Mon Mar 02 02:40:00 CST 2015 2 6224
Spark Streaming和Flume-NG对接实验

  Spark Streaming是一个新的实时计算的利器,而且还在快速的发展。它将输入流切分成一个个的DStream转换为RDD,从而可以使用Spark来处理。它直接支持多种数据源:Kafka, F ...

Fri Jul 25 03:26:00 CST 2014 2 6222
Flume-NG源码阅读之Interceptor(原创)

  有的时候希望通过Flume将读取的文件再细分存储,比如讲source的数据按照业务类型分开存储,具体一点比如类似:将source中web、wap、media等的内容分开存储;比如丢弃或修改一些数据 ...

Tue Apr 15 02:27:00 CST 2014 0 5437
Flume-NG源码阅读之SpoolDirectorySource(原创)

  org.apache.flume.source.SpoolDirectorySource是flume的一个常用的source,这个源支持从磁盘中某文件夹获取文件数据。不同于其他异步源,这个源能够避 ...

Sun Apr 13 23:20:00 CST 2014 4 4495
Flume-NG内置计数器(监控)源码级分析

  Flume的内置监控怎么整?这个问题有很多人问。目前了解到的信息是可以使用Cloudera Manager、Ganglia有图形的监控工具,以及从浏览器获取json串,或者自定义向其他监控系统汇报 ...

Wed Jul 16 06:11:00 CST 2014 0 4259
Flume-NG源码阅读之FileChannel

  FileChannel是flume一个非常重要的channel组件,非常常用。这个channel非常复杂,涉及的文件更多涉及三个包:org.apache.flume.channel.file、or ...

Mon May 19 01:59:00 CST 2014 2 3631
Flume-NG启动过程源码分析(一)(原创)

  从bin/flume 这个shell脚本可以看到Flume的起始于org.apache.flume.node.Application类,这是flume的main函数所在。   main方法首先会 ...

Thu Apr 17 03:09:00 CST 2014 3 3017
Flume-NG源码阅读之HDFSEventSink

  HDFSEventSink是flume中一个很重要的sink,配置文件中type=hdfs。与此sink相关的类都在org.apache.flume.sink.hdfs包中。   HDFSEve ...

Wed May 07 02:32:00 CST 2014 0 3627

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM