原文:Flume-NG中的Channel与Transaction关系(原创)

在sink和source中 不管是内置还是自定义的 ,基本都有如下代码,这些代码在sink中的process方法中,而在source中自己不需要去写,在source中getChannelProcessor .processEventBatch events 方法中会自动创建下面类似的: 那么有些人就要问了 从上述代码中似乎只需要获取channel就可以了,因为获取数据时只需要event chan ...

2014-04-21 22:31 0 2438 推荐指数:

查看详情

flume-ng源码阅读memory-channel(原创)

org.apache.flume.channel.MemoryChannel类是Flume-NG的memory-channel。 private LinkedBlockingDeque<Event> queue;//mem-channel存放数据的地方 private ...

Wed Apr 02 00:30:00 CST 2014 3 2242
flume-ng源码阅读RollingFileSink(原创)

org.apache.flume.sink.RollingFileSink 这个类比较简单。 source的种类有两种:一种是PollableSource;另外一种是EventDrivenSource。前者“必须有它自己的callback机制,该机制用于捕获新数据并将数据存储到通道 ...

Fri Apr 04 00:02:00 CST 2014 2 2143
Flume-NG源码阅读之Interceptor(原创)

  有的时候希望通过Flume将读取的文件再细分存储,比如讲source的数据按照业务类型分开存储,具体一点比如类似:将sourceweb、wap、media等的内容分开存储;比如丢弃或修改一些数据。这时可以考虑使用拦截器Interceptor。   flume通过拦截器实现修改和丢弃事件 ...

Tue Apr 15 02:27:00 CST 2014 0 5437
Flume-NG源码阅读之SpoolDirectorySource(原创)

  org.apache.flume.source.SpoolDirectorySource是flume的一个常用的source,这个源支持从磁盘某文件夹获取文件数据。不同于其他异步源,这个源能够避免重启或者发送失败后数据丢失。flume可以监控文件夹,当出现新文件时会读取该文件并获取数据 ...

Sun Apr 13 23:20:00 CST 2014 4 4495
Flume-NG之KafkaChannel

是速度最快,容易配置;缺点是,可靠性最差,因为一旦flume进程挂了内存还未出来的数据也就没了;   ...

Mon Mar 02 02:40:00 CST 2015 2 6224
Flume-NG启动过程源码分析(一)(原创)

  从bin/flume 这个shell脚本可以看到Flume的起始于org.apache.flume.node.Application类,这是flume的main函数所在。   main方法首先会先解析shell命令,如果指定的配置文件不存在就甩出异常。   根据命令中含有 ...

Thu Apr 17 03:09:00 CST 2014 3 3017
Flume-NG启动过程源码分析(三)(原创)

  上一篇文章分析了Flume如何加载配置文件的,动态加载也只是重复运行getConfiguration()。   本篇分析加载配置文件后各个组件是如何运行的?   加载完配置文件订阅者Application类会收到订阅信息执行 ...

Wed Apr 30 01:26:00 CST 2014 1 2140
Flume-NG源码阅读之FileChannel

  FileChannel是flume一个非常重要的channel组件,非常常用。这个channel非常复杂,涉及的文件更多涉及三个包:org.apache.flume.channel.file、org.apache.flume.channel.file.encryption(加密 ...

Mon May 19 01:59:00 CST 2014 2 3631
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM