原文:Flume-NG源碼閱讀之SpoolDirectorySource(原創)

org.apache.flume.source.SpoolDirectorySource是flume的一個常用的source,這個源支持從磁盤中某文件夾獲取文件數據。不同於其他異步源,這個源能夠避免重啟或者發送失敗后數據丟失。flume可以監控文件夾,當出現新文件時會讀取該文件並獲取數據。當一個給定的文件被全部讀入到通道中時,該文件會被重命名以標志已經完成。同時,該源需要一個清理進程來定期移除完 ...

2014-04-13 15:20 4 4495 推薦指數:

查看詳情

flume-ng源碼閱讀RollingFileSink(原創)

org.apache.flume.sink.RollingFileSink 這個類比較簡單。 source的種類有兩種:一種是PollableSource;另外一種是EventDrivenSource。前者“必須有它自己的callback機制,該機制用於捕獲新數據並將數據存儲到通道中 ...

Fri Apr 04 00:02:00 CST 2014 2 2143
Flume-NG源碼閱讀之Interceptor(原創)

  有的時候希望通過Flume將讀取的文件再細分存儲,比如講source的數據按照業務類型分開存儲,具體一點比如類似:將source中web、wap、media等的內容分開存儲;比如丟棄或修改一些數據。這時可以考慮使用攔截器Interceptor。   flume通過攔截器實現修改和丟棄事件 ...

Tue Apr 15 02:27:00 CST 2014 0 5437
flume-ng源碼閱讀memory-channel(原創)

org.apache.flume.channel.MemoryChannel類是Flume-NG的memory-channel。 private LinkedBlockingDeque<Event> queue;//mem-channel存放數據的地方 private ...

Wed Apr 02 00:30:00 CST 2014 3 2242
Flume-NG源碼閱讀之HBaseSink

  關於HBase的sink的所有內容均在org.apache.flume.sink.hbase包下。   每個sink包括自己定制的,都extends AbstractSink implements Configurable。   一、首先是configure(Context context ...

Mon May 05 03:01:00 CST 2014 0 2519
Flume-NG源碼閱讀之HDFSEventSink

  HDFSEventSink是flume中一個很重要的sink,配置文件中type=hdfs。與此sink相關的類都在org.apache.flume.sink.hdfs包中。   HDFSEventSink算是一個比較復雜的sink,包下涉及的源代碼文件數多達13個。。。可配置的參數 ...

Wed May 07 02:32:00 CST 2014 0 3627
Flume-NG啟動過程源碼分析(一)(原創)

  從bin/flume 這個shell腳本可以看到Flume的起始於org.apache.flume.node.Application類,這是flume的main函數所在。   main方法首先會先解析shell命令,如果指定的配置文件不存在就甩出異常。   根據命令中含有 ...

Thu Apr 17 03:09:00 CST 2014 3 3017
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM