原文:Storm Spout

本文主要介绍了Storm Spout,并以KafkaSpout为例,进行了说明。 概念 数据源 Spout 是拓扑中数据流的来源。一般 Spout 会从一个外部的数据源读取元组然后将他们发送到拓扑中。根据需求的不同,Spout 既可以定义为可靠的数据源,也可以定义为不可靠的数据源。一个可靠的 Spout 能够在它发送的元组处理失败时重新发送该元组,以确保所有的元组都能得到正确的处理 相对应的,不可 ...

2017-07-12 17:18 0 1738 推荐指数:

查看详情

Storm-源码分析- spout (backtype.storm.spout)

1. ISpout接口 ISpout作为实现spout的核心interface, spout负责feeding message, 并且track这些message. 如果需要Spout track发出的message, 必须给出message-id, 这个message-id可以是任意类型 ...

Thu Aug 01 23:31:00 CST 2013 0 2890
storm spout的速度抑制问题

转发请注明原文地址:http://www.cnblogs.com/dongxiao-yang/p/6031398.html 最近协助同事优化一个并发消费kafka数据用来计算的任务,压测过程中发现有两个spout对应的topic消费速度明显低于其他topic的指标,每个spout分配10 ...

Sat Nov 05 02:32:00 CST 2016 0 3360
storm的数据源编程单元Spout学习整理

Spout呢,是Topology中数据流的源头,也是Storm针对数据源的编程单元。一般数据的来源,是通过外部数据源来读取数据项(Tuple),并读取的数据项传输至作业的其他组件。编程人员一般可通过OutputFieldsDeclarer类的declareStream()方法来声明多个流,指定 ...

Wed Jan 13 06:56:00 CST 2016 0 2653
Storm的Toplogy中设置多数据源Spout

上代码:主要看main方法中的设置. 如下代码是一般情况下的设置方法...Trident中设置多数据源看对应的博客总结 ...

Fri Apr 07 07:13:00 CST 2017 0 3250
StormSpout使用注意事项小结

StormSpout用于读取并向计算拓扑中发送数据源,最近在调试一个topology时遇到了系统qps低,处理速度达不到要求的问题,经过排查后发现是由于对Spout的使用模式不当导致的多线程同步等待。这里罗列几点个人觉得编写Spout代码时需要特别注意的地方: 1. 最常用的模式是使用一个线程 ...

Wed May 28 00:05:00 CST 2014 1 22577
spout详解

spout放在每个executer执行,我们先从spoutExecutors的初始化开始往下看,spoutExecutors是在一个worker中管理其中的tasks,在SpoutExecutors的构造函数中初始化一些组件:taskId,topologyId,spout等,在这个线程中 ...

Tue May 31 18:08:00 CST 2016 0 1656
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM