原文:关于kafka重新消费数据问题

我们在使用consumer消费数据时,有些情况下我们需要对已经消费过的数据进行重新消费,这里介绍kafka中两种重新消费数据的方法。 .修改offset 我们在使用consumer消费的时候,每个topic会产生一个偏移量,这个偏移量保证我们消费的消息顺序且不重复。Offest是在zookeeper中存储的,我们可以设置consumer实时或定时的注册offset到zookeeper中。我们修改这 ...

2017-08-21 23:50 0 4585 推荐指数:

查看详情

SparkStreaming消费Kafka数据限速问题

SparkStreaming消费Kafka数据的时候,当有大量初始化数据时会拖累整个streaming程序的运行,问有什么办法? 总体来说这个问题大概有两种解决思路: 1.在Spark端设置限速;2.在Kafka端设置限速。 Spark端限速的方法知乎上已有很多帖子说过了,主要的思路是设置 ...

Mon Apr 22 19:43:00 CST 2019 0 1269
Kafka数据、重复消费、顺序消费问题

面试官:今天我想问下,你觉得Kafka会丢数据吗? 候选者:嗯,使用Kafka时,有可能会有以下场景会丢消息 候选者:比如说,我们用Producer发消息至Broker的时候,就有可能会丢消息 候选者:如果你不想丢消息,那在发送消息的时候,需要选择带有 callBack的api进行发送 ...

Tue Aug 24 00:05:00 CST 2021 2 317
python消费kafka数据

python消费kafka数据 有两个模块都可以使用消费kafka数据 注意kafka会将hosts转换成域名的形式,注意要将hosts及域名配置到docker和主机的/etc/hosts文件中 一、kafka模块 支持版本: 二、pykafka ...

Wed Sep 15 01:19:00 CST 2021 0 283
Doris消费Kafka数据

1、查看load task 2、暂停一个load Task 3、删除一个 4、查看日志,一定要查看be.INFO 表示不知道kafka地址 5、错误信息 表示分区信息获取不到 6、查看routine 建立信息 ...

Fri Apr 30 23:50:00 CST 2021 3 622
kafka数据如何被重复消费

近段时间学习极客时间李玥老师的后端存储实战课时,看到一个很多意思的东西:用kafka存储点击流的数据,并重复处理。在以往的使用中,kafka只是一个消息传输的载体,消息被消费后就不能再次消费。新知识与印象相冲突,于是就有了本篇文章:kafka数据如何被重复消费。 前期理论了解 首先我先去官网 ...

Mon Sep 14 07:09:00 CST 2020 0 1055
kafka从头消费数据

从头消费数据需满足两个条件: 1. groupid为新的 2. auto_offset_reset_config的值为earliest Properties p = new Properties(); p.put ...

Thu Mar 26 06:32:00 CST 2020 0 1536
kafka查看消费数据

一、如何查看 在老版本中,使用kafka-run-class.sh 脚本进行查看。但是对于最新版本,kafka-run-class.sh 已经不能使用,必须使用另外一个脚本才行,它就是kafka-consumer-groups.sh 普通版 查看所有组 要想查询消费数据,必须要指定组 ...

Mon Dec 31 01:11:00 CST 2018 2 4633
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM