原文:关于Kafka Fetch Session的讨论

Kafka在 . . 版本引入了fetch session的概念,旨在降低 无效 FETCH请求对集群带宽资源的占用。故事的背景是这样的: 众所周知,Kafka的broker和consumer都会定期地向leader broker发送FETCH请求去获取数据。对于分区数很多的topic而言,待发送的FETCH请求就会很大,从而整体上增加网络带宽占用。即使这些分区没有任何新的数据到来,followe ...

2018-07-19 14:25 1 921 推荐指数:

查看详情

Kafka Fetch Session剖析

1.概述 最近有同学留言在使用Kafka的过程中遇到一些问题,比如在拉取的Topic中的数据时会抛出一些异常,今天笔者就为大家来分享一下KafkaFetch流程。 2.内容 2.1 背景 首先,我们来了解一下,Fetch Session的目标。Kafka在1.1.0以后的版本中优化 ...

Sun Jan 31 22:14:00 CST 2021 0 1604
关于Kafka配额的讨论(1)

Kafka自0.9.0.0版本引入了配额管理(quota management),旨在broker端对clients发送请求进行限流(throttling)。目前Kafka支持两大类配额管理: 网络带宽(network bandwidth)配额管理:定义带宽阈值来限制请求发送速率,阈值单位 ...

Wed Mar 21 00:28:00 CST 2018 0 2811
关于Kafka high watermark的讨论2

  之前写过一篇关于Kafka High watermark的文章,引起的讨论不少:有赞扬之声,但更多的是针对文中的内容被challenge,于是下定决心找个晚上熬夜再看了一遍,昨晚挑灯通读了一遍确实发现不少错误。鉴于此我决定再写一篇博客重新梳理一下最新版本中High watermark(下称HW ...

Tue Sep 04 22:47:00 CST 2018 9 1767
关于Kafka broker IO的讨论

  Apache Kafka是大量使用磁盘和页缓存(page cache)的,特别是对page cache的应用被视为是Kafka实现高吞吐量的重要因素之一。实际场景中用户调整page cache的手段并不太多,更多的还是通过管理好broker端的IO来间接影响page cache从而实现高吞吐量 ...

Sat Oct 27 20:19:00 CST 2018 4 1844
关于Kafka监控方案的讨论

之前在知乎上尝试过回答这个问题,后来问的人挺多,干脆在博客里面保存一下。 目前Kafka监控方案看似很多,然而并没有一个“大而全”的通用解决方案。各家框架也是各有千秋,以下是我了解到的一些内容: Kafka manager Github地址: https://github.com ...

Wed May 23 17:32:00 CST 2018 3 5226
关于Kafka幂等producer的讨论

  众所周知,Kafka 0.11.0.0版本正式支持精确一次处理语义(exactly once semantics,下称EOS)。Kafka的EOS主要体现在3个方面: 幂等producer:保证发送单个分区的消息只会发送一次,不会出现重复消息 事务(transaction):保证 ...

Tue Oct 24 06:20:00 CST 2017 2 5655
关于Kafka __consumer_offests的讨论

众所周知,__consumer__offsets是一个内部topic,对用户而言是透明的,除了它的数据文件以及偶尔在日志中出现这两点之外,用户一般是感觉不到这个topic的。不过我们的确知道它保存的是Kafka新版本consumer的位移信息。本文我们简单梳理一下这个内部topic(以1.0.0 ...

Sat Jan 20 00:05:00 CST 2018 0 7672
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM