KAFKA分区选择策略

本文转载自查看原文 2019-08-15 09:40 823 kafka/ KAFKA/ 分区选择策略

kafka producer 发送消息的时候，可以指定 key，这个 key 的作用是为消息选择存储分区

当指定 key 且不为空的时候，kafka 是根据 key 的 hash 值与分区数取模来决定数据存储到那个分区
当 key=null 时，kafka 是先从缓存中取分区号，然后判断缓存的值是否为空，如果不为空，就将消息存到这个分区，否则重新计算要存储的分区，并将分区号缓存起来，供下次使用
kafka 定义了一个全局变量，这个变量值是配置参数中的topic.metadata.refresh.interval.ms 设置的值，也就是说在这个时间内，key=null 的消息都会往缓存起来的这个分区存储，当时缓存过时之后，就会重新计算分区号，将计算结果缓存起来。也就是说在key为null的情况下，Kafka并不是每条消息都随机选择一Partition；而是每隔 topic.metadata.refresh.interval.ms 才会随机选择一次！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 kafka分区策略初识kafka 之分区策略 kafka选择分区的原则： kafka分区分配策略 Kafka 生产者分区策略 kafka的分区分配策略 Kafka生产者与分区策略 kafka数据分区的四种策略 kafka消费组消费者分区策略【Kafka】自定义分区策略