Kafka集群的Leader选举

　　　　原因：

　　　　　　1）节点数据完整性不同，如果完整数据为1万挑，如果不完整数据节点只有9000条数据，如果当选了Leader，数据就丢失了1000条，而导致数据不一致；

　　　　　　2）大数据文本比较慢；

　　　　ISR的作用：

　　　　　　1）保证所有副本数据的一致性；

　　　　　　2）数据写入的时候，告知所有的ISR都保存一份；

　　　　如何判断一个Leader速度比较快？

　　　　　　1）Controller：集群启动的时候会在Zookeeper中去注册一个controller，所有的ISR会去session文件中抢注为Leader；

　　　　Controller的作用：

　　　　　　1）管理所有的Broker，检查Broker的健康状态，节点剔除；

　　　　　　2）针对已经损坏的Broker，检查该Broker中有多少的Leader和Follwer；

　　　　　　3）重新分配之类的事情；

特殊情况：ISR中副本全部宕机

　　对于这种情况，Kafka会如何处理呢？

　　　　1）等待，当其中一个ISR好了，就选择为Leader；

　　　　2）ISR以外的Follower中选举，此情况是丢失数据　，生产不允许

　　每个副本的最后一个offset

　　保证消费者数据的一致性，消费者能见到的最大的offset，ISR队列中最小的LEO（所有副本中的最小LEO）

　　HW解决了两个问题：

　　　　1）消费一致性；

　　　　2）存储一致性（新的Leader从ISR中选举出来之后，其他的follower会将各自的log文件高于 HW的部分截掉，然后从新的Leader同步数据）

　　缺点：

　　　　只能保证副本之间的数据一致性，并不能保证数据不丢失或者不重复。

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 ZooKeeper集群与Leader选举 kafka leader选举机制原理【Kafka】Leader选举（broker /分区） Kafka-分区leader选举 Kafka topic中的partition的leader选举 zookeeper源码 — 二、集群启动—leader选举深入理解 ZK集群的Leader选举 kafka中对于zookeeper的理解和leader选举过程理解Zookeeper（七）：Zookeeper集群启动过程和Leader选举 Kafka中leader选举机制unclean.leader.election.enable作用