【Kafka】Leader選舉（broker /分區）

本文轉載自查看原文 2021-05-13 08:18 211 java/ MQ/ kafka

broker的leader：

Kafka集群Leader選舉原理

我們知道Zookeeper集群中也有選舉機制，是通過Paxos算法，通過不同節點向其他節點發送信息來投票選舉出leader，但是Kafka的leader的選舉就沒有這么復雜了。
Kafka的Leader選舉是通過在zookeeper上創建/controller臨時節點來實現leader選舉，並在該節點中寫入當前broker的信息
{“version”:1,”brokerid”:1,”timestamp”:”1512018424988”}
利用Zookeeper的強一致性特性，一個節點只能被一個客戶端創建成功，創建成功的broker即為leader，即先到先得原則，leader也就是集群中的controller，負責集群中所有大小事務。
當leader和zookeeper失去連接時，臨時節點會刪除，而其他broker會監聽該節點的變化，當節點刪除時，其他broker會收到事件通知，重新發起leader選舉。

分區的leader：

Kafka的Leader是什么

首先Kafka會將接收到的消息分區（partition），每個主題（topic）的消息有不同的分區。這樣一方面消息的存儲就不會受到單一服務器存儲空間大小的限制，另一方面消息的處理也可以在多個服務器上並行。
其次為了保證高可用，每個分區都會有一定數量的副本（replica）。這樣如果有部分服務器不可用，副本所在的服務器就會接替上來，保證應用的持續性。

但是，為了保證較高的處理效率，消息的讀寫都是在固定的一個副本上完成。這個副本就是所謂的Leader，而其他副本則是Follower。而Follower則會定期地到Leader上同步數據。

Leader選舉

如果某個分區所在的服務器除了問題，不可用，kafka會從該分區的其他的副本中選擇一個作為新的Leader。之后所有的讀寫就會轉移到這個新的Leader上。現在的問題是應當選擇哪個作為新的Leader。顯然，只有那些跟Leader保持同步的Follower才應該被選作新的Leader。
Kafka會在Zookeeper上針對每個Topic維護一個稱為ISR（in-sync replica，已同步的副本）的集合，該集合中是一些分區的副本。只有當這些副本都跟Leader中的副本同步了之后，kafka才會認為消息已提交，並反饋給消息的生產者。如果這個集合有增減，kafka會更新zookeeper上的記錄。
如果某個分區的Leader不可用，Kafka就會從ISR集合中選擇一個副本作為新的Leader。
顯然通過ISR，kafka需要的冗余度較低，可以容忍的失敗數比較高。假設某個topic有f+1個副本，kafka可以容忍f個服務器不可用。

為什么不用少數服從多數的方法

少數服從多數是一種比較常見的一致性算法和Leader選舉法。

它的含義是只有超過半數的副本同步了，系統才會認為數據已同步；

選擇Leader時也是從超過半數的同步的副本中選擇。

這種算法需要較高的冗余度。

譬如只允許一台機器失敗，需要有三個副本；而如果只容忍兩台機器失敗，則需要五個副本。

而kafka的ISR集合方法，分別只需要兩個和三個副本。

如果所有的ISR副本都失敗了怎么辦？

此時有兩種方法可選，一種是等待ISR集合中的副本復活，一種是選擇任何一個立即可用的副本，而這個副本不一定是在ISR集合中。這兩種方法各有利弊，實際生產中按需選擇。
如果要等待ISR副本復活，雖然可以保證一致性，但可能需要很長時間。而如果選擇立即可用的副本，則很可能該副本並不一致。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Kafka-分區leader選舉 kafka備份機制——zk選舉leader，leader在broker里負責備份 Kafka集群篇-Leader選舉 kafka leader選舉機制原理 Kafka topic中的partition的leader選舉 kafka入門之broker-水印和leader epoch kafka分區及副本在broker的分配 kafka分區及副本在broker的分配 kafka中對於zookeeper的理解和leader選舉過程 Kafka中leader選舉機制unclean.leader.election.enable作用