Kafka 會不會丟消息？ - 碼上歡樂

相關內容簡體繁體

Kafka 會不會丟消息？

本文轉載自查看原文 2020-11-30 09:42 1954 NoSQL

一、認識 Kafka

Kafka 是分布式發布-訂閱消息系統。它最初由 LinkedIn 公司開發，之后成為 Apache 項目的一部分。

Kafka 是一個分布式的，可划分的，冗余備份的持久性的日志服務。它主要用於處理活躍的流式數據。

1. kafka 架構

Kafka 的整體架構非常簡單，是顯式分布式架構，主要由 producer、broker（kafka）和 consumer 組成。

Producer（生產者）可以將數據發布到所選擇的 topic（主題）中。生產者負責將記錄分配到 topic 的哪一個 partition（分區）中。可以使用循環的方式來簡單地實現負載均衡，也可以根據某些語義分區函數（如記錄中的key）來完成。

Consumer（消費者）使用一個consumer group（消費組）名稱來進行標識，發布到 topic 中的每條記錄被分配給訂閱消費組中的一個消費者實例。消費者實例可以分布在多個進程中或者多個機器上。

二、Kafka 到底會不會丟失消息？

在討論 kafka 是否丟消息前先來了解一下什么是消息傳遞語義。

message delivery semantic 也就是消息傳遞語義，簡單說就是消息傳遞過程中消息傳遞的保證性。主要分為三種：

at most once：最多一次。消息可能丟失也可能被處理，但最多只會被處理一次。
at least once：至少一次。消息不會丟失，但可能被處理多次。可能重復，不會丟失。
exactly once：精確傳遞一次。消息被處理且只會被處理一次。不丟失不重復就一次。

理想情況下肯定是希望系統的消息傳遞是嚴格 exactly once，也就是保證不丟失、只會被處理一次，但是很難做到。

回到主角 Kafka，Kafka 有三次消息傳遞的過程：

生產者發消息給 Kafka Broker。
Kafka Broker 消息同步和持久化
Kafka Broker 將消息傳遞給消費者。

在這三步中每一步都有可能會丟失消息，下面詳細分析為什么會丟消息，如何最大限度避免丟失消息。

三、生產者丟失消息

先介紹一下生產者發送消息的一般流程（部分流程與具體配置項強相關，這里先忽略）：

生產者是與 leader 直接交互，所以先從集群獲取 topic 對應分區的 leader 元數據；
獲取到 leader 分區元數據后直接將消息發給過去；
Kafka Broker 對應的 leader 分區收到消息后寫入文件持久化；
Follower 拉取 Leader 消息與 Leader 的數據保持一致；
Follower 消息拉取完畢需要給 Leader 回復 ACK 確認消息；
Kafka Leader 和 Follower 分區同步完，Leader 分區會給生產者回復 ACK 確認消息。

生產者采用 push 模式將數據發布到 broker，每條消息追加到分區中，順序寫入磁盤。消息寫入 Leader 后，Follower 是主動與 Leader 進行同步。

Kafka 消息發送有兩種方式：同步（sync）和異步（async），默認是同步方式，可通過 producer.type 屬性進行配置。

Kafka 通過配置 request.required.acks 屬性來確認 Producer 的消息：

0：表示不進行消息接收是否成功的確認；不能保證消息是否發送成功，生成環境基本不會用。
1：默認值，表示當 Leader 接收成功時確認；只要 Leader 存活就可以保證不丟失，保證了吞吐量。所以默認的 producer 級別是 at least once。
all：保證 leader 和 follower 不丟，但是如果網絡擁塞，沒有收到 ACK，會有重復發的問題。

如果 acks 配置為 0，發生網絡抖動消息丟了，生產者不校驗 ACK 自然就不知道丟了。

如果 acks 配置為 1 保證 leader 不丟，但是如果 leader 掛了，恰好選了一個沒有 ACK 的 follower，那也丟了。

如果 acks 配置為 all 保證 leader 和 follower 不丟，但是如果網絡擁塞，沒有收到 ACK，會有重復發的問題。

四、Kafka Broker 丟失消息

Kafka Broker 接收到數據后會將數據進行持久化存儲，你以為是下面這樣的：

沒想到是這樣的：

操作系統本身有一層緩存，叫做 Page Cache，當往磁盤文件寫入的時候，系統會先將數據流寫入緩存中，至於什么時候將緩存的數據寫入文件中是由操作系統自行決定。

Kafka 提供了一個參數 producer.type 來控制是不是主動 flush，如果 Kafka 寫入到 mmap 之后就立即 flush 然后再返回 Producer 叫同步 (sync)；寫入 mmap 之后立即返回 Producer 不調用 flush 叫異步 (async)。

Kafka 通過多分區多副本機制中已經能最大限度保證數據不會丟失，如果數據已經寫入系統 cache 中但是還沒來得及刷入磁盤，此時突然機器宕機或者掉電那就丟了，當然這種情況很極端。

五、消費者丟失消息

消費者通過 pull 模式主動的去 kafka 集群拉取消息，與 producer 相同的是，消費者在拉取消息的時候也是找 leader 分區去拉取。

多個消費者可以組成一個消費者組（consumer group），每個消費者組都有一個組id。同一個消費者組的消費者可以消費同一 topic 下不同分區的數據，但是不會出現多個消費者消費同一分區的數據。

消費者消費的進度通過 offset 保存在 kafka 集群的 __consumer_offsets 這個 topic 中。

消費消息的時候主要分為兩個階段：

標識消息已被消費，commit offset坐標；
處理消息。

先 commit 再處理消息。如果在處理消息的時候異常了，但是 offset 已經提交了，這條消息對於該消費者來說就是丟失了，再也不會消費到了。

先處理消息再 commit。如果在 commit 之前發生異常，下次還會消費到該消息，重復消費的問題可以通過業務保證消息冪等性來解決。

六、總結

那么問題來了，kafka到底會不會丟消息？答案是：會！

Kafka可能會在三個階段丟失消息：

生產者發送數據；
Kafka Broker 存儲數據；
消費者消費數據；

在生產環境中嚴格做到 exactly once 其實是難的，同時也會犧牲效率和吞吐量，最佳實踐是業務側做好補償機制，萬一出現消息丟失可以兜底。

原文鏈接：面試被問：Kafka 會不會丟消息？我是這么答的

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 kafka消息會不會丟失 kafka什么時候會丟消息（轉）刨根問底: Kafka 到底會不會丟數據？ Kafka 是如何做到消息不丟或不重復的 Kafka消息投遞語義-消息不丟失，不重復，不丟不重 Kafka 什么情況下會丟數據消息隊列中的問題| 丟消息| 重復消費| 消息積壓 Kafka丟數據、重復消費、順序消費的問題 RabbitMQ消息丟失問題和保證消息可靠性-消費端不丟消息和HA（二） Kafka 消息監控 - Kafka Eagle

粵ICP備18138465號 © 2018-2026 CODEPRJ.COM