【消息隊列】如何處理消息丟失的問題

本文轉載自查看原文 2019-03-10 21:23 4912 消息隊列（MQ）

一、RabbitMQ

1）生產者弄丟了數據

　　生產者將數據發送到rabbitmq的時候，可能因為網絡問題導致數據就在半路給搞丟了。

1.可以選擇用rabbitmq提供的事務功能，在生產者發送數據之前開啟rabbitmq事務（channel.txSelect），然后發送消息，如果消息沒有成功被rabbitmq接收到，那么生產者會收到異常報錯，此時就可以回滾事務（channel.txRollback），然后重試發送消息；如果收到了消息，那么可以提交事務（channel.txCommit）。但是問題是，開始rabbitmq事務機制，基本上吞吐量會下來，因為太耗性能。

2.（推薦）可以開啟confirm模式，在生產者那里設置開啟confirm模式之后，你每次寫的消息都會分配一個唯一的id，然后如果寫入了rabbitmq中，rabbitmq會給你回傳一個ack消息，告訴你說這個消息ok了。如果rabbitmq沒能處理這個消息，會回調你一個nack接口，告訴你這個消息接收失敗，你可以重試。而且你可以結合這個機制自己在內存里維護每個消息id的狀態，如果超過一定時間還沒接收到這個消息的回調，那么你可以重發。

　　事務機制和cnofirm機制最大的不同在於，事務機制是同步的，你提交一個事務之后會阻塞在那兒，但是confirm機制是異步的，你發送個消息之后就可以發送下一個消息，然后那個消息rabbitmq接收了之后會異步回調你一個接口通知你這個消息接收到了。

所以一般在生產者這塊避免數據丟失，都是用confirm機制的。

2）rabbitmq弄丟了數據

　　為了防止rabbitmq自己弄丟了數據，這個你必須開啟rabbitmq的持久化，就是消息寫入之后會持久化到磁盤，哪怕是rabbitmq自己掛了，恢復之后會自動讀取之前存儲的數據，一般數據不會丟。除非極其罕見的是，rabbitmq還沒持久化，自己就掛了，可能導致少量數據會丟失的，但是這個概率較小。

　　設置持久化有兩個步驟，第一個是創建queue的時候將其設置為持久化的，這樣就可以保證rabbitmq持久化queue的元數據，但是不會持久化queue里的數據；第二個是發送消息的時候將消息的deliveryMode設置為2，就是將消息設置為持久化的，此時rabbitmq就會將消息持久化到磁盤上去。必須要同時設置這兩個持久化才行，rabbitmq哪怕是掛了，再次重啟，也會從磁盤上重啟恢復queue，恢復這個queue里的數據。

　　而且持久化可以跟生產者那邊的confirm機制配合起來，只有消息被持久化到磁盤之后，才會通知生產者ack了，所以哪怕是在持久化到磁盤之前，rabbitmq掛了，數據丟了，生產者收不到ack，你也是可以自己重發的。

　　若生產者那邊的confirm機制未開啟的情況下，哪怕是你給rabbitmq開啟了持久化機制，也有一種可能，就是這個消息寫到了rabbitmq中，但是還沒來得及持久化到磁盤上，結果不巧，此時rabbitmq掛了，就會導致內存里的一點點數據會丟失。

3）消費端弄丟了數據

　　主要是因為你消費的時候，剛消費到，還沒處理，結果進程掛了，比如重啟了，那么就尷尬了，rabbitmq認為你都消費了，這數據就丟了。

　　這個時候得用rabbitmq提供的ack機制，簡單來說，就是你關閉rabbitmq自動ack，可以通過一個api來調用就行，然后每次你自己代碼里確保處理完的時候，再程序里ack一把。這樣的話，如果你還沒處理完，不就沒有ack？那rabbitmq就認為你還沒處理完，這個時候rabbitmq會把這個消費分配給別的consumer去處理，消息是不會丟的。

二、Kafka

1）消費者弄丟了數據

　　唯一可能導致消費者弄丟數據的情況，就是說，你那個消費到了這個消息，然后消費者那邊自動提交了offset，讓kafka以為你已經消費好了這個消息，其實你剛准備處理這個消息，你還沒處理，你自己就掛了，此時這條消息就丟咯。

　　大家都知道kafka會自動提交offset，那么只要關閉自動提交offset，在處理完之后自己手動提交offset，就可以保證數據不會丟。但是此時確實還是會重復消費，比如你剛處理完，還沒提交offset，結果自己掛了，此時肯定會重復消費一次，自己保證冪等性就好了。

2）Kafka弄丟了數據

　　比較常見的一個場景，就是kafka某個broker宕機，然后重新選舉partiton的leader時。大家想想，要是此時其他的follower剛好還有些數據沒有同步，結果此時leader掛了，然后選舉某個follower成leader之后，他不就少了一些數據？這就丟了一些數據啊。

所以此時一般是要求起碼設置如下4個參數：

1.給這個topic設置replication.factor參數：這個值必須大於1，要求每個partition必須有至少2個副本

2.在kafka服務端設置min.insync.replicas參數：這個值必須大於1，這個是要求一個leader至少感知到有至少一個follower還跟自己保持聯系，沒掉隊，這樣才能確保leader掛了還有一個follower吧

3.在producer端設置acks=all：這個是要求每條數據，必須是寫入所有replica之后，才能認為是寫成功了

4.在producer端設置retries=MAX（很大很大很大的一個值，無限次重試的意思）：這個是要求一旦寫入失敗，就無限重試，卡在這里了

　　生產環境就按照上述要求配置的，這樣配置之后，至少在kafka broker端就可以保證在leader所在broker發生故障，進行leader切換時，數據不會丟失

3）生產者弄丟了數據

　　按照上述的思路設置了ack=all，一定不會丟，要求是，你的leader接收到消息，所有的follower都同步到了消息之后，才認為本次寫成功了。如果沒滿足這個條件，生產者會自動不斷的重試，重試無限次。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【消息隊列】如何處理消息丟失的問題消息隊列 - 關於消息隊列的消息丟失問題的一點思考如何處理RabbitMQ 消息堆積和消息丟失問題消息隊列面試連環問：如何保證消息不丟失？處理重復消息？消息有序性？消息堆積處理？如何保證消息的可靠性傳輸（如何處理消息丟失的問題）消息隊列MQ如何保證消息不丟失消息隊列核心-如何保證消息不丟失消息隊列如何處理重復消息 rabbitmq（四）、消息丟失問題關於消息隊列MQ的常見的問題以及處理