RocketMQ系列:FAQ之dledger4.7.1集群問題


前言

公司的項目里面使用了rocketmq,開發建議使用rocketmq的最新版本4.7.1,並采用dledger模式部署。但是我在部署測試dledger模式的時候遇到了一個坑,在這里分享一下,避免大家重復踩坑。

環境

如圖是我搭建的rocketmq的dledger集群,集群為兩分片:broker-a和broker-b,每個dledger集群中有三個節點(1個leader和2個follower) 

 

 

問題 

在測試過程中,我需要模擬broker機器斷網來測試rocketmq的高可用:在同時生產和消費的過程中,使用iptables命令讓broker-b集群中的master機器斷網(即無法和外部通信),然后過一段再讓broker-b的master機器聯網。

這時候突然發現broker-b中有3個slave,正常應該如broker-a所示(一個leader+兩個follower)

排查原因

查看broker-b集群上的日志store.log,發現內部在一直同步offset,應該是在斷網期間出現了本地文件不一致的問題。

而集群內部日志來看,一直在進行選舉主節點,看來是在這里發生了某種死循環,無法選主。

 再查看dledger的版本:vim rocketmq/store/pom.xml。這里用的是0.1,一般0.1版本都是初次發行版本,所以問題肯定比較多,經過咨詢確實是dledger0.1的某些未知bug。

 

建議:如果非要使用dledger模式,建議使用0.1以上版本,或者等rocketmq的新的發行版出來再使用,否存在高可用的一些風險。

博主:測試生財(一個不為996而996的測開碼農)

座右銘:專注測試開發與自動化運維,努力讀書思考寫作,為內卷的人生奠定財務自由。

內容范疇:技術提升,職場雜談,事業發展,閱讀寫作,投資理財,健康人生。

csdn:https://blog.csdn.net/ccgshigao

博客園:https://www.cnblogs.com/qa-freeroad/

51cto:https://blog.51cto.com/14900374

微信公眾號:測試生財(定期分享獨家內容和資源)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM