2.RocketMQ由哪些角色組成,每個角色作用和特點是什么?
RocketMQ從消費發送到消費的執行流程
- Producer發送消息到Broker,負載均衡策略默認隨機
- Broker接收消息,寫入PageCage,返回成功
- Broker刷盤,消息存儲Consumer queue、commit log
- Consumer從Broker拉取消息,拉取方式長輪詢pull
- Consumer消費消息,處理業務邏輯
- Consumer返回ACK,更新Broker offset
- 消費失敗,消息轉入失敗隊列
- Broker的ScheduleService從重試隊列拉取消息,重放這個消息
- 重試16次如果還是失敗,消息進入死信隊列
- 通過RocketMQ操作面板監控死信隊列,手動處理
3.RocketMQ Broker中的消息被消費后會立即刪除嗎?
不會,每條消息都會持久化到CommitLog中,每個consumer連接到broker后會維持消費進度信息,當有消息消費后只是當前consumer的消費進度(CommitLog的offset)更新了。
那么消息會堆積嗎?什么時候清理過期消息?
4.6版本默認48小時后會刪除不再使用的CommitLog文件。
- 檢查這個文件最后訪問時間
- 判斷是否大於過期時間
- 指定時間刪除,默認凌晨4點
RocketMQ消費模式有幾種?
消費模型由consumer決定,消費維度為Topic
集群消費,廣播消費
集群消費: 一組consumer同時消費一個topic,可以分配消費負載均衡策略分配consumer對應消費topic下的哪些queue
多個group同時消費一個topic時,每個group都會消費到數據
一條消息只會被一個group中的consumer消費,
廣播消費: 消息將對一 個Consumer Group 下的各個 Consumer 實例都消費一遍。即使這些 Consumer 屬於同一個Consumer Group ,消息也會被 Consumer Group 中的每個 Consumer 都消費一次。
順序消息缺陷
發送順序消息無法利用集群Fail Over特性消費順序消息的並行度依賴於隊列數量隊列熱點問題,個別隊列由於哈希不均導致消息過多,消費速度跟不上,產生消息堆積問題遇到消息失敗的消息,無法跳過,當前隊列消費暫停。
消費消息時使用的是push還是pull?
在剛開始的時候就要決定使用哪種方式消費。兩種(都實現了MQConsumerInner接口):
`DefaultLitePullConsumerImpl` 拉
`DefaultMQPushConsumerImpl`推
名稱上看起來是一個推,一個拉,但實際底層實現都是采用的**長輪詢機制**,即拉取方式broker端屬性 longPollingEnable 標記是否開啟長輪詢。默認開啟。
為什么要主動拉取消息而不使用事件監聽方式?
事件驅動方式是建立好長連接,由事件(發送數據)的方式來實時推送。
如果broker主動推送消息的話有可能push速度快,消費速度慢的情況,那么就會造成消息在consumer端堆積過多,同時又不能被其他consumer消費的情況。
NameServer實現原理:
NameServer是一個非常簡單的Topic路由注冊中心,其角色類似Dubbo中的zookeeper,支持Broker的動態注冊與發現。主要包括兩個功能
Broker管理,NameServer接受Broker集群的注冊信息並且保存下來作為路由信息的基本數據。然后提供心跳檢測機制,檢查Broker是否還存活;
路由信息管理,每個NameServer將保存關於Broker集群的整個路由信息和用於客戶端查詢的隊列信息。然后Producer和Conumser通過NameServer就可以知道整個Broker集群的路由信息,從而進行消息的投遞和消費
NameServer通常也是集群的方式部署,各實例間相互不進行信息通訊。Broker是向每一台NameServer注冊自己的路由信息,所以每一個NameServer實例上面都保存一份完整的路由信息。當某個NameServer因某種原因下線了,Broker仍然可以向其它NameServer同步其路由信息,Producer,Consumer仍然可以動態感知Broker的路由的信息
NameServer實例之間互不通信,這本身也是其設計亮點之一,即允許不同NameServer之間數據不同步(像Zookeeper那樣保證各節點數據強一致性會帶來額外的性能消耗)
RocketMQ集群模式:
單Master模式:只有一個 Master節點
優點:配置簡單,方便部署
缺點:這種方式風險較大,一旦Broker重啟或者宕機時,會導致整個服務不可用,不建議線上環境使用
多Master模式: 一個集群無 Slave,全是 Master,例如 2 個 Master 或者 3 個 Master
優點:配置簡單,單個Master 宕機或重啟維護對應用無影響,在磁盤配置為RAID10 時,即使機器宕機不可恢復情況下,由與 RAID10磁盤非常可靠,消息也不會丟(異步刷盤丟失少量消息,同步刷盤一條不丟)。性能最高。多 Master 多 Slave 模式,異步復制
缺點:單台機器宕機期間,這台機器上未被消費的消息在機器恢復之前不可訂閱,消息實時性會受到受到影響
多Master多Slave模式(異步復制):每個 Master 配置一個 Slave,有多對Master-Slave, HA,采用異步復制方式,主備有短暫消息延遲,毫秒級。
優點:即使磁盤損壞,消息丟失的非常少,且消息實時性不會受影響,因為Master 宕機后,消費者仍然可以從 Slave消費,此過程對應用透明。不需要人工干預。性能同多 Master 模式幾乎一樣。
缺點: Master 宕機,磁盤損壞情況,會丟失少量消息。
多Master多Slave模式(同步雙寫):每個 Master 配置一個 Slave,有多對Master-Slave, HA采用同步雙寫方式,主備都寫成功,向應用返回成功。
優點:數據與服務都無單點, Master宕機情況下,消息無延遲,服務可用性與數據可用性都非常高
缺點:性能比異步復制模式略低,大約低 10%左右,發送單個消息的 RT會略高。目前主宕機后,備機不能自動切換為主機。
broker如何處理拉取請求的?
consumer首次請求broker,broker中是否有符合條件的消息
有 -> 響應consumer,等待下次consumer的請求
沒有->掛起consumer的請求,即不斷開連接,也不返回數據
掛起時間長短,長輪詢寫死,短輪詢可以配
使用consumer的offset,DefaultMessageStore#ReputMessageService#run方法:每隔1ms檢查commitLog中是否有新消息,有的話寫入到pullRequestTable,當有新消息的時候返回請求,PullRequestHoldService 來Hold連接,每個5s執行一次檢查pullRequestTable有沒有消息,有的話立即推送。
RocketMQ如何做負載均衡?
通過Topic在多broker種分布式存儲實現。
producer端
發送端指定Target message queue發送消息到相應的broker,來達到寫入時的負載均衡
- 提升寫入吞吐量,當多個producer同時向一個broker寫入數據的時候,性能會下降
- 消息分布在多broker種,為負載消費做准備
每 30 秒從 nameserver獲取 Topic 跟 Broker 的映射關系,近實時獲取最新數據存儲單元,queue落地在哪個broker中
在使用api中send方法的時候,可以指定Target message queue寫入或者使用MessageQueueSelector
默認策略是隨機選擇:
- producer維護一個index
- 每次取節點會自增
- index向所有broker個數取余
- 自帶容錯策略
consumer端
客戶端完成負載均衡
- 獲取集群其他節點
- 當前節點消費哪些queue
- **負載粒度直到Message Queue**
- **consumer的數量最好和Message Queue的數量對等或者是倍數,不然可能會有消費傾斜**
- 每個consumer通過**balanced**維護processQueueTable
- processQueueTable為當前consumer的消費queue
- processQueueTable中有
- ProcessQueue :維護消費進度,從broker中拉取回來的消息緩沖
- MessageQueue : 用來定位查找queue
負載均衡算法
平均分配策略(默認)(AllocateMessageQueueAveragely)
環形分配策略(AllocateMessageQueueAveragelyByCircle)
手動配置分配策略(AllocateMessageQueueByConfig)
機房分配策略(AllocateMessageQueueByMachineRoom)
一致性哈希分配策略(AllocateMessageQueueConsistentHash)
靠近機房策略(AllocateMachineRoomNearby)
MQ與DB一致性原理(兩方事務):
- 一個topic分布在多個broker上,一個broker可以配置多個topic,它們是多對多的關系。
- 如果某個topic消息量很大,應該給它多配置幾個隊列,並且盡量多分布在不同broker上,減輕某個broker的壓力。
- topic消息量都比較均勻的情況下,如果某個broker上的隊列越多,則該broker壓力越大。
RocketMQ如何做負載均衡
Topic在Broker集群中分布式存儲
Producer端:輪詢
Consumer端:平均分配策略,一個隊列最多被一個消費組的一個Consumer消費,一個Consumer可以消費多個隊列
重復消費的原因
- Consumer消費完,宕機,未返回ACK
- Consumer消費完,返回ACK,網絡斷開,Broker未收到
- 主Broker更新ACK,副Broker未復制,主Broker宕機
消息被重復消費,如何保證(也就是說,在某個consumser已經消費過了,由於網絡波動或者其他原因導致的消息重復被消費)?
broker與nameserver關系
- 連接
- 單個broker和所有nameserver保持長連接
- 心跳
- 心跳間隔:每隔30秒(此時間無法更改)向所有nameserver發送心跳,心跳包含了自身的topic配置信息。
- 心跳超時:nameserver每隔10秒鍾(此時間無法更改),掃描所有還存活的broker連接,若某個連接2分鍾內(當前時間與最后更新時間差值超過2分鍾,此時間無法更改)沒有發送心跳數據,則斷開連接。
- 斷開
- 時機:broker掛掉;心跳超時導致nameserver主動關閉連接
- 動作:一旦連接斷開,nameserver會立即感知,更新topc與隊列的對應關系,但不會通知生產者和消費者
- 一旦某個broker master宕機,生產者和消費者多久才能發現?受限於rocketmq的網絡連接機制,默認情況下,最多需要30秒,但這個時間可由應用設定參數來縮短時間。這個時間段內,發往該broker的消息都是失敗的,而且該broker的消息無法消費,因為此時消費者不知道該broker已經掛掉。
- 消費者得到master宕機通知后,轉向slave消費(重定向,對於2次開發者透明),但是slave不能保證master的消息100%都同步過來了,因此會有少量的消息丟失。但是消息最終不會丟的,一旦master恢復,未同步過去的消息會被消費掉。
- 所有發往broker的消息,有同步刷盤和異步刷盤機制,總的來說,可靠性非常高
- 同步刷盤時,消息寫入物理文件才會返回成功,因此非常可靠
- 異步刷盤時,只有機器宕機,才會產生消息丟失,broker掛掉可能會發生,但是機器宕機崩潰是很少發生的,除非突然斷電
- 掃描間隔
- 默認10秒,由broker配置參數cleanResourceInterval決定
- 空間閾值
- 物理文件不能無限制的一直存儲在磁盤,當磁盤空間達到閾值時,不再接受消息,broker打印出日志,消息發送失敗,閾值為固定值85%
- 清理時機
- 默認每天凌晨4點,由broker配置參數deleteWhen決定;或者磁盤空間達到閾值
- 文件保留時長
- 默認72小時,由broker配置參數fileReservedTime決定
- 連接
- 單個消費者和一台nameserver保持長連接,定時查詢topic配置信息,如果該nameserver掛掉,消費者會自動連接下一個nameserver,直到有可用連接為止,並能自動重連。
- 心跳
- 與nameserver沒有心跳
- 輪詢時間
- 默認情況下,消費者每隔30秒從nameserver獲取所有topic的最新隊列情況,這意味着某個broker如果宕機,客戶端最多要30秒才能感知。該時間由DefaultMQPushConsumer的pollNameServerInteval參數決定,可手動配置。
- 連接
- 單個消費者和該消費者關聯的所有broker保持長連接。
- 心跳
- 默認情況下,消費者每隔30秒向所有broker發送心跳,該時間由DefaultMQPushConsumer的heartbeatBrokerInterval參數決定,可手動配置。broker每隔10秒鍾(此時間無法更改),掃描所有還存活的連接,若某個連接2分鍾內(當前時間與最后更新時間差值超過2分鍾,此時間無法更改)沒有發送心跳數據,則關閉連接,並向該消費者分組的所有消費者發出通知,分組內消費者重新分配隊列繼續消費
- 斷開
- 時機:消費者掛掉;心跳超時導致broker主動關閉連接
- 動作:一旦連接斷開,broker會立即感知到,並向該消費者分組的所有消費者發出通知,分組內消費者重新分配隊列繼續消費
- 本地隊列
- 消費者不間斷的從broker拉取消息,消息拉取到本地隊列,然后本地消費線程消費本地消息隊列,只是一個異步過程,拉取線程不會等待本地消費線程,這種模式實時性非常高(本地消息隊列達到解耦的效果,響應時間減少)。對消費者對本地隊列有一個保護,因此本地消息隊列不能無限大,否則可能會占用大量內存,本地隊列大小由DefaultMQPushConsumer的pullThresholdForQueue屬性控制,默認1000,可手動設置。
- 輪詢間隔
- 消息拉取線程每隔多久拉取一次?間隔時間由DefaultMQPushConsumer的pullInterval屬性控制,默認為0,可手動設置。
- 消息消費數量
- 監聽器每次接受本地隊列的消息是多少條?這個參數由DefaultMQPushConsumer的consumeMessageBatchMaxSize屬性控制,默認為1,可手動設置。


消息堆積如何處理
1、增加Consumer,增加MessageQueue,增加Consumer線程數
2、新建一個Topic,先消費將消息搬運到另外一個Topic,后用新Consumer消費處理
rocketmq怎么保證隊列完全順序消費?
RocketMQ可以嚴格的保證消息有序。但這個順序,不是全局順序,只是分區(queue)順序。要全局順序只能一個分區。
也就是說:同一個topic,在broker中默認會存在多個queue,因此,不論是producer還是customer,都不能保證生產或者消費的順序性,即消費端消費的時候,是會分配到多個queue的,多個queue是同時拉取提交消費。生產者同樣。
在同一條queue里面,RocketMQ的確是能保證FIFO的。那么要做到順序消息,必須把消息確保投遞到同一條queue。