淺談消息隊列及常見的消息中間件
前言
消息隊列 已經逐漸成為企業應用系統 內部通信 的核心手段。它具有 低耦合、可靠投遞、廣播、流量控制、最終一致性 等一系列功能。
當前使用較多的 消息隊列 有 RabbitMQ
、RocketMQ
、ActiveMQ
、Kafka
、ZeroMQ
、MetaMQ
等,而部分 數據庫 如 Redis
、MySQL
以及 phxsql
也可實現消息隊列的功能。
正文
1. 消息隊列概述
消息隊列 是指利用 高效可靠 的 消息傳遞機制 進行與平台無關的 數據交流,並基於 數據通信 來進行分布式系統的集成。
通過提供 消息傳遞 和 消息排隊 模型,它可以在 分布式環境 下提供 應用解耦、彈性伸縮、冗余存儲、流量削峰、異步通信、數據同步 等等功能,其作為 分布式系統架構 中的一個重要組件,有着舉足輕重的地位。
2. 消息隊列的特點
2.1. 采用異步處理模式
消息發送者 可以發送一個消息而無須等待響應。消息發送者 將消息發送到一條 虛擬的通道(主題 或 隊列)上,消息接收者 則 訂閱 或是 監聽 該通道。一條信息可能最終轉發給 一個或多個 消息接收者,這些接收者都無需對 消息發送者 做出 同步回應。整個過程都是 異步的。
2.2. 應用系統之間解耦合
主要體現在如下兩點:
- 發送者和接受者不必了解對方、只需要 確認消息;
- 發送者和接受者 不必同時在線。
比如在線交易系統為了保證數據的 最終一致,在 支付系統 處理完成后會把 支付結果 放到 消息中間件 里,通知 訂單系統 修改 訂單支付狀態。兩個系統是通過消息中間件解耦的。
3. 消息隊列的傳遞服務模型
消息隊列的 傳遞服務模型 如下圖所示:
4. 消息隊列的的傳輸模式
4.1. 點對點模型
點對點模型 用於 消息生產者 和 消息消費者 之間 點到點 的通信。消息生產者將消息發送到由某個名字標識的特定消費者。這個名字實際上對於消費服務中的一個 隊列(Queue
),在消息傳遞給消費者之前它被 存儲 在這個隊列中。隊列消息 可以放在 內存 中也可以 持久化,以保證在消息服務出現故障時仍然能夠傳遞消息。
傳統的點對點消息中間件通常由 消息隊列服務、消息傳遞服務、消息隊列 和 消息應用程序接口 API
組成,其典型的結構如下圖所示。
特點:
- 每個消息只用一個消費者;
- 發送者和接受者沒有時間依賴;
- 接受者確認消息接受和處理成功。
示意圖如下所示:
4.2. 發布/訂閱模型(Pub/Sub)
發布者/訂閱者 模型支持向一個特定的 消息主題 生產消息。0
或 多個訂閱者 可能對接收來自 特定消息主題 的消息感興趣。
在這種模型下,發布者和訂閱者彼此不知道對方,就好比是匿名公告板。這種模式被概況為:多個消費者可以獲得消息,在 發布者 和 訂閱者 之間存在 時間依賴性。發布者需要建立一個 訂閱(subscription
),以便能夠消費者訂閱。訂閱者 必須保持 持續的活動狀態 並 接收消息。
在這種情況下,在訂閱者 未連接時,發布的消息將在訂閱者 重新連接 時 重新發布,如下圖所示:
特性:
- 每個消息可以有多個訂閱者;
- 客戶端只有訂閱后才能接收到消息;
- 持久訂閱和非持久訂閱。
注意:
- 發布者和訂閱者有時間依賴:接受者和發布者只有建立訂閱關系才能收到消息;
- 持久訂閱:訂閱關系建立后,消息就不會消失,不管訂閱者是否都在線;
- 非持久訂閱:訂閱者為了接受消息,必須一直在線。 當只有一個訂閱者時約等於點對點模式
5. 消息隊列應用場景
當你需要使用 消息隊列 時,首先需要考慮它的必要性。可以使用消息隊列的場景有很多,最常用的幾種,是做 應用程序松耦合、異步處理模式、發布與訂閱、最終一致性、錯峰流控 和 日志緩沖 等。反之,如果需要 強一致性,關注業務邏輯的處理結果,則使用 RPC
顯得更為合適。
5.1. 異步處理
非核心 流程 異步化,減少系統 響應時間,提高 吞吐量。例如:短信通知、終端狀態推送、App
推送、用戶注冊 等。
消息隊列 一般都內置了 高效的通信機制,因此也可以用於單純的消息通訊,比如實現 點對點消息隊列 或者 聊天室 等。
應用案例
網站用戶注冊,注冊成功后會過一會發送郵件確認或者短息。
5.2. 系統解耦
- 系統之間不是 強耦合的,消息接受者 可以隨意增加,而不需要修改 消息發送者的代碼。消息發送者 的成功不依賴 消息接受者(比如:有些銀行接口不穩定,但調用方並不需要依賴這些接口)。
- 不強依賴 於非本系統的核心流程,對於 非核心流程,可以放到消息隊列中讓 消息消費者 去按需消費,而 不影響核心主流程。
5.3. 最終一致性
最終一致性 不是 消息隊列 的必備特性,但確實可以依靠 消息隊列 來做 最終一致性 的事情。
- 先寫消息再操作,確保操作完成后再修改消息狀態。定時任務補償機制 實現消息 可靠發送接收、業務操作的可靠執行,要注意 消息重復 與 冪等設計。
- 所有不保證
100%
不丟消息 的消息隊列,理論上無法實現 最終一致性。
像
Kafka
一類的設計,在設計層面上就有 丟消息 的可能(比如 定時刷盤,如果掉電就會丟消息)。哪怕只丟千分之一的消息,業務也必須用其他的手段來保證結果正確。
5.4. 廣播
生產者/消費者 模式,只需要關心消息是否 送達隊列,至於誰希望訂閱和需要消費,是 下游 的事情,無疑極大地減少了開發和聯調的工作量。
5.5. 流量削峰和流控
當 上下游系統 處理能力存在差距的時候,利用 消息隊列 做一個通用的 “漏斗”,進行 限流控制。在下游有能力處理的時候,再進行分發。
舉個例子:用戶在支付系統成功結賬后,訂單系統會通過短信系統向用戶推送扣費通知。 短信系統 可能由於 短板效應,速度卡在 網關 上(每秒幾百次請求),跟 前端的並發量 不是一個數量級。 於是,就造成 支付系統 和 短信系統 的處理能力出現差異化。
然而用戶晚上個半分鍾左右收到短信,一般是不會有太大問題的。如果沒有消息隊列,兩個系統之間通過 協商、滑動窗口 等復雜的方案也不是說不能實現。但 系統復雜性 指數級增長,勢必在 上游 或者 下游 做 存儲,並且要處理 定時、擁塞 等一系列問題。而且每當有 處理能力有差距 的時候,都需要 單獨 開發一套邏輯來維護這套邏輯。
所以,利用中間系統轉儲兩個系統的通信內容,並在下游系統有能力處理這些消息的時候,再處理這些消息,是一套相對較通用的方式。
應用案例
- 把消息隊列當成可靠的 消息暫存地,進行一定程度的 消息堆積;
- 定時進行消息投遞,比如模擬 用戶秒殺 訪問,進行 系統性能壓測。
5.6. 日志處理
將消息隊列用在 日志處理 中,比如 Kafka
的應用,解決 海量日志 傳輸和緩沖的問題。
應用案例
把日志進行集中收集,用於計算 PV
、用戶行為分析 等等。
5.7. 消息通訊
消息隊列一般都內置了 高效的通信機制,因此也可以用於單純的 消息通訊,比如實現 點對點消息隊列 或者 聊天室 等。
6. 消息隊列的推拉模型
6.1. Push推消息模型
消息生產者 將消息發送給 消息隊列,消息隊列 又將消息推給 消息消費者。
6.2. Pull拉消息模型
消費者 請求 消息隊列 接受消息,消息生產者 從 消息隊列 中拉該消息。
6.3. 兩種類型的區別
7. 消息隊列技術對比
本部分主要介紹四種常用的消息隊列(ActiveMQ
/ RabbitMQ
/ RocketMQ
/ Kafka
)的主要特性、優點、缺點。
7.1. ActiveMQ
ActiveMQ
是由 Apache
出品,ActiveMQ
是一個完全支持JMS1.1
和 J2EE 1.4
規范的 JMS Provider
實現。它非常快速,支持 多種語言的客戶端 和 協議,而且可以非常容易的嵌入到企業的應用環境中,並有許多高級功能。
(a) 主要特性
- 服從JMS規范:
JMS
規范提供了良好的標准和保證,包括:同步 或 異步 的消息分發,一次和僅一次的消息分發,消息接收 和 訂閱 等等。遵從JMS
規范的好處在於,不論使用什么JMS
實現提供者,這些基礎特性都是可用的; - 連接靈活性:
ActiveMQ
提供了廣泛的 連接協議,支持的協議有:HTTP/S
,IP
多播,SSL
,TCP
,UDP
等等。對眾多協議的支持讓ActiveMQ
擁有了很好的靈活性; - 支持的協議種類多:
OpenWire
、STOMP
、REST
、XMPP
、AMQP
; - 持久化插件和安全插件:
ActiveMQ
提供了 多種持久化 選擇。而且,ActiveMQ
的安全性也可以完全依據用戶需求進行 自定義鑒權 和 授權; - 支持的客戶端語言種類多:除了
Java
之外,還有:C/C++
,.NET
,Perl
,PHP
,Python
,Ruby
; - 代理集群:多個
ActiveMQ
代理 可以組成一個 集群 來提供服務; - 異常簡單的管理:
ActiveMQ
是以開發者思維被設計的。所以,它並不需要專門的管理員,因為它提供了簡單又使用的管理特性。有很多中方法可以 監控ActiveMQ
不同層面的數據,包括使用在JConsole
或者在ActiveMQ
的Web Console
中使用JMX
。通過處理JMX
的告警消息,通過使用 命令行腳本,甚至可以通過監控各種類型的 日志。
(b) 部署環境
ActiveMQ
可以運行在 Java
語言所支持的平台之上。使用 ActiveMQ
需要:
Java JDK
ActiveMQ
安裝包
(c) 優點
- 跨平台 (
JAVA
編寫與平台無關,ActiveMQ
幾乎可以運行在任何的JVM
上); - 可以用
JDBC
:可以將 數據持久化 到數據庫。雖然使用JDBC
會降低ActiveMQ
的性能,但是數據庫一直都是開發人員最熟悉的存儲介質; - 支持
JMS
規范:支持JMS
規范提供的 統一接口; - 支持 自動重連 和 錯誤重試機制;
- 有安全機制:支持基於
shiro
,jaas
等多種 安全配置機制,可以對Queue/Topic
進行 認證和授權; - 監控完善:擁有完善的 監控,包括
Web Console
,JMX
,Shell
命令行,Jolokia
的RESTful API
; - 界面友善:提供的
Web Console
可以滿足大部分情況,還有很多 第三方的組件 可以使用,比如hawtio
;
(d) 缺點
- 社區活躍度不及
RabbitMQ
高; - 根據其他用戶反饋,會出莫名其妙的問題,會 丟失消息;
- 目前重心放到
activemq 6.0
產品Apollo
,對5.x
的維護較少; - 不適合用於 上千個隊列 的應用場景;
7.2. RabbitMQ
RabbitMQ
於 2007
年發布,是一個在 AMQP
(高級消息隊列協議)基礎上完成的,可復用的企業消息系統,是當前最主流的消息中間件之一。
(a) 主要特性
- 可靠性:提供了多種技術可以讓你在 性能 和 可靠性 之間進行 權衡。這些技術包括 持久性機制、投遞確認、發布者證實 和 高可用性機制;
- 靈活的路由:消息在到達隊列前是通過 交換機 進行 路由 的。
RabbitMQ
為典型的路由邏輯提供了 多種內置交換機 類型。如果你有更復雜的路由需求,可以將這些交換機組合起來使用,你甚至可以實現自己的交換機類型,並且當做RabbitMQ
的 插件 來使用; - 消息集群:在相同局域網中的多個
RabbitMQ
服務器可以 聚合 在一起,作為一個獨立的邏輯代理來使用; - 隊列高可用:隊列可以在集群中的機器上 進行鏡像,以確保在硬件問題下還保證 消息安全;
- 支持多種協議:支持 多種消息隊列協議;
- 支持多種語言:用
Erlang
語言編寫,支持只要是你能想到的 所有編程語言; - 管理界面:
RabbitMQ
有一個易用的 用戶界面,使得用戶可以 監控 和 管理 消息Broker
的許多方面; - 跟蹤機制:如果 消息異常,
RabbitMQ
提供消息跟蹤機制,使用者可以找出發生了什么; - 插件機制:提供了許多 插件,來從多方面進行擴展,也可以編寫自己的插件。
(b) 部署環境
RabbitMQ
可以運行在 Erlang
語言所支持的平台之上,包括 Solaris
,BSD
,Linux
,MacOSX
,TRU64
,Windows
等。使用 RabbitMQ
需要:
ErLang
語言包RabbitMQ
安裝包
(c) 優點
- 由於
Erlang
語言的特性,消息隊列性能較好,支持 高並發; - 健壯、穩定、易用、跨平台、支持 多種語言、文檔齊全;
- 有消息 確認機制 和 持久化機制,可靠性高;
- 高度可定制的 路由;
- 管理界面 較豐富,在互聯網公司也有較大規模的應用,社區活躍度高。
(d) 缺點
- 盡管結合
Erlang
語言本身的並發優勢,性能較好,但是不利於做 二次開發和維護; - 實現了 代理架構,意味着消息在發送到客戶端之前可以在 中央節點 上排隊。此特性使得
RabbitMQ
易於使用和部署,但是使得其 運行速度較慢,因為中央節點 增加了延遲,消息封裝后 也比較大; - 需要學習 比較復雜 的 接口和協議,學習和維護成本較高。
7.3. RocketMQ
RocketMQ
出自 阿里 的開源產品,用 Java
語言實現,在設計時參考了 Kafka
,並做出了自己的一些改進,消息可靠性上 比 Kafka
更好。RocketMQ
在阿里內部被廣泛應用在 訂單,交易,充值,流計算,消息推送,日志流式處理,binglog
分發 等場景。
(a) 主要特性
- 基於 隊列模型:具有 高性能、高可靠、高實時、分布式 等特點;
Producer
、Consumer
、隊列 都支持 分布式;Producer
向一些隊列輪流發送消息,隊列集合 稱為Topic
。Consumer
如果做 廣播消費,則一個Consumer
實例消費這個Topic
對應的 所有隊列;如果做 集群消費,則 多個Consumer
實例 平均消費 這個Topic
對應的隊列集合;- 能夠保證 嚴格的消息順序;
- 提供豐富的 消息拉取模式;
- 高效的訂閱者 水平擴展能力;
- 實時 的 消息訂閱機制;
- 億級 消息堆積 能力;
- 較少的外部依賴。
(b) 部署環境
RocketMQ
可以運行在 Java
語言所支持的平台之上。使用 RocketMQ
需要:
Java JDK
- 安裝
git
、Maven
RocketMQ
安裝包
(c) 優點
- 單機 支持
1
萬以上 持久化隊列; RocketMQ
的所有消息都是 持久化的,先寫入系統PAGECACHE
,然后 刷盤,可以保證 內存 與 磁盤 都有一份數據,而 訪問 時,直接 從內存讀取。- 模型簡單,接口易用(
JMS
的接口很多場合並不太實用); - 性能非常好,可以允許 大量堆積消息 在
Broker
中; - 支持 多種消費模式,包括 集群消費、廣播消費等;
- 各個環節 分布式擴展設計,支持 主從 和 高可用;
- 開發度較活躍,版本更新很快。
(d) 缺點
- 支持的 客戶端語言 不多,目前是
Java
及C++
,其中C++
還不成熟; RocketMQ
社區關注度及成熟度也不及前兩者;- 沒有
Web
管理界面,提供了一個CLI
(命令行界面) 管理工具帶來 查詢、管理 和 診斷各種問題; - 沒有在
MQ
核心里實現JMS
等接口;
7.4. Kafka
Apache Kafka
是一個 分布式消息發布訂閱 系統。它最初由 LinkedIn
公司基於獨特的設計實現為一個 分布式的日志提交系統 (a distributed commit log
),之后成為 Apache
項目的一部分。Kafka
性能高效、可擴展良好 並且 可持久化。它的 分區特性,可復制 和 可容錯 都是其不錯的特性。
(a) 主要特性
- 快速持久化:可以在
O(1)
的系統開銷下進行 消息持久化; - 高吞吐:在一台普通的服務器上既可以達到
10W/s
的 吞吐速率; - 完全的分布式系統:
Broker
、Producer
和Consumer
都原生自動支持 分布式,自動實現 負載均衡; - 支持 同步 和 異步 復制兩種 高可用機制;
- 支持 數據批量發送 和 拉取;
- 零拷貝技術(zero-copy):減少
IO
操作步驟,提高 系統吞吐量; - 數據遷移、擴容 對用戶透明;
- 無需停機 即可擴展機器;
- 其他特性:豐富的 消息拉取模型、高效 訂閱者水平擴展、實時的 消息訂閱、億級的 消息堆積能力、定期刪除機制;
(b) 部署環境
使用 Kafka
需要:
Java JDK
Kafka
安裝包
(c) 優點
- 客戶端語言豐富:支持
Java
、.Net
、PHP
、Ruby
、Python
、Go
等多種語言; - 高性能:單機寫入
TPS
約在100
萬條/秒,消息大小10
個字節; - 提供 完全分布式架構,並有
replica
機制,擁有較高的 可用性 和 可靠性,理論上支持 消息無限堆積; - 支持批量操作;
- 消費者 采用
Pull
方式獲取消息。消息有序,通過控制 能夠保證所有消息被消費且僅被消費 一次; - 有優秀的第三方
Kafka Web
管理界面Kafka-Manager
; - 在 日志領域 比較成熟,被多家公司和多個開源項目使用。
(d) 缺點
Kafka
單機超過64
個 隊列/分區 時,Load
時會發生明顯的飆高現象。隊列 越多,負載 越高,發送消息 響應時間變長;- 使用 短輪詢方式,實時性 取決於 輪詢間隔時間;
- 消費失敗 不支持重試;
- 支持 消息順序,但是 一台代理宕機 后,就會產生 消息亂序;
- 社區更新較慢。
7.5. 幾種消息隊列對比
這里列舉了上述四種消息隊列的差異對比:
Kafka
在於 分布式架構,RabbitMQ
基於 AMQP
協議 來實現,RocketMQ
的思路來源於 Kafka
,改成了 主從結構,在 事務性 和 可靠性 方面做了優化。廣泛來說,電商、金融 等對 事務一致性 要求很高的,可以考慮 RabbitMQ
和 RocketMQ
,對 性能要求高 的可考慮 Kafka
。
小結
本文介紹了消息隊列的特點,消息隊列的 傳遞服務模型,消息的 傳輸方式,消息的 推拉模式。然后介紹了 ActiveMQ
,RabbitMQ
,RocketMQ
和 Kafka
幾種常見的消息隊列,闡述了 各種消息隊列 的 主要特點 和 優缺點。通過本文,對於消息隊列及相關技術選型,相信你會有了更深入的理解和認識。更多細節和原理性的東西,還需在實踐中見真知!
轉自: https://juejin.im/post/5b41fe36e51d45191252e79e#heading-9