一個高性能、輕量級的分布式內存隊列系統--beanstalk


  Beanstalk是一個高性能、輕量級的、分布式的、內存型的消息隊列系統。最初設計的目的是想通過后台異步執行耗時的任務來降低高容量Web應用系統的頁面訪問延遲。其實Beanstalkd是典型的類Memcached設計,協議和使用方式都是同樣的風格。其基本設計思想很簡單:高性能離不開異步,異步離不開隊列,而內部都是生產者-消費者模式的。

背景介紹:

  現在市面上有很多消息隊列系統了。常用的有ActiveMQ, RabbitMQ,ZeroMA,Kafka,RocketMQ。Redis之父最近又開源了一個Disque。我之前在樂視用的是apache的qpid。但是之所以各個系統都在流行,還要看其側重點。

  其中ActiveMQ可以稱之為傳統型,它們完全支持JMS和AMQP規范。

 

  JMS即Java消息服務(Java Message Service)應用程序接口。它是Java平台上有關面向消息中間件(Message Oriented Middleware,縮寫為MOM)的技術規范,它便於消息系統中的Java應用程序進行消息交換,並且通過提供標准的產生、發送、接收消息的接口簡化企業應用的開發。(*我這里說了,JMS是應用程序接口,就是API,API就意味着是和編程語言綁定的)

  JMS的體系架構由JMS提供者、JMS客戶、JMS生產者、JMS消費者、JMS消息、JMS隊列、JMS主題組成。

  JMS對象模型包含:連接工廠、JMS連接、JMS會話、JMS目的、JMS生產者和消費者和JMS消息。其中大家最關心的是JMS消息的兩種模型:點對點(point to point, queue)和發布/訂閱(publish/subscribe, topic)。這兩者之間的區別就是點對點模式是生產者發送一條消息到queue,一個queue可以有很多消費者,但是一個消息只能被一個消費者接收,當沒有消費者可用時,這個消息會被保存直到有一個可用的消費者,所以queue實現了一個可靠的負載均衡。而發布訂閱模式是發布者發送到topic的消息,只有訂閱了topic的訂閱者才會收到消息。topic實現了發布和訂閱,當你發布一個消息,所有訂閱這個topic的服務都能得到這個消息,所以從1到N個訂閱者都能得到這個消息的拷貝。

  

  AMQP(高級消息隊列協議),和JMS的區別在於:JMS只是java平台的方案,AMQP是一個跨語言的協議。由於跨語言的特點,降低了企業和系統集成的開銷。所以現在的消息隊列系統支持AMQP的多,支持JMS的少。

  AMQP的特征是面向消息,隊列化,消息模型(和JMS一樣:點對點和發布訂閱),可靠性和安全性。它提供了三種消息傳遞保證方式:最多一次,至少一次和精確一次。  

  我們經常在使用消息隊列的時候提到的broker是對實現了AMQP協議的服務端的稱呼。其基本結構如下圖。

 Beanstalk介紹:

  那下面開始說beanstalk了。首先說beanstalk其實並不是JMS規范的,也並不嚴格遵守AMQP協議。有人說Beanstalk之於RabbitMQ,就好比Nginx之於Apache。它更簡單,輕量級,高性能,易使用。但是相比kafka,數據處理能力還是有差距,所以我們現在其實在逐漸替代它。但它有些很易用的特殊功能,后面會講到。

  Beanstalk主要包括4個部分。

  1> job:一個需要異步處理的任務,需要放在一個tube中。

  2> tube:一個有名的任務隊列,用來存儲統一類型的job,是producer和consumer操作的對象。

  3> producer:job的生產者,通過put命令來將一個job放到一個tube中。

  4> consumer:job的消費者,通過reserve、release、bury、delete命令來獲取job或改變job的狀態。

 

  剛才說Beanstalk有一些特殊的好用功能。那就是它支持任務優先級(priority)、延時(delay)、超時重發(time-to-run)和預留(buried),能夠很好的支持分布式的后台任務和定時任務處理。這些特性是和beanstalk工作過程密切相關。

  Beanstalk的一個job的生命周期有READY、RESERVED、DELAYED、BURIED四種。

  當producer直接put一個job時,job就是READY狀態,等待consumer來處理。如果選擇延遲put,job就先到DELAYED狀態,到指定時間再READY。consumer獲取了READY的job,此狀態就為RESERVED。這樣其他consumer不能再操作此job。當consumer完成該job后,可以選擇delete、release或者bury。

  delete之后,job不能再獲取。release的job可以重新遷移或延遲遷移回READY。bury的job可以被休眠,需要的時候再READY或者delete掉。

Beanstalk使用場景:

  用作延時隊列:比如可以用於如果用戶30分鍾內不操作,任務關閉。

  用作循環隊列:用release命令可以循環執行任務,比如可以做負載均衡任務分發。

  用作兜底機制:比如一個請求有失敗的概率,可以用Beanstalk不斷重試,設定超時時間,時間內嘗試到成功為止。

  用作定時任務:比如可以用於專門的后台任務。

  用作異步操作:這是所有消息隊列都最常用的,先將任務仍進去,順序執行。

 

跑題時間:

  平時其實不愛聊閑天。但是和我家男神一起,就會有如下場景:我們去青島旅游,火車站上上電梯,我們各走一邊,然后相遇了。“咱倆太有緣分了,又遇到你了。”“你去哪里啊,這么巧,我也去。”“你家住哪里啊,這么巧,我也是。”……額,頓時覺得我們是最有緣分和最無聊的人,卻樂此不疲。

  還有更二的:

 

  

  除了胖到170斤那幾年,新到一個公司,總會有很多搭訕的,大家都特別熱情。直到我驕傲的介紹我家男神和小鮮肉。額~~,整個世界都清凈了~~


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM