ZooKeeper分布式鎖機制


二、

接下來我們一起來看看,多客戶端獲取及釋放zk分布式鎖的整個流程及背后的原理。

首先大家看看下面的圖,如果現在有兩個客戶端一起要爭搶zk上的一把分布式鎖,會是個什么場景?

 
 

如果大家對zk還不太了解的話,建議先自行百度一下,簡單了解點基本概念,比如zk有哪些節點類型等等。

參見上圖。zk里有一把鎖,這個鎖就是zk上的一個節點。然后呢,兩個客戶端都要來獲取這個鎖,具體是怎么來獲取呢?

咱們就假設客戶端A搶先一步,對zk發起了加分布式鎖的請求,這個加鎖請求是用到了zk中的一個特殊的概念,叫做“臨時順序節點”。

簡單來說,就是直接在"my_lock"這個鎖節點下,創建一個順序節點,這個順序節點有zk內部自行維護的一個節點序號。

比如說,第一個客戶端來搞一個順序節點,zk內部會給起個名字叫做:xxx-000001。然后第二個客戶端來搞一個順序節點,zk可能會起個名字叫做:xxx-000002。大家注意一下,最后一個數字都是依次遞增的,從1開始逐次遞增。zk會維護這個順序。

所以這個時候,假如說客戶端A先發起請求,就會搞出來一個順序節點,大家看下面的圖,Curator框架大概會弄成如下的樣子:

 
 

大家看,客戶端A發起一個加鎖請求,先會在你要加鎖的node下搞一個臨時順序節點,這一大坨長長的名字都是Curator框架自己生成出來的。

然后,那個最后一個數字是"1"。大家注意一下,因為客戶端A是第一個發起請求的,所以給他搞出來的順序節點的序號是"1"。

接着客戶端A創建完一個順序節點。還沒完,他會查一下"my_lock"這個鎖節點下的所有子節點,並且這些子節點是按照序號排序的,這個時候他大概會拿到這么一個集合:

 
 

接着客戶端A會走一個關鍵性的判斷,就是說:唉!兄弟,這個集合里,我創建的那個順序節點,是不是排在第一個啊?

如果是的話,那我就可以加鎖了啊!因為明明我就是第一個來創建順序節點的人,所以我就是第一個嘗試加分布式鎖的人啊!

bingo!加鎖成功!大家看下面的圖,再來直觀的感受一下整個過程。

 
 

接着假如說,客戶端A都加完鎖了,客戶端B過來想要加鎖了,這個時候他會干一樣的事兒:先是在"my_lock"這個鎖節點下創建一個臨時順序節點,此時名字會變成類似於:

 

大家看看下面的圖:

 
 

客戶端B因為是第二個來創建順序節點的,所以zk內部會維護序號為"2"。

接着客戶端B會走加鎖判斷邏輯,查詢"my_lock"鎖節點下的所有子節點,按序號順序排列,此時他看到的類似於:

 
 

同時檢查自己創建的順序節點,是不是集合中的第一個?

明顯不是啊,此時第一個是客戶端A創建的那個順序節點,序號為"01"的那個。所以加鎖失敗

加鎖失敗了以后,客戶端B就會通過ZK的API對他的順序節點的上一個順序節點加一個監聽器。zk天然就可以實現對某個節點的監聽。

如果大家還不知道zk的基本用法,可以百度查閱,非常的簡單。客戶端B的順序節點是:

 
 

他的上一個順序節點,不就是下面這個嗎?

 
 

即客戶端A創建的那個順序節點!

所以,客戶端B會對:

 
 

這個節點加一個監聽器,監聽這個節點是否被刪除等變化!大家看下面的圖。

 
 

接着,客戶端A加鎖之后,可能處理了一些代碼邏輯,然后就會釋放鎖。那么,釋放鎖是個什么過程呢?

其實很簡單,就是把自己在zk里創建的那個順序節點,也就是:

 
 

這個節點給刪除。

刪除了那個節點之后,zk會負責通知監聽這個節點的監聽器,也就是客戶端B之前加的那個監聽器,說:兄弟,你監聽的那個節點被刪除了,有人釋放了鎖。

 
 

此時客戶端B的監聽器感知到了上一個順序節點被刪除,也就是排在他之前的某個客戶端釋放了鎖。

此時,就會通知客戶端B重新嘗試去獲取鎖,也就是獲取"my_lock"節點下的子節點集合,此時為:

 
 

集合里此時只有客戶端B創建的唯一的一個順序節點了!

然后呢,客戶端B判斷自己居然是集合中的第一個順序節點,bingo!可以加鎖了!直接完成加鎖,運行后續的業務代碼即可,運行完了之后再次釋放鎖。

 
 
 

三、總結

其實如果有客戶端C、客戶端D等N個客戶端爭搶一個zk分布式鎖,原理都是類似的。

  • 大家都是上來直接創建一個鎖節點下的一個接一個的臨時順序節點
  • 如果自己不是第一個節點,就對自己上一個節點加監聽器
  • 只要上一個節點釋放鎖,自己就排到前面去了,相當於是一個排隊機制。

而且用臨時順序節點的另外一個用意就是,如果某個客戶端創建臨時順序節點之后,不小心自己宕機了也沒關系,zk感知到那個客戶端宕機,會自動刪除對應的臨時順序節點,相當於自動釋放鎖,或者是自動取消自己的排隊。

最后,咱們來看下用Curator框架進行加鎖和釋放鎖的一個過程:

 
 

其實用開源框架就是這點好,方便。這個Curator框架的zk分布式鎖的加鎖和釋放鎖的實現原理,其實就是上面我們說的那樣子。

但是如果你要手動實現一套那個代碼的話。還是有點麻煩的,要考慮到各種細節,異常處理等等。所以大家如果考慮用zk分布式鎖,可以參考下本文的思路。

END

基於以上的一些zk的特性,我們很容易得出使用zk實現分布式鎖的落地方案:

 

  1. 使用zk的臨時節點和有序節點,每個線程獲取鎖就是在zk創建一個臨時有序的節點,比如在/lock/目錄下。

  2. 創建節點成功后,獲取/lock目錄下的所有臨時節點,再判斷當前線程創建的節點是否是所有的節點的序號最小的節點

  3. 如果當前線程創建的節點是所有節點序號最小的節點,則認為獲取鎖成功。

  4. 如果當前線程創建的節點不是所有節點序號最小的節點,則對節點序號的前一個節點添加一個事件監聽。

    比如當前線程獲取到的節點序號為/lock/003,然后所有的節點列表為[/lock/001,/lock/002,/lock/003],則對/lock/002這個節點添加一個事件監聽器。

 

如果鎖釋放了,會喚醒下一個序號的節點,然后重新執行第3步,判斷是否自己的節點序號是最小。

比如/lock/001釋放了,/lock/002監聽到時間,此時節點集合為[/lock/002,/lock/003],則/lock/002為最小序號節點,獲取到鎖。


兩種方案的優缺點比較

學完了兩種分布式鎖的實現方案之后,本節需要討論的是redis和zk的實現方案中各自的優缺點。

對於redis的分布式鎖而言,它有以下缺點:

  • 它獲取鎖的方式簡單粗暴,獲取不到鎖直接不斷嘗試獲取鎖,比較消耗性能。

  • redis分布式鎖,其實需要自己不斷去嘗試獲取鎖,比較消耗性能。

 

對於zk分布式鎖而言:

  • zookeeper天生設計定位就是分布式協調,強一致性。鎖的模型健壯、簡單易用、適合做分布式鎖。

  • 如果獲取不到鎖,只需要添加一個監聽器就可以了,不用一直輪詢,性能消耗較小。

但是zk也有其缺點:如果有較多的客戶端頻繁的申請加鎖、釋放鎖,對於zk集群的壓力會比較大。

 




免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM