synchronized的實現原理及鎖優化


  記得剛剛開始學習Java的時候,一遇到多線程情況就是synchronized。對於當時的我們來說,synchronized是如此的神奇且強大。我們賦予它一個名字“同步”,也成為我們解決多線程情況的良葯,百試不爽。但是,隨着學習的深入,我們知道synchronized是一個重量級鎖,相對於Lock,它會顯得那么笨重,以至於我們認為它不是那么的高效,並慢慢拋棄它。 

  誠然,隨着Javs SE 1.6對synchronized進行各種優化后,synchronized不會顯得那么重。

   下面跟隨LZ一起來探索synchronized的實現機制、Java是如何對它進行了優化、鎖優化機制、鎖的存儲結構和升級過程。

1、實現原理

   synchronized可以保證方法或者代碼塊在運行時,同一時刻只有一個方法可以進入到臨界區,同時它還可以保證共享變量的內存可見性。

Java中每一個對象都可以作為鎖,這是synchronized實現同步的基礎:

  1. 普通同步方法,鎖是當前實例對象;

  2. 靜態同步方法,鎖是當前類的class對象;

  3. 同步方法塊,鎖是括號里面的對象。

  當一個線程訪問同步代碼塊時,它首先是需要得到鎖才能執行同步代碼,當退出或者拋出異常時必須要釋放鎖,那么它是如何來實現這個機制的呢?

 

 我們先看一段簡單的代碼:

 

public class SynchronizedTest{
  public synchronized void test1(){   
  }   
  public void test2(){     synchronized(this){
} } }

利用Javap工具查看生成的class文件信息來分析Synchronize的實現:

  從上面可以看出,同步代碼塊是使用monitorenter和monitorexit指令實現的,同步方法(在這看不出來需要看JVM底層實現)依靠的是方法修飾符上的ACCSYNCHRONIZED實現。

同步代碼塊:

  monitorenter指令插入到同步代碼塊的開始位置,monitorexit指令插入到同步代碼塊的結束位置,JVM需要保證每一個monitorenter都有一個monitorexit與之相對應。任何對象都有一個monitor與之相關聯,當且一個monitor被持有之后,他將處於鎖定狀態。線程執行到monitorenter指令時,將會嘗試獲取對象所對應的monitor所有權,即嘗試獲取對象的鎖;

同步方法

  synchronized方法則會被翻譯成普通的方法調用和返回指令如:invokevirtual、areturn指令,在VM字節碼層面並沒有任何特別的指令來實現被synchronized修飾的方法,而是在Class文件的方法表中將該方法的accessflags字段中的synchronized標志位置1,表示該方法是同步方法並使用調用該方法的對象或該方法所屬的Class在JVM的內部對象表示Klass做為鎖對象。

(摘自:http://www.cnblogs.com/javaminer/p/3889023.html)

 

下面我們來繼續分析,但是在深入之前我們需要了解兩個重要的概念:Java對象頭、Monitor。

 Java對象頭、monitor:Java對象頭和monitor是實現synchronized的基礎!下面就這兩個概念來做詳細介紹。

2、Java對象頭

synchronized用的鎖是存在Java對象頭里的,那么什么是Java對象頭呢?

Hotspot虛擬機的對象頭主要包括兩部分數據:Mark Word(標記字段)、Klass Pointer(類型指針)。其中Klass Point是是對象指向它的類元數據的指針,虛擬機通過這個指針來確定這個對象是哪個類的實例,Mark Word用於存儲對象自身的運行時數據,它是實現輕量級鎖和偏向鎖的關鍵。

所以下面將重點闡述。

  • Mark Word

    Mark Word用於存儲對象自身的運行時數據,如哈希碼(HashCode)、GC分代年齡、鎖狀態標志、線程持有的鎖、偏向線程 ID、偏向時間戳等等。Java對象頭一般占有兩個機器碼(在32位虛擬機中,1個機器碼等於4字節,也就是32bit),但是如果對象是數組類型,則需要三個機器碼,因為JVM虛擬機可以通過Java對象的元數據信息確定Java對象的大小,但是無法從數組的元數據來確認數組的大小,所以用一塊來記錄數組長度。

  下圖是Java對象頭的存儲結構(32位虛擬機):

  

  對象頭信息是與對象自身定義的數據無關的額外存儲成本,但是考慮到虛擬機的空間效率,Mark Word被設計成一個非固定的數據結構以便在極小的空間內存存儲盡量多的數據,它會根據對象的狀態復用自己的存儲空間,也就是說,Mark Word會隨着程序的運行發生變化,變化狀態如下(32位虛擬機):

簡單介紹了Java對象頭,我們下面再看Monitor。

3、Monitor

什么是Monitor?

  我們可以把它理解為一個同步工具,也可以描述為一種同步機制,它通常被描述為一個對象。 

  與一切皆對象一樣,所有的Java對象是天生的Monitor,每一個Java對象都有成為Monitor的潛質,因為在Java的設計中 ,每一個Java對象自打娘胎里出來就帶了一把看不見的鎖,它叫做內部鎖或者Monitor鎖。 

  Monitor 是線程私有的數據結構,每一個線程都有一個可用monitor record列表,同時還有一個全局的可用列表。每一個被鎖住的對象都會和一個monitor關聯(對象頭的MarkWord中的LockWord指向monitor的起始地址),同時monitor中有一個Owner字段存放擁有該鎖的線程的唯一標識,表示該鎖被這個線程占用。  

其結構如下:

 

  • Owner:初始時為NULL表示當前沒有任何線程擁有該monitor record,當線程成功擁有該鎖后保存線程唯一標識,當鎖被釋放時又設置為NULL。

  • EntryQ:關聯一個系統互斥鎖(semaphore),阻塞所有試圖鎖住monitor record失敗的線程。

  • RcThis:表示blocked或waiting在該monitor record上的所有線程的個數。

  • Nest:用來實現重入鎖的計數。HashCode:保存從對象頭拷貝過來的HashCode值(可能還包含GC age)。

  • Candidate:用來避免不必要的阻塞或等待線程喚醒,因為每一次只有一個線程能夠成功擁有鎖,如果每次前一個釋放鎖的線程喚醒所有正在阻塞或等待的線程,會引起不必要的上下文切換(從阻塞到就緒然后因為競爭鎖失敗又被阻塞)從而導致性能嚴重下降。

    Candidate只有兩種可能的值0表示沒有需要喚醒的線程1表示要喚醒一個繼任線程來競爭鎖。

我們知道synchronized是重量級鎖,效率不怎么滴,同時這個觀念也一直存在我們腦海里,不過在JDK 1.6中對synchronize的實現進行了各種優化,使得它顯得不是那么重了,那么JVM采用了那些優化手段呢?

4、鎖優化

  JDK1.6對鎖的實現引入了大量的優化,如自旋鎖、適應性自旋鎖、鎖消除、鎖粗化、偏向鎖、輕量級鎖等技術來減少鎖操作的開銷。 

  鎖主要存在四中狀態,依次是:無鎖狀態、偏向鎖狀態、輕量級鎖狀態、重量級鎖狀態。他們會隨着競爭的激烈而逐漸升級。注意鎖可以升級不可降級,這種策略是為了提高獲得鎖和釋放鎖的效率。

5、自旋鎖

  線程的阻塞和喚醒需要CPU從用戶態轉為核心態,頻繁的阻塞和喚醒對CPU來說是一件負擔很重的工作,勢必會給系統的並發性能帶來很大的壓力。同時我們發現在許多應用上面,對象鎖的鎖狀態只會持續很短一段時間為了這一段很短的時間頻繁地阻塞和喚醒線程是非常不值得的。

所以引入自旋鎖。 

何謂自旋鎖?

  所謂自旋鎖,就是讓該線程等待一段時間,不會被立即掛起(就是不讓前來獲取該鎖(已被占用)的線程立即阻塞),看持有鎖的線程是否會很快釋放鎖。

怎么等待呢?

執行一段無意義的循環即可(自旋)。

  自旋等待不能替代阻塞,先不說對處理器數量的要求(多核,貌似現在沒有單核的處理器了),雖然它可以避免線程切換帶來的開銷,但是它占用了處理器的時間。如果持有鎖的線程很快就釋放了鎖,那么自旋的效率就非常好;反之,自旋的線程就會白白消耗掉處理的資源,它不會做任何有意義的工作,典型的占着茅坑不拉屎,這樣反而會帶來性能上的浪費。

  所以說,自旋等待的時間(自旋的次數)必須要有一個限度,如果自旋超過了定義的時間仍然沒有獲取到鎖,則應該被掛起。自旋鎖在JDK 1.4.2中引入,默認關閉,但是可以使用-XX:+UseSpinning開開啟,在JDK1.6中默認開啟。同時自旋的默認次數為10次,可以通過參數-XX:PreBlockSpin來調整。

  如果通過參數-XX:preBlockSpin來調整自旋鎖的自旋次數,會帶來諸多不便。假如我將參數調整為10,但是系統很多線程都是等你剛剛退出的時候就釋放了鎖(假如你多自旋一兩次就可以獲取鎖),你是不是很尷尬?於是JDK1.6引入自適應的自旋鎖,讓虛擬機會變得越來越聰明。

6、適應自旋鎖

  JDK 1.6引入了更加聰明的自旋鎖,即自適應自旋鎖。所謂自適應就意味着自旋的次數不再是固定的,它是由前一次在同一個鎖上的自旋時間及鎖的擁有者的狀態來決定。

  它怎么做呢?

  線程如果自旋成功了,那么下次自旋的次數會更加多,因為虛擬機認為既然上次成功了,那么此次自旋也很有可能會再次成功,那么它就會允許自旋等待持續的次數更多。反之,如果對於某個鎖,很少有自旋能夠成功的,那么在以后要或者這個鎖的時候自旋的次數會減少甚至省略掉自旋過程,以免浪費處理器資源。有了自適應自旋鎖,隨着程序運行和性能監控信息的不斷完善,虛擬機對程序鎖的狀況預測會越來越准確,虛擬機會變得越來越聰明。 

7、鎖消除

  為了保證數據的完整性,我們在進行操作時需要對這部分操作進行同步控制,但是在有些情況下,JVM檢測到不可能存在共享數據競爭,這是JVM會對這些同步鎖進行鎖消除。鎖消除的依據是逃逸分析的數據支持。 

  如果不存在競爭,為什么還需要加鎖呢?

  所以鎖消除可以節省毫無意義的請求鎖的時間。變量是否逃逸,對於虛擬機來說需要使用數據流分析來確定,但是對於我們程序員來說這還不清楚么?我們會在明明知道不存在數據競爭的代碼塊前加上同步嗎?但是有時候程序並不是我們所想的那樣?

  我們雖然沒有顯示使用鎖,但是我們在使用一些JDK的內置API時,如StringBuffer、Vector、HashTable等,這個時候會存在隱形的加鎖操作。

  比如StringBuffer的append()方法,Vector的add()方法:

public void vectorTest(){
    Vector<String> vector = new Vector<String>();           
    for(int i = 0 ; i < 10 ; i++){
        vector.add(i + "");
     } 
      
    System.out.println(vector);
}

在運行這段代碼時,JVM可以明顯檢測到變量vector沒有逃逸出方法vectorTest()之外,所以JVM可以大膽地將vector內部的加鎖操作消除。

8、鎖粗化

  我們知道在使用同步鎖的時候,需要讓同步塊的作用范圍盡可能小,僅在共享數據的實際作用域中才進行同步。這樣做的目的是為了使需要同步的操作數量盡可能縮小,如果存在鎖競爭,那么等待鎖的線程也能盡快拿到鎖。 

  在大多數的情況下,上述觀點是正確的,LZ也一直堅持着這個觀點。但是如果一系列的連續加鎖解鎖操作,可能會導致不必要的性能損耗,所以引入鎖粗化的概念。 

  那什么是鎖粗化?

就是將多個連續的加鎖、解鎖操作連接在一起,擴展成一個范圍更大的鎖。

  如上面實例:vector每次add的時候都需要加鎖操作,JVM檢測到對同一個對象(vector)連續加鎖、解鎖操作,會合並一個更大范圍的加鎖、解鎖操作,即加鎖解鎖操作會移到for循環之外。

9、輕量級鎖

  引入輕量級鎖的主要目的是在多沒有多線程競爭的前提下,減少傳統的重量級鎖使用操作系統互斥量產生的性能消耗 

當關閉偏向鎖功能或者多個線程競爭偏向鎖導致偏向鎖升級為輕量級鎖,則會嘗試獲取輕量級鎖,其步驟如下:獲取鎖。

  1. 判斷當前對象是否處於無鎖狀態(hashcode、0、01),若是,則JVM首先將在當前線程的棧幀中建立一個名為鎖記錄(Lock Record)的空間,用於存儲鎖對象目前的Mark Word的拷貝(官方把這份拷貝加了一個Displaced前綴,即Displaced Mark Word);否則執行步驟(3);

  2. JVM利用CAS操作嘗試將對象的Mark Word更新為指向Lock Record的指正,如果成功表示競爭到鎖,則將鎖標志位變成00(表示此對象處於輕量級鎖狀態),執行同步操作;如果失敗則執行步驟(3);

  3. 判斷當前對象的Mark Word是否指向當前線程的棧幀,如果是則表示當前線程已經持有當前對象的鎖,則直接執行同步代碼塊;否則只能說明該鎖對象已經被其他線程搶占了,這時輕量級鎖需要膨脹為重量級鎖,鎖標志位變成10,后面等待的線程將會進入阻塞狀態; 

釋放鎖輕量級鎖的釋放也是通過CAS操作來進行的,主要步驟如下:

  1. 取出在獲取輕量級鎖保存在Displaced Mark Word中的數據;

  2. 用CAS操作將取出的數據替換當前對象的Mark Word中,如果成功,則說明釋放鎖成功,否則執行(3);

  3. 如果CAS操作替換失敗,說明有其他線程嘗試獲取該鎖,則需要在釋放鎖的同時需要喚醒被掛起的線程。

  輕量級鎖能提升程序同步性能的依據是“對於絕大部分的鎖,在整個同步周期內都是不存在競爭的”,這是一個經驗數據。輕量級鎖在當前線程的棧幀中建立一個名為鎖記錄的空間,用於存儲鎖對象目前的指向和狀態。如果沒有競爭,輕量級鎖使用CAS操作避免了使用互斥量的開銷,但如果存在鎖競爭,除了互斥量的開銷外,還額外發生了CAS操作,因此在有競爭的情況下,輕量級鎖會比傳統的重量級鎖更慢。

 

 什么是CAS操作?

compare and swap,CAS操作需要輸入兩個數值,一個舊值(期望操作前的值)和一個新值,在操作期間先比較舊值有沒有發生變化,如果沒有發生變化,才交換成新值,發生了變化則不交換。

CAS詳解:https://mp.weixin.qq.com/s__biz=MzIxMjE5MTE1Nw==&mid=2653192625&idx=1&sn=cbabbd806e4874e8793332724ca9d454&chksm=8c99f36bbbee7a7d169581dedbe09658d0b0edb62d2cbc9ba4c40f706cb678c7d8c768afb666&scene=21#wechat_redirect

https://blog.csdn.net/qq_35357656/article/details/78657373

 

下圖是輕量級鎖的獲取和釋放過程:

10、偏向鎖

  引入偏向鎖主要目的是:為了在無多線程競爭的情況下盡量減少不必要的輕量級鎖執行路徑。上面提到了輕量級鎖的加鎖解鎖操作是需要依賴多次CAS原子指令的。那么偏向鎖是如何來減少不必要的CAS操作呢?我們可以查看Mark work的結構就明白了。

只需要檢查是否為偏向鎖、鎖標識為以及ThreadID即可,處理流程如下:獲取鎖。

  1. 檢測Mark Word是否為可偏向狀態,即是否為偏向鎖1,鎖標識位為01;

  2. 若為可偏向狀態,則測試線程ID是否為當前線程ID,如果是,則執行步驟(5),否則執行步驟(3);

  3. 如果線程ID不為當前線程ID,則通過CAS操作競爭鎖,競爭成功,則將Mark Word的線程ID替換為當前線程ID,否則執行線程(4);

  4. 通過CAS競爭鎖失敗,證明當前存在多線程競爭情況,當到達全局安全點,獲得偏向鎖的線程被掛起,偏向鎖升級為輕量級鎖,然后被阻塞在安全點的線程繼續往下執行同步代碼塊;

  5. 執行同步代碼塊。 

釋放鎖偏向鎖的釋放采用了一種只有競爭才會釋放鎖的機制,線程是不會主動去釋放偏向鎖,需要等待其他線程來競爭。偏向鎖的撤銷需要等待全局安全點(這個時間點是上沒有正在執行的代碼)。

其步驟如下:

  1. 暫停擁有偏向鎖的線程,判斷鎖對象石是否還處於被鎖定狀態;

  2. 撤銷偏向蘇,恢復到無鎖狀態(01)或者輕量級鎖的狀態。

 下圖是偏向鎖的獲取和釋放流程:

11、重量級鎖

  重量級鎖通過對象內部的監視器(monitor)實現,其中monitor的本質是依賴於底層操作系統的Mutex Lock實現,操作系統實現線程之間的切換需要從用戶態到內核態的切換,切換成本非常高。

參考資料

  1. 周志明:《深入理解Java虛擬機》
  2. 方騰飛:《Java並發編程的藝術》
  3. Java中synchronized的實現原理與應用

 

轉自:https://blog.csdn.net/chenssy/article/details/54883355


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM