面試官:“對java並發了解怎么樣?”
應聘者:“還可以…”
面試官:“為了保證線程安全,Java並發有哪幾個基本特性呢?”
應聘者:“有三條基本性質,原子性、可見性、有序性”
面試官: “具體解釋下這三個特性?”
應聘者:“bala。bala。bala。。”
Java內存模型是圍繞着並發過程中如何處理原子性、可見性、有序性這三個特征來建立的,下面是這三個特性的實現原理:原子性(Atomicity)
由Java內存模型來直接保證的原子性變量操作包括read、load、use、assign、store和write六個,大致可以認為基礎數據類型的訪問和讀寫是具備原子性的。如果應用場景需要一個更大范圍的原子性保證,Java內存模型還提供了lock和unlock操作來滿足這種需求,盡管虛擬機未把lock與unlock操作直接開放給用戶使用,但是卻提供了更高層次的字節碼指令monitorenter和monitorexit來隱匿地使用這兩個操作,這兩個字節碼指令反映到Java代碼中就是同步塊—synchronized關鍵字,因此在synchronized塊之間的操作也具備原子性。
Java中的原子操作包括:
1)除long和double之外的基本類型的賦值操作
2)所有引用reference的賦值操作
3)java.concurrent.Atomic.* 包中所有類的一切操作。
但是java對long和double的賦值操作是非原子操作!long和double占用的字節數都是8,也就是64bits。在32位操作系統上對64位的數據的讀寫要分兩步完成,每一步取32位數據。這樣對double和long的賦值操作就會有問題:如果有兩個線程同時寫一個變量內存,一個進程寫低32位,而另一個寫高32位,這樣將導致獲取的64位數據是失效的數據。因此需要使用volatile關鍵字來防止此類現象。volatile本身不保證獲取和設置操作的原子性,僅僅保持修改的可見性。但是java的內存模型保證聲明為volatile的long和double變量的get和set操作是原子的。
public class UnatomicLong implements Runnable { private static long test = 0; private final long val; public UnatomicLong(long val) { this.val = val; } @Override public void run() { while (!Thread.interrupted()) { test = val; //兩個線程都試圖將自己的私有變量val賦值給類私有靜態變量test } } public static void main(String[] args) { Thread t1 = new Thread(new UnatomicLong(-1)); Thread t2 = new Thread(new UnatomicLong(0)); System.out.println(Long.toBinaryString(-1)); System.out.println(pad(Long.toBinaryString(0), 64)); t1.start(); t2.start(); long val; while ((val = test) == -1 || val == 0) { //如果靜態成員test的值是-1或0,說明兩個線程操作沒有交叉 } System.out.println(pad(Long.toBinaryString(val), 64)); System.out.println(val); t1.interrupt(); t2.interrupt(); } // prepend 0s to the string to make it the target length private static String pad(String s, int targetLength) { int n = targetLength - s.length(); for (int x = 0; x < n; x++) { s = "0" + s; } return s; }}
運行發現程序在while循環時進入了死循環,這是因為使用的JVM是64bits。在64位JVM中double和long的賦值操作是原子操作。
在eclipse中修改jre為一個32bit的JVM地址,則會有如下運行結果:
1111111111111111111111111111111111111111111111111111111111111111 0000000000000000000000000000000000000000000000000000000000000000 0000000000000000000000000000000011111111111111111111111111111111 //很明顯test的值被破壞了 4294967295
可見性(Visibility)
可見性就是指當一個線程修改了線程共享變量的值,其它線程能夠立即得知這個修改。Java內存模型是通過在變量修改后將新值同步回主內存,在變量讀取前從主內存刷新變量值這種依賴主內存作為傳遞媒介的方法來實現可見性的,無論是普通變量還是volatile變量都是如此,普通變量與volatile變量的區別是volatile的特殊規則保證了新值能立即同步到主內存,以及每使用前立即從內存刷新。因為我們可以說volatile保證了線程操作時變量的可見性,而普通變量則不能保證這一點。
除了volatile之外,Java還有兩個關鍵字能實現可見性,它們是synchronized。同步塊的可見性是由“對一個變量執行unlock操作之前,必須先把此變量同步回主內存中(執行store和write操作)”這條規則獲得的,而final關鍵字的可見性是指:被final修飾的字段是構造器一旦初始化完成,並且構造器沒有把“this”引用傳遞出去,那么在其它線程中就能看見final字段的值。
Lock也可以保證可見性,因為它可以保證任一時刻只有一個線程能訪問共享資源,並在其釋放鎖之前將修改的變量刷新到內存中。有序性(Ordering)
Java內存模型中的程序天然有序性可以總結為一句話:如果在本線程內觀察,所有操作都是有序的;如果在一個線程中觀察另一個線程,所有操作都是無序的。前半句是指“線程內表現為串行語義”,后半句是指“指令重排序”現象和“工作內存主主內存同步延遲”現象。
Java語言提供了volatile和synchronized兩個關鍵字來保證線程之間操作的有序性,volatile關鍵字本身就包含了禁止指令重排序的語義,而synchronized則是由“一個變量在同一時刻只允許一條線程對其進行lock操作”這條規則來獲得的,這個規則決定了持有同一個鎖的兩個同步塊只能串行地進入。
先行發生原則:
如果Java內存模型中所有的有序性都只靠volatile和synchronized來完成,那么有一些操作將會變得很啰嗦,但是我們在編寫Java並發代碼的時候並沒有感覺到這一點,這是因為Java語言中有一個“先行發生”(Happen-Before)的原則。這個原則非常重要,它是判斷數據是否存在競爭,線程是否安全的主要依賴。
先行發生原則是指Java內存模型中定義的兩項操作之間的依序關系,如果說操作A先行發生於操作B,其實就是說發生操作B之前,操作A產生的影響能被操作B觀察到,“影響”包含了修改了內存中共享變量的值、發送了消息、調用了方法等。它意味着什么呢?如下例:
//線程A中執行i = 1;//線程B中執行j = i;//線程C中執行i = 2;
假設線程A中的操作”i=1“先行發生於線程B的操作”j=i“,那么我們就可以確定在線程B的操作執行后,變量j的值一定是等於1,結出這個結論的依據有兩個,一是根據先行發生原則,”i=1“的結果可以被觀察到;二是線程C登場之前,線程A操作結束之后沒有其它線程會修改變量i的值。現在再來考慮線程C,我們依然保持線程A和B之間的先行發生關系,而線程C出現在線程A和B操作之間,但是C與B沒有先行發生關系,那么j的值可能是1,也可能是2,因為線程C對應變量i的影響可能會被線程B觀察到,也可能觀察不到,這時線程B就存在讀取到過期數據的風險,不具備多線程的安全性。
下面是Java內存模型下一些”天然的“先行發生關系,這些先行發生關系無須任何同步器協助就已經存在,可以在編碼中直接使用。如果兩個操作之間的關系不在此列,並且無法從下列規則推導出來的話,它們就沒有順序性保障,虛擬機可以對它們進行隨意地重排序。
a.程序次序規則(Pragram Order Rule):在一個線程內,按照程序代碼順序,書寫在前面的操作先行發生於書寫在后面的操作。准確地說應該是控制流順序而不是程序代碼順序,因為要考慮分支、循環結構。
b.管程鎖定規則(Monitor Lock Rule):一個unlock操作先行發生於后面對同一個鎖的lock操作。這里必須強調的是同一個鎖,而”后面“是指時間上的先后順序。
c.volatile變量規則(Volatile Variable Rule):對一個volatile變量的寫操作先行發生於后面對這個變量的讀取操作,這里的”后面“同樣指時間上的先后順序。
d.線程啟動規則(Thread Start Rule):Thread對象的start()方法先行發生於此線程的每一個動作。
e.線程終於規則(Thread Termination Rule):線程中的所有操作都先行發生於對此線程的終止檢測,我們可以通過Thread.join()方法結束,Thread.isAlive()的返回值等作段檢測到線程已經終止執行。
f.線程中斷規則(Thread Interruption Rule):對線程interrupt()方法的調用先行發生於被中斷線程的代碼檢測到中斷事件的發生,可以通過Thread.interrupted()方法檢測是否有中斷發生。
g.對象終結規則(Finalizer Rule):一個對象初始化完成(構造方法執行完成)先行發生於它的finalize()方法的開始。
g.傳遞性(Transitivity):如果操作A先行發生於操作B,操作B先行發生於操作C,那就可以得出操作A先行發生於操作C的結論。
一個操作”時間上的先發生“不代表這個操作會是”先行發生“,那如果一個操作”先行發生“是否就能推導出這個操作必定是”時間上的先發生“呢?也是不成立的,一個典型的例子就是指令重排序。所以時間上的先后順序與先生發生原則之間基本沒有什么關系,所以衡量並發安全問題一切必須以先行發生原則為准。