一.final域的重排序規則
對於final域,編譯器和處理器要遵循兩個重拍序規則:
1.在構造函數內對一個final域的寫入,與隨后把這個被構造對象的引用賦值給一個引用變量,這兩個操作之間不能重排序。
2.初次讀一個包含final域的對象的應用,與隨后初次讀這個final域,這兩個操作之間不能重排序
下面通過一個示例來分別說明這兩個規則:
public class FinalTest { int i;//普通變量 final int j; static FinalTest obj; public FinalTest(){ i = 1; j = 2; } public static void writer(){ obj = new FinalTest(); } public static void reader(){ FinalTest tets = obj;//讀對象引用 int a = tets.i; int b = tets.j; } }
這里假設一個線程A執行writer方法,隨后另一個線程B執行reader方法。我們通過這兩個線程的交互來說明這兩個規則。
寫final域的重排序規則禁止把final域的寫重排序到構造函數之外。這個規則的實現包含兩個方面:
1.JMM禁止編譯器把final域的寫重排序到構造函數之外
2.編譯器會在final域的寫入之后,構造函數return之前,插入一個StoreStore屏障。這個屏障禁止處理器把final域的寫重排序到構造函數之外
現在讓我們分析writer方法,writer方法只包含一行代碼obj = new FinalTest();這行代碼包含兩個步驟:
1.構造一個FinalTest類型的對象
2.把這個對象的引用賦值給obj
假設線程B的讀對象引用與讀對象的成員域之間沒有重排序,下圖是一種可能的執行時序
在上圖中,寫普通域的操作被編譯器重排序到了構造函數之外,讀線程B錯誤的讀取到了普通變量i初始化之前的值。而寫final域的操作被寫final域重排序的規則限定在了構造函數之內,讀線程B正確的讀取到了final變量初始化之后的值。
寫final域的重排序規則可以確保:在對象引用為任意線程可見之前,對象的final域已經被初始化了,而普通變量不具有這個保證。以上圖為例,讀線程B看到對象obj的時候,很可能obj對象還沒有構造完成(對普通域i的寫操作被重排序到構造函數外,此時初始值1還沒有寫入普通域i)
讀final域的重排序規則是:在一個線程中,初次讀對象的引用與初次讀這個對象包含的final域,JMM禁止重排序這兩個操作(該規則僅僅針對處理器)。編譯器會在讀final域的操作前面加一個LoadLoad屏障。
初次讀對象引用與初次讀該對象包含的final域,這兩個操作之間存在間接依賴關系。由於編譯器遵守間接依賴關系,因此編譯器不會重排序這兩個操作。大多數處理器也會遵守間接依賴,也不會重排序這兩個操作。但有少數處理器允許對存在間接依賴關系的操作做重排序(比如alpha處理器),這個規則就是專門用來針對這種處理器的。
上面的例子中,reader方法包含三個操作
1.初次讀引用變量obj
2.初次讀引用變量指向對象的普通域
3.初次讀引用變量指向對象的final域
現在假設寫線程A沒有發生任何重排序,同時程序在不遵守間接依賴的處理器上執行,下圖是一種可能的執行時序:
在上圖中,讀對象的普通域操作被處理器重排序到讀對象引用之前。在讀普通域時,該域還沒有被寫線程寫入,這是一個錯誤的讀取操作,而讀final域的重排序規則會把讀對象final域的操作“限定”在讀對象引用之后,此時該final域已經被A線程初始化過了,這是一個正確的讀取操作。
讀final域的重排序規則可以確保:在讀一個對象的final域之前,一定會先讀包含這個final域的對象的引用。在這個示例程序中,如果該引用不為null,那么引用對象的final域一定已經被A線程初始化過了。
二.final域為引用類型
上述將的final域都是基本類型,如果final域是引用類型,會有什么效果呢?
public class FinalReferenceTest { final int[] arrs;//final引用 static FinalReferenceTest obj; public FinalReferenceTest(){ arrs = new int[1];//1 arrs[0] = 1;//2 } public static void write0(){//A線程 obj = new FinalReferenceTest();//3 } public static void write1(){//線程B obj.arrs[0] = 2;//4 } public static void reader(){//C線程 if(obj!=null){//5 int temp =obj.arrs[0];//6 } } }
在上述的例子中,final域是一個引用類型,它引用了一個int類型的數組,對於引用類型,寫final域的重排序規則對編譯器和處理器增加了一下的約束:在構造函數內對一個final引用的對象的成員域的寫入,與隨后在構造函數外把這個被構造對象的引用賦值給一個引用變量,這兩個操作之間不能重排序。
本例中假設線程A先執行write0操作,執行完后線程B執行write1操作,執行完后線程C執行reader操作,下圖是一種可能的執行時序:
上圖中:,1是對final域的寫入,2是對這個final域引用的對象的成員域的寫入,3是把被構造的對象的引用賦值給某個引用變量。這里除了前面提到的1不能和3重排序外,2和3也不能重排序。
JMM可以確保讀線程C至少能看到寫線程A在構造函數中對final引用對象的成員域的寫入。即C至少能看到數組下標0的值為1。而寫線程B對數組元素的寫入,讀線程C可能看得到,也可能看不到。JMM不保證線程B的寫入對讀線程C可見,因為寫線程B和讀線程C之間存在數據競爭,此時的執行結果不可預知。
如果想要確保讀線程C看到寫線程B對數組元素的寫入,寫線程B和讀線程C之間需要使用同步原語(lock或volatile)來確保內存可見性。
前面我們提到過,寫final域的重排序規則可以確保:在引用變量為任意線程可見之前,該引用變量指向的對象的final域已經在構造函數中被正確初始化過了。其實,要得到這個效果,還需要一個保證:在構造函數內部,不能讓這個被構造對象的引用為其他線程所見,也就是對象引用不能在構造函數中“逸出”。
public class FinalReferenceEscapeExample { final int i; static FinalReferenceEscapeExample obj; public FinalReferenceEscapeExample () { i = 1; // 1寫final域 obj = this; // 2 this引用在此"逸出" } public static void writer() { new FinalReferenceEscapeExample (); } public static void reader() { if (obj != null) { // 3 int temp = obj.i; // 4 } } }
假設一個線程A執行writer()方法,另一個線程B執行reader()方法。這里的操作2使得對象還未完成構造前就為線程B可見。即使這里的操作2是構造函數的最后一步,且在程序中操作2排在操作1后面,執行read()方法的線程仍然可能無法看到final域被初始化后的值,因為這里的操作1和操作2之間可能被重排序。實際的執行時序可能如下:
從上圖可以看出:在構造函數返回前,被構造對象的引用不能為其他線程可見。因為此時final域可能還沒有初始化。。在構造函數返回后,任意線程都將保證能看到final域正確初始化之后的值。
三.final語義在處理器中的實現
現在我們以X86處理器為例,說明final語義在處理器中的具體實現.
上面我們提到,寫final域的重排序規則會要求編譯器在final域的寫之后,構造函數return之前插入一個StoreStore障屏。讀final域的重排序規則要求編譯器在讀final域的操作前面插入一個LoadLoad屏障。由於X86處理器不會對寫-寫操作做重排序,所以在X86處理器中,寫final域需要的StoreStore障屏會被省略掉。同樣,由於X86處理器不會對存在間接依賴關系的操作做重排序,所以在X86處理器中,讀final域需要的LoadLoad屏障也會被省略掉。也就是說,在X86處理器
中,final域的讀/寫不會插入任何內存屏障。
在舊的Java內存模型中,一個最嚴重的缺陷就是線程可能看到final域的值會改變。比如,一個線程當前看到一個整型final域的值為0(還未初始化之前的默認值),過一段時間之后這個線程再去讀這個final域的值時,卻發現值變為1(被某個線程初始化之后的值)。最常見的例子就是在舊的Java內存模型中,String的值可能會改變。為了修補這個漏洞,JSR-133專家組增強了final的語義。通過為final域增加寫和讀重排序規則,可以為Java程序員提供初始化安全保證:只要對象是正確構造的(被構造對象的引用在構造函數中沒有“逸出”),那么不需要使用同步(指lock和volatile的使用)就可以保證任意線程都能看到這個final域在構造函數中被初始化之后的值。