前言
當共享變量被聲明為volatile后,對這個變量的讀/寫操作都會很特別,下面我們就揭開volatile的神秘面紗。
1.volatile的內存語義
1.1 volatile的特性
一個volatile變量自身具有以下三個特性:
-
可見性:即當一個線程修改了聲明為volatile變量的值,新值對於其他要讀該變量的線程來說是立即可見的。而普通變量是不能做到這一點的,普通變量的值在線程間傳遞需要通過主內存來完成。
-
有序性:volatile變量的所謂有序性也就是被聲明為volatile的變量的臨界區代碼的執行是有順序的,即禁止指令重排序。
-
受限原子性:這里volatile變量的原子性與synchronized的原子性是不同的,synchronized的原子性是指只要聲明為synchronized的方法或代碼塊兒在執行上就是原子操作的。而volatile是不修飾方法或代碼塊兒的,它用來修飾變量,對於單個volatile變量的讀/寫操作都具有原子性,但類似於volatile++這種復合操作不具有原子性。所以volatile的原子性是受限制的。並且在多線程環境中,volatile並不能保證原子性。
1.2 volatile寫-讀的內存語義
volatile寫的內存語義:當寫線程寫一個volatile變量時,JMM會把該線程對應的本地內存中的共享變量值刷新到主內存。
volatile讀的內存語義:當讀線程讀一個volatile變量時,JMM會把該線程對應的本地內存置為無效,線程接下來將從主內存讀取共享變量。
2.volatile語義實現原理
在介紹volatile語義實現原理之前,我們先來看兩個與CPU相關的專業術語:
- 內存屏障(memory barriers):一組處理器指令,用於實現對內存操作的順序限制。
- 緩存行(cache line):CPU高速緩存中可以分配的最小存儲單位。處理器填寫緩存行時會加載整個緩存行。
2.1 volatile可見性實現原理
volatile可見性的內存語義是如何實現的呢?下面我們看一段代碼,並將代碼生成的處理器的匯編指令打印出來(關於如何打印匯編指令,我會在文章末尾附上),看下對volatile變量進行寫操作時,CPU會做什么事情:
public class VolatileTest {
private static volatile VolatileTest instance = null;
private VolatileTest(){}
public static VolatileTest getInstance(){
if(instance == null){
instance = new VolatileTest();
}
return instance;
}
public static void main(String[] args) {
VolatileTest.getInstance();
}
}
以上的代碼是一個我們非常熟悉的在多線程環境中不能保證線程安全的單例模式代碼,這段代碼中特殊的地方是,我將實例變量instance加上了volatile修飾,下面看打印的匯編指令:
上面截圖中,我們看到我划線的一行的末尾有一句匯編注釋:putstatic instance,了解JVM 字節碼指令的小伙伴都知道,putstatic的含義是給一個靜態變量設置值,在上述代碼中也就是給靜態變量instance賦值,對應代碼:instance = new VolatileTest();在getInstance方法中為instance實例化,因為instance加了volatile修飾,所以給靜態變量instance設置值也是在寫一個volatile變量。
看到上述有匯編指令,也有字節碼指令,大家會不會混淆這兩種指令,這里我指明一下字節碼指令和匯編指令的區別:
我們都知道java是一種跨平台的語言,那么java是如何實現這種平台無關性的呢?這就需要我們了解JVM和java的字節碼文件。這里我們需要有一點共識,就是任何一門編程語言都需要轉換為與平台相關的匯編指令才能夠最終被硬件執行,比如C和C++都將我們的源代碼直接編譯成與CPU相關的匯編指令給CPU執行。 不同系列的CPU的體系架構不同,所以它們的匯編指令也有不同,比如X86架構的CPU對應於X86匯編指令,arm架構的CPU對應於arm匯編指令。如果將程序源代碼直接編譯成與硬件相關的底層匯編指令,那么程序的跨平台性也就大打折扣,但執行性能相對較高。為了實現平台無關性,java的編譯器javac並不是將java的源程序直接編譯成與平台相關的匯編指令,而是編譯成一種中間語言,即java的class字節碼文件。字節碼文件,顧名思義存的就是字節碼,即一個一個的字節。有打開過java字節碼文件研讀過的小伙伴可能會發現,字節碼文件里面存的並不是二進制,而是十六進制,這是因為二進制太長了,一個字節要由8位二進制組成。所以用十六進制標表示,兩個十六進制就可以表示一個字節。java源碼編譯后的字節碼文件是不能夠直接被CPU執行的,那么該如何執行呢?答案是JVM,為了讓java程序能夠在不同的平台上執行,java官方提供了針對於各個平台的java虛擬機,JVM運行於硬件層之上,屏蔽各種平台的差異性。javac編譯后的字節碼文件統一由JVM來加載,最后再轉化成與硬件相關的機器指令被CPU執行。知道了通過JVM來加載字節碼文件,那么還有一個問題,就是JVM如何將字節碼中的每個字節和我們寫的java源代碼相關聯,也就是JVM如何知道我們寫的java源代碼對應於class文件中的哪段十六進制,這段十六進制是干什么的,執行了什么功能?並且一大堆的十六進制,我們也看不懂啊。所以這就需要定義一個JVM層面的規范,在JVM層面抽象出一些我們能夠認識的指令助記符,這些指令助記符就是java的字節碼指令。
再看上面的截圖,當寫instance這個volatile變量時,發現add前面加個一個lock指令,我在截圖中框了出來,如何不加volatile修飾,是沒有lock的。
lock指令在多核處理器下會引發下面的事件:
將當前處理器的緩存行的數據寫回到系統內存,同時使其他CPU里緩存了該內存地址的數據置為無效。
為了提高處理速度,處理器一般不直接和內存通信,而是先將系統內存的數據讀到內部緩存后再進行操作,但操作完成后並不知道處理器何時將緩存數據寫回到內存。但如果對加了volatile修飾的變量進行寫操作,JVM就會向處理器發送一條lock前綴的指令,將這個變量在緩存行的數據寫回到系統內存。這時只是寫回到系統內存,但其他處理器的緩存行中的數據還是舊的,要使其他處理器緩存行的數據也是新寫回的系統內存的數據,就需要實現緩存一致性協議。即在一個處理器將自己緩存行的數據寫回到系統內存后,其他的每個處理器就會通過嗅探在總線上傳播的數據來檢查自己緩存的數據是否已過期,當處理器發現自己緩存行對應的內存地址的數據被修改后,就會將自己緩存行緩存的數據設置為無效,當處理器要對這個數據進行修改操作的時候,會重新從系統內存中把數據讀取到自己的緩存行,重新緩存。
總結下:volatile可見性的實現就是借助了CPU的lock指令,通過在寫volatile的機器指令前加上lock前綴,使寫volatile具有以下兩個原則:
- 寫volatile時處理器會將緩存寫回到主內存。
- 一個處理器的緩存寫回到內存會導致其他處理器的緩存失效。
2.2 volatile有序性的實現原理
volatile有序性的保證就是通過禁止指令重排序來實現的。指令重排序包括編譯器和處理器重排序,JMM會分別限制這兩種指令重排序。
那么禁止指令重排序又是如何實現的呢?答案是加內存屏障。JMM為volatile加內存屏障有以下4種情況:
- 在每個volatile寫操作的前面插入一個StoreStore屏障,防止寫volatile與后面的寫操作重排序。
- 在每個volatile寫操作的后面插入一個StoreLoad屏障,防止寫volatile與后面的讀操作重排序。
- 在每個volatile讀操作的后面插入一個LoadLoad屏障,防止讀volatile與后面的讀操作重排序。
- 在每個volatile讀操作的后面插入一個LoadStore屏障,防止讀volatile與后面的寫操作重排序。
上述內存屏障的插入策略是非常保守的,比如一個volatile的寫操作后面需要加上StoreStore和StoreLoad屏障,但這個寫volatile后面可能並沒有讀操作,因此理論上只加上StoreStore屏障就可以,的確,有的處理器就是這么做的。但JMM這種保守的內存屏障插入策略能夠保證在任意的處理器平台,volatile變量都是有序的。
3.JSR-133對volatile內存語義的增強
在JSR-133之前的舊的java內存模型中,雖然不允許對volatile變量之間的操作進行重排序,但允許對volatile變量與普通變量之間進行重排序。比如內存屏障前面是一個寫volatile變量的操作,內存屏障后面的操作是一個寫普通變量的操作,即使這兩個寫操作可能會破壞volatile內存語義,但JMM是允許這兩個操作進行重排序的。
在JSR-133以及后面的新的java內存模型中,增強了volatile的內存語義。只要volatile變量與普通變量之間的重排序可能會破壞volatile的內存語義,這種重排序就會被編譯器重排序規則和處理器內存屏障出入策略禁止。
附:配置idea打印匯編指令
工具包下載地址:鏈接:https://pan.baidu.com/s/11yRnsOHca5EVRfE9gAuVxA
提取碼:gn8z
將下載的工具包解壓,復制到jdk安裝目錄的jre路徑下的bin目錄中,如圖:
然后配置idea,在 VM options 選項中輸入:-server -Xcomp -XX:+UnlockDiagnosticVMOptions -XX:+PrintAssembly -XX:CompileCommand=compileonly,*類名.方法名
JRE選項選擇已放入工具包的jre路徑。
下圖是我的idea配置:
以上配置好后運行就可以打印匯編指令了。