一、線程安全定義
定義:
多個線程訪問同一個對象時,如果不用考慮這些線程在運行時環境下的調度和交替執行,也不需要進行額外的同步,或者在調用方進行任何其他操作,調用這個對象的行為都可以獲得正確的結果,那么這個對象就是線程安全的。
該定義由Brian Goetz在《Java Concurrency In Practice》(Java並發編程實戰)中定義;被百度百科、《深入理解Java虛擬機2》引用;
二、並發安全問題
大概很多人都知道一點為什么在多線程並發時會不安全,多線程同時操作對象的屬性或者狀態時,會因為線程之間的信息不同步,A線程讀取到的狀態已經過時,而A線程並不知道。所以並發安全的本質問題在於線程之間的信息不同步!
分析並發不安全的現象,再一層層展示其原理。
2.1、 競態條件
定義:
在並發編程中,由於不恰當的執行時序而出現不正確的結果。
案例:
這是一個線程不安全的方法,我們的期望是每次獲取queryTimes都會將queryTimes的值+1;但是當多線程並發訪問時,它的工作情況並不如我們所預想的那般;
static int queryTimes = 0;
public static int getTimes(){
queryTimes = queryTimes +1;
return queryTimes;
}
案例圖解:
圖解說明:
-
當線程A進入方法獲取到queryTimes=17時,線程B正准備進入方法;
-
當線程B獲取到queryTimes=18時,線程A還未處理值;
-
當線程A處理queryTimes+1 = 18后,線程B隨即處理queryTimes+1 = 18;
-
此時線程A才將處理后到結果寫入queryTimes,隨后B也將18寫入到queryTimes;
根據上述,我們知道當競態條件存在時,多個線程可能同時或者幾乎同時讀取到某個狀態(值),然后將處理后到值進行寫入,此時我們可以說發生了數據的"臟讀"
總結:
競態條件是指多線程同時對數據進行改變,讀取到臟數據或寫入錯數據;
2.2、 重排序、有序性、可見性
2.2.1、 指令重排序
定義:
計算機為了性能優化會對匯編指令進行重新排序,以便充分利用硬件的處理性能。
案例:
int a;
int b;
int c;
...略...
a = 1; // 步驟a
b = 2; // 步驟b
c = a + b; // 步驟c
案例圖解:
案例分析
- 雖然代碼順序是步驟a、步驟b、步驟c
- 但是從時間上以上三種情況都有可能
- 原因是步驟a和步驟b並沒有依賴關系
- 所以為了能快點執行,計算機會調整步驟a和步驟b的順序
- 因為步驟c依賴於步驟a和步驟b,所以重排序也會在a和b之后
2.2.2、 有序性
定義:
在Java中,單線程總是順序執行的!
當編譯器和處理器重排序時,必須保證,不管怎么重排序,單線程的執行結果不能被改變
2.2.3、 可見性
定義:
多線程中,若線程A中進行的每一步都可以被線程B觀測到,則稱線程A對線程B具有可見性。
線程B不僅可以看到線程A處理的結果,還能准確的知道在處理過程中,每一個狀態的改變,已經狀態改變的順序;
Java線程的通訊是透明的,線程之間不可以直接進行信息交換,所有的通訊必須同內存共享!所以多線程是天然不可見的,就是說如果不主動干涉的話,線程之間不可見,為什么呢,因為線程雖然第一步處理步驟a,第二步處理步驟b,但是先將步驟b的結果寫入主內存,后將步驟a的結果寫入主內存,則對觀測線程來說,首先看到的是步驟b的結果,然后才是步驟a的結果!
2.3、內存模型
Java線程模型由主內存和工作內存組成;
如圖:
說明:
- 工作內存和主內存兩部分一起組成Java線程的內存模型
- 工作內存是屬於線程的,不同線程的工作內存之間不可共享,不可通訊
- 工作內存通過Load操作從主內存中讀取數據,通過Save操作將數據寫入主內存
- 線程之間的通訊:本質上是指通過主內存的數據共享
解釋可見性:
如圖,Java線程之間是不可見的,因為線程的操作都在它本身的工作內存中完成,完成后的數據再寫入主內存。我們稱線程之間不可見是因為線程本身沒有直接通訊機制;但是線程可以通過主內存進行數據交換,也可以說線程之間可通過內存通訊;
解釋有序性和無序性:
單線程有序,是因為單線程的數據操作本身在它私有的工作內存中進行,不管如何重排序,單線程的執行結果不可被改變,所以寫入主內存的結果總是正確的。
a = 1; // 步驟a
b = 2; // 步驟b
c = a + b; // 步驟c
線程在被觀測時無序,因為當線程A中順序執行 a = 1、b = 1時,並不能保證先將a的值寫回主內存,完全有可能先將b的值寫入主內存,這是不可預測的。所以在線程B中觀察線程A的處理順序,是非常不可靠的!
因為線程之間只能通過主內存來進行數據交換,所以線程B讀到a=0,b=1時,在線程A中可能已經時a=1,b=1。只不過還沒有及時到將a的值寫入主內存。這樣線程B可能誤以為線程A先執行的是b=1;
三、總結
多線程為什么不安全?現在應該有答案了!究其根本,是因為線程之間無法准確的知道互相之間的狀態。那么如何使得多線程安全呢,從內存角度來講,保證線程的工作內存之間的可見性和有序性,是多線程並發安全的基礎。例如volatile關鍵字和synchronized關鍵字,我們除了從作用上了解他們,還可以從更深層的內存語義上理解,他們之所以能夠一定程度的解決線程安全問題,是因為他們約束了一定的內存處理方式!