多線程並發為什么不安全


一、線程安全定義

定義:

多個線程訪問同一個對象時,如果不用考慮這些線程在運行時環境下的調度和交替執行,也不需要進行額外的同步,或者在調用方進行任何其他操作,調用這個對象的行為都可以獲得正確的結果,那么這個對象就是線程安全的。

該定義由Brian Goetz在《Java Concurrency In Practice》(Java並發編程實戰)中定義;被百度百科、《深入理解Java虛擬機2》引用;

二、並發安全問題

​ 大概很多人都知道一點為什么在多線程並發時會不安全,多線程同時操作對象的屬性或者狀態時,會因為線程之間的信息不同步,A線程讀取到的狀態已經過時,而A線程並不知道。所以並發安全的本質問題在於線程之間的信息不同步!

​ 分析並發不安全的現象,再一層層展示其原理。

2.1、 競態條件

定義:

​ 在並發編程中,由於不恰當的執行時序而出現不正確的結果。

案例:

​ 這是一個線程不安全的方法,我們的期望是每次獲取queryTimes都會將queryTimes的值+1;但是當多線程並發訪問時,它的工作情況並不如我們所預想的那般;

static int queryTimes = 0;
public static int getTimes(){
    queryTimes = queryTimes +1;
    return queryTimes;
}

運行結果:https://www.cnblogs.com/dhcao/p/10970604.html

案例圖解:

圖解說明:

  • 當線程A進入方法獲取到queryTimes=17時,線程B正准備進入方法;

  • 當線程B獲取到queryTimes=18時,線程A還未處理值;

  • 當線程A處理queryTimes+1 = 18后,線程B隨即處理queryTimes+1 = 18;

  • 此時線程A才將處理后到結果寫入queryTimes,隨后B也將18寫入到queryTimes;

    ​ 根據上述,我們知道當競態條件存在時,多個線程可能同時或者幾乎同時讀取到某個狀態(值),然后將處理后到值進行寫入,此時我們可以說發生了數據的"臟讀"

總結:

​ 競態條件是指多線程同時對數據進行改變,讀取到臟數據或寫入錯數據

2.2、 重排序、有序性、可見性

2.2.1、 指令重排序

定義:

​ 計算機為了性能優化會對匯編指令進行重新排序,以便充分利用硬件的處理性能。

案例:

int a;
int b;
int c;

...略...
  
a = 1;       // 步驟a
b = 2;			 // 步驟b
c = a + b;   // 步驟c

案例圖解:

案例分析

  • 雖然代碼順序是步驟a、步驟b、步驟c
  • 但是從時間上以上三種情況都有可能
  • 原因是步驟a和步驟b並沒有依賴關系
  • 所以為了能快點執行,計算機會調整步驟a和步驟b的順序
  • 因為步驟c依賴於步驟a和步驟b,所以重排序也會在a和b之后

2.2.2、 有序性

​ 定義:

​ 在Java中,單線程總是順序執行的!

​ 當編譯器和處理器重排序時,必須保證,不管怎么重排序,單線程的執行結果不能被改變

2.2.3、 可見性

​ 定義:

​ 多線程中,若線程A中進行的每一步都可以被線程B觀測到,則稱線程A對線程B具有可見性。

​ 線程B不僅可以看到線程A處理的結果,還能准確的知道在處理過程中,每一個狀態的改變,已經狀態改變的順序;

​ Java線程的通訊是透明的,線程之間不可以直接進行信息交換,所有的通訊必須同內存共享!所以多線程是天然不可見的,就是說如果不主動干涉的話,線程之間不可見,為什么呢,因為線程雖然第一步處理步驟a,第二步處理步驟b,但是先將步驟b的結果寫入主內存,后將步驟a的結果寫入主內存,則對觀測線程來說,首先看到的是步驟b的結果,然后才是步驟a的結果!

2.3、內存模型

​ Java線程模型由主內存和工作內存組成;

如圖:

說明:

  • 工作內存和主內存兩部分一起組成Java線程的內存模型
  • 工作內存是屬於線程的,不同線程的工作內存之間不可共享,不可通訊
  • 工作內存通過Load操作從主內存中讀取數據,通過Save操作將數據寫入主內存
  • 線程之間的通訊:本質上是指通過主內存的數據共享

解釋可見性

​ 如圖,Java線程之間是不可見的,因為線程的操作都在它本身的工作內存中完成,完成后的數據再寫入主內存。我們稱線程之間不可見是因為線程本身沒有直接通訊機制;但是線程可以通過主內存進行數據交換,也可以說線程之間可通過內存通訊;

解釋有序性和無序性:

​ 單線程有序,是因為單線程的數據操作本身在它私有的工作內存中進行,不管如何重排序,單線程的執行結果不可被改變,所以寫入主內存的結果總是正確的。

a = 1;       // 步驟a
b = 2;			 // 步驟b
c = a + b;   // 步驟c

​ 線程在被觀測時無序,因為當線程A中順序執行 a = 1、b = 1時,並不能保證先將a的值寫回主內存,完全有可能先將b的值寫入主內存,這是不可預測的。所以在線程B中觀察線程A的處理順序,是非常不可靠的!

因為線程之間只能通過主內存來進行數據交換,所以線程B讀到a=0,b=1時,在線程A中可能已經時a=1,b=1。只不過還沒有及時到將a的值寫入主內存。這樣線程B可能誤以為線程A先執行的是b=1;

三、總結

​ 多線程為什么不安全?現在應該有答案了!究其根本,是因為線程之間無法准確的知道互相之間的狀態。那么如何使得多線程安全呢,從內存角度來講,保證線程的工作內存之間的可見性和有序性,是多線程並發安全的基礎。例如volatile關鍵字和synchronized關鍵字,我們除了從作用上了解他們,還可以從更深層的內存語義上理解,他們之所以能夠一定程度的解決線程安全問題,是因為他們約束了一定的內存處理方式!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM