離開博客園很久了,自從找到工作,到現在基本沒有再寫過博客了。在大學培養起來的寫博客的習慣在慢慢的消失殆盡,感覺汗顏。所以現在要開始重新培養起這個習慣,定期寫博客不僅是對自己學習知識的一種沉淀,更是在督促自己要不斷的學習,不斷的進步。
最近在進一步學習Java並發編程,不言而喻,這部分內容是很重要的。現在就以《並發編程的藝術》一書為主導線,開始新一輪的學習。
進程和線程
進程是一個應用程序在處理機上的一次執行過程,線程是進程的最小基本單位(個人理解)。一個進程可以包含多個線程。
上下文切換
我們都知道,即使是單核處理器也支持多線程,CPU通過時間片分配算法來給每個線程分配時間讓線程得以執行,因為時間片非常短,所以在用戶角度來講,會感覺多個線程是在同時執行。那什么是上下文切換呢?舉個例子,當線程A執行到某一步時,此時CPU將時間讓給了線程B進行執行,那么在進行切換的時候,系統一定要保存此時此刻線程A所執行任務的狀態,比如執行到哪里、運行時的參數等,那么當下一次CPU將時間讓給線程A進行執行時,才能正確的切換到A,並繼續執行下去。所以任務從保存到再加載的過程就是一次上下文切換。
雖然上下文切換可以讓我們覺得可以“同時”做很多事,但是上下文切換也是需要系統開銷的。在《Java並發編程的藝術》中,作者舉例演示了串行和並發執行累加操作,在結果中可以看得出,累加操作不同的次數會對不同的結果,所消耗的時間也有差別的。如果累加操作的次數沒有超過百萬次,那么串行執行結果消耗的時間會比並行執行的時間要少。所以在有些情況下我們需要盡可能的減少上下文切換的次數,使用的方法有:無鎖並發編程,CAS算法,使用最少線程和使用協程。(這里筆者也只知道有這幾種方法,至於具體如何使用以及在何種場景下使用還未深入研究)。
volatile與synchronized
volatile
volatile是輕量級的synchronized,它保證了在多處理器開發中,共享變量的可見性,並且volatile不會引起上下文切換和調度。可見性的意思是當一個線程修改了某個變量的值,另外一個線程可以讀到這個變量修改后的值,如果一個變量被volatile修飾,那么Java內存模型確保所有線程看到這個變量的值是一致的。
synchronized
Java中每一個對象都可以作為鎖,具體表現為:
- 對於普通的同步方法,鎖是當前實例對象
- 對於靜態的同步方法,鎖是當前類的Class對象
- 對於同步方法塊,鎖是synchronized括號里配置的對象
當一個線程訪問同步代碼塊時,必須要先得到鎖,退出或拋出異常時,必須釋放鎖。對於上述三種情況,表現形式為:
1 /** 2 * 普通同步方法,鎖是當前實例對象 3 */ 4 public synchronized void test1(){ 5 //TODO something 6 } 7 8 /** 9 * 靜態同步方法,鎖是當前類的Class對象 10 */ 11 public static synchronized void test2(){ 12 //TODO something 13 } 14 15 /** 16 * 同步方法塊,鎖是synchronized括號中的對象,這里是a 17 */ 18 public void test3(Integer a){ 19 synchronized (a){ 20 //TODO something 21 } 22 }
Java內存模型
Java中所有實例域、靜態域和數組元素都存儲在堆內存中,堆內存在線程之間共享。
Java線程之間的通信由Java內存模型(JMM)控制。JMM定義了線程和主內存的關系:線程之前的共享變量存儲在主內存中,每個線程都有一個私有的本地內存(也叫工作內存),本地內存中存儲了該線程讀寫共享變量的副本。本地內存是JMM的抽象概念,不真實存在,包涵了緩存,寫緩沖區,寄存器以及其他硬件和編譯器優化。Java內存模型結構圖:
從上圖可以看出,線程A要與線程B進行通信的話,必須要經過兩個步驟:
- 線程A把本地內存A中更新過的共享變量刷新要主內存中去,
- 線程B到主內存中獲取更新之后的共享變量。
如下圖:
重排序
重排序是指編譯器和處理器為了優化程序性能而對指令序列進行重新排序的一種手段。
數據依賴性
定義:如果兩個操作同時訪問一個變量,且這兩個操作中有一個為寫操作。此時這兩個操作之間就存在數據依賴性。
編譯器和處理器在重排序時,會遵守數據依賴性,編譯器和處理器不會改變存在數據依賴關系的兩個操作的執行順序。
as-if-serial語義
語義:不管怎么重排序,單線程程序的執行結果不能被改變。編譯器,runtime和處理器都必須遵守as-if-serial語義。
為了遵守as-if-serial語義,編譯器和處理器不會對存在數據依賴關系的操作進行重排序,但是如果操作之間不存在數據依賴關系,那么就有可能被進行重排序。例如:
1 double pi = 3.14 ; //A 2 double r = 1.0 ; //B 3 double area = pi * r *r ; //C
上面代碼中,C依賴A,C依賴B,所以編譯器不會重排序將C排在A,B之前。但是A,B之間沒有依賴,所以可能被進行重排序,最終的執行順序有兩種:
A->B->C;
B->A->C;
這兩種執行順序對最終結果不會造成影響。
因為存在重排序,所以單線程程序不一定按照程序的順序來執行。
該文主要講述了一些偏概念的東西,先有一些印象,后續會以代碼示例的形式進行全面的復習。