本文主要講並行優化的幾種方式, 其結構如下:

鎖優化
減少鎖的持有時間
例如避免給整個方法加鎖
1 public synchronized void syncMethod(){
2 othercode1();
3 mutextMethod();
4 othercode2();
5 }
改進后
1 public void syncMethod2(){
2 othercode1();
3 synchronized(this){
4 mutextMethod();
5 }
6 othercode2();
7 }
減小鎖的粒度
將大對象,拆成小對象,大大增加並行度,降低鎖競爭. 如此一來偏向鎖,輕量級鎖成功率提高.
一個簡單的例子就是jdk內置的ConcurrentHashMap與SynchronizedMap.
Collections.synchronizedMap
其本質是在讀寫map操作上都加了鎖, 在高並發下性能一般.

ConcurrentHashMap
內部使用分區Segment來表示不同的部分, 每個分區其實就是一個小的hashtable. 各自有自己的鎖.
只要多個修改發生在不同的分區, 他們就可以並發的進行. 把一個整體分成了16個Segment, 最高支持16個線程並發修改.
代碼中運用了很多volatile聲明共享變量, 第一時間獲取修改的內容, 性能較好.
讀寫分離鎖替代獨占鎖
顧名思義, 用ReadWriteLock將讀寫的鎖分離開來, 尤其在讀多寫少的場合, 可以有效提升系統的並發能力.
- 讀-讀不互斥:讀讀之間不阻塞。
- 讀-寫互斥:讀阻塞寫,寫也會阻塞讀。
- 寫-寫互斥:寫寫阻塞。
鎖分離
在讀寫鎖的思想上做進一步的延伸, 根據不同的功能拆分不同的鎖, 進行有效的鎖分離.
一個典型的示例便是LinkedBlockingQueue,在它內部, take和put操作本身是隔離的,
有若干個元素的時候, 一個在queue的頭部操作, 一個在queue的尾部操作, 因此分別持有一把獨立的鎖.

1 /** Lock held by take, poll, etc */ 2 private final ReentrantLock takeLock = new ReentrantLock(); 3 4 /** Wait queue for waiting takes */ 5 private final Condition notEmpty = takeLock.newCondition(); 6 7 /** Lock held by put, offer, etc */ 8 private final ReentrantLock putLock = new ReentrantLock(); 9 10 /** Wait queue for waiting puts */ 11 private final Condition notFull = putLock.newCondition();
鎖粗化
通常情況下, 為了保證多線程間的有效並發, 會要求每個線程持有鎖的時間盡量短,
即在使用完公共資源后, 應該立即釋放鎖. 只有這樣, 等待在這個鎖上的其他線程才能盡早的獲得資源執行任務.
而凡事都有一個度, 如果對同一個鎖不停的進行請求 同步和釋放, 其本身也會消耗系統寶貴的資源, 反而不利於性能的優化
一個極端的例子如下, 在一個循環中不停的請求同一個鎖.
1 for(int i = 0; i < 1000; i++){
2 synchronized(lock){
3
4 }
5 }
6
7 // 優化后
8 synchronized(lock){
9 for(int i = 0;i < 1000; i++){
10
11 }
12 }
鎖粗化與減少鎖的持有時間, 兩者是截然相反的, 需要在實際應用中根據不同的場合權衡使用.
JDK中各種涉及鎖優化的並發類可以看之前的博文: 並發包總結
ThreadLocal
除了控制有限資源訪問外, 我們還可以增加資源來保證對象線程安全.
對於一些線程不安全的對象, 例如SimpleDateFormat, 與其加鎖讓100個線程來競爭獲取,
不如准備100個SimpleDateFormat, 每個線程各自為營, 很快的完成format工作.
示例
1 public class ThreadLocalDemo {
2
3 public static ThreadLocal<SimpleDateFormat> threadLocal = new ThreadLocal();
4
5 public static void main(String[] args){
6 ExecutorService service = Executors.newFixedThreadPool(10);
7 for (int i = 0; i < 100; i++) {
8 service.submit(new Runnable() {
9 @Override
10 public void run() {
11 if (threadLocal.get() == null) {
12 threadLocal.set(new SimpleDateFormat("yyyy-MM-dd"));
13 }
14
15 System.out.println(threadLocal.get().format(new Date()));
16 }
17 });
18 }
19 }
20 }
原理
對於set方法, 先獲取當前線程對象, 然后getMap()獲取線程的ThreadLocalMap, 並將值放入map中.
該map是線程Thread的內部變量, 其key為threadlocal, vaule為我們set進去的值.
1 public void set(T value) {
2 Thread t = Thread.currentThread();
3 ThreadLocalMap map = getMap(t);
4 if (map != null)
5 map.set(this, value);
6 else
7 createMap(t, value);
8 }
對於get方法, 自然是先拿到map, 然后從map中獲取數據.
1 public T get() {
2 Thread t = Thread.currentThread();
3 ThreadLocalMap map = getMap(t);
4 if (map != null) {
5 ThreadLocalMap.Entry e = map.getEntry(this);
6 if (e != null)
7 return (T)e.value;
8 }
9 return setInitialValue();
10 }
內存釋放
- 手動釋放: 調用threadlocal.set(null)或者threadlocal.remove()即可
- 自動釋放: 關閉線程池, 線程結束后, 自動釋放threadlocalmap.
1 public class StaticThreadLocalTest {
2
3 private static ThreadLocal tt = new ThreadLocal();
4 public static void main(String[] args) throws InterruptedException {
5 ExecutorService service = Executors.newFixedThreadPool(1);
6 for (int i = 0; i < 3; i++) {
7 service.submit(new Runnable() {
8 @Override
9 public void run() {
10 BigMemoryObject oo = new BigMemoryObject();
11 tt.set(oo);
12 // 做些其他事情
13 // 釋放方式一: 手動置null
14 // tt.set(null);
15 // 釋放方式二: 手動remove
16 // tt.remove();
17 }
18 });
19 }
24 // 釋放方式三: 關閉線程或者線程池
25 // 直接new Thread().start()的場景, 會在run結束后自動銷毀線程
26 // service.shutdown();
27
28 while (true) {
29 Thread.sleep(24 * 3600 * 1000);
30 }
31 }
32
33 }
34 // 構建一個大內存對象, 便於觀察內存波動.
35 class BigMemoryObject{
36
37 List<Integer> list = new ArrayList<>();
38
39 BigMemoryObject() {
40 for (int i = 0; i < 10000000; i++) {
41 list.add(i);
42 }
43 }
44 }
內存泄露
內存泄露主要出現在無法關閉的線程中, 例如web容器提供的並發線程池, 線程都是復用的.
由於ThreadLocalMap生命周期和線程生命周期一樣長. 對於一些被強引用持有的ThreadLocal, 如定義為static.
如果在使用結束后, 沒有手動釋放ThreadLocal, 由於線程會被重復使用, 那么會出現之前的線程對象殘留問題,
造成內存泄露, 甚至業務邏輯紊亂.
對於沒有強引用持有的ThreadLocal, 如方法內變量, 是不是就萬事大吉了呢? 答案是否定的.
雖然ThreadLocalMap會在get和set等操作里刪除key 為 null的對象, 但是這個方法並不是100%會執行到.
看ThreadLocalMap源碼即可發現, 只有調用了getEntryAfterMiss后才會執行清除操作,
如果后續線程沒滿足條件或者都沒執行get set操作, 那么依然存在內存殘留問題.
1 private ThreadLocal.ThreadLocalMap.Entry getEntry(ThreadLocal key) {
2 int i = key.threadLocalHashCode & (table.length - 1);
3 ThreadLocal.ThreadLocalMap.Entry e = table[i];
4 if (e != null && e.get() == key)
5 return e;
6 else
7 // 並不是一定會執行
8 return getEntryAfterMiss(key, i, e);
9 }
10
11 private ThreadLocal.ThreadLocalMap.Entry getEntryAfterMiss(ThreadLocal key, int i, ThreadLocal.ThreadLocalMap.Entry e) {
12 ThreadLocal.ThreadLocalMap.Entry[] tab = table;
13 int len = tab.length;
14
15 while (e != null) {
16 ThreadLocal k = e.get();
17 if (k == key)
18 return e;
19 // 刪除key為null的value
20 if (k == null)
21 expungeStaleEntry(i);
22 else
23 i = nextIndex(i, len);
24 e = tab[i];
25 }
26 return null;
27 }
最佳實踐
不管threadlocal是static還是非static的, 都要像加鎖解鎖一樣, 每次用完后, 手動清理, 釋放對象.
無鎖
與鎖相比, 使用CAS操作, 由於其非阻塞性, 因此不存在死鎖問題, 同時線程之間的相互影響,
也遠小於鎖的方式. 使用無鎖的方案, 可以減少鎖競爭以及線程頻繁調度帶來的系統開銷.
例如生產消費者模型中, 可以使用BlockingQueue來作為內存緩沖區, 但他是基於鎖和阻塞實現的線程同步.
如果想要在高並發場合下獲取更好的性能, 則可以使用基於CAS的ConcurrentLinkedQueue.
同理, 如果可以使用CAS方式實現整個生產消費者模型, 那么也將獲得可觀的性能提升, 如Disruptor框架.
關於無鎖, 這邊不再贅述, 之前博文已經有所介紹, 具體見: Java高並發之無鎖與Atomic源碼分析
原文鏈接:https://www.cnblogs.com/xdecode/p/9137804.html
-END-


