並發編程之ThreadLocal

本文轉載自查看原文 2021-04-22 09:18 606 並發編程

並發編程之ThreadLocal

前言

當多線程訪問共享可變數據時，涉及到線程間同步的問題，並不是所有時候，都要用到共享數據，所以就需要線程封閉出場了。

數據都被封閉在各自的線程之中，就不需要同步，這種通過將數據封閉在線程中而避免使用同步的技術稱為線程封閉。

本文主要介紹線程封閉中的其中一種體現：ThreadLocal，將會介紹什么是 ThreadLocal；從 ThreadLocal 源碼角度分析，最后介紹 ThreadLocal 的應用場景。

什么是ThreadLocal

ThreadLocal 是 Java 里一種特殊變量，它是一個線程級別變量，每個線程都有一個 ThreadLocal 就是每個線程都擁有了自己獨立的一個變量，競態條件被徹底消除了，在並發模式下是絕對安全的變量。

可以通過 ThreadLocal value = new ThreadLocal (); 來使用。

會自動在每一個線程上創建一個 T 的副本，副本之間彼此獨立，互不影響，可以用 ThreadLocal 存儲一些參數，以便在線程中多個方法中使用，用以代替方法傳參的做法。

下面通過例子來了解下 ThreadLocal：

@Slf4j
public class ThreadLocalUtil {

    /**
     * static 確保全局只有一個保存 String 對象的 ThreadLocal 實例
     * final 確保 ThreadLocal 實例不可更改 防止被意外改變 導致存入的值和取出的值不一致，並且還能防止 ThreadLocal 實例內存泄漏
     */
    private static final ThreadLocal<String> THREAD_LOCAL = new ThreadLocal<>();

    public static void main(String[] args) throws InterruptedException {
        // 主線程設置值
        THREAD_LOCAL.set("主線程值");
        String v = THREAD_LOCAL.get();
        log.info("線程pool-1-thread-1執行之前，" + Thread.currentThread().getName() + " 線程獲取到的值為：{}", v);
        ExecutorService executorService = Executors.newFixedThreadPool(1);
        executorService.submit(() -> {
            String s = THREAD_LOCAL.get();
            log.info(Thread.currentThread().getName() + " 線程獲取到的值為：{}", s);
            // 子線程設置值
            THREAD_LOCAL.set("子線程值");
            s = THREAD_LOCAL.get();
            log.info("重新設置值之后，" + Thread.currentThread().getName() + " 線程獲取到的值為：{}", s);
            log.info(Thread.currentThread().getName() + "線 程執行結束");
            THREAD_LOCAL.remove();
        });
        // 等待子線程執行結束
        Thread.sleep(1000L);
        v = THREAD_LOCAL.get();
        log.info("線程pool-1-thread-1執行之后，" + Thread.currentThread().getName() + " 線程獲取到的值為：{}", v);
        THREAD_LOCAL.remove();
    }

}

首先通過 static final 定義了一個 THREAD_LOCAL 變量，其中 static 是為了確保全局只有一個保存 String 對象的 ThreadLocal 實例；

final 確保 ThreadLocal 的實例不可更改，防止被意外改變，導致放入的值和取出來的不一致，另外還能防止 ThreadLocal 的內存泄漏。上面的例子是演示在不同的線程中獲取它會得到不同的結果，運行結果如下：

14:33:42.176 [main] INFO com.linkcld.redis.util.ThreadLocalUtil - 線程pool-1-thread-1執行之前，main 線程獲取到的值為：主線程值
14:33:42.307 [pool-1-thread-1] INFO com.linkcld.redis.util.ThreadLocalUtil - pool-1-thread-1 線程獲取到的值為：null
14:33:42.307 [pool-1-thread-1] INFO com.linkcld.redis.util.ThreadLocalUtil - 重新設置值之后，pool-1-thread-1 線程獲取到的值為：子線程值
14:33:42.307 [pool-1-thread-1] INFO com.linkcld.redis.util.ThreadLocalUtil - pool-1-thread-1線 程執行結束
14:33:43.307 [main] INFO com.linkcld.redis.util.ThreadLocalUtil - 線程pool-1-thread-1執行之后，main 線程獲取到的值為：主線程值

首先在 pool-1-thread-1 線程執行之前，先給 THREAD_LOCAL 設置為 主線程值，然后可以取到這個值，然后通過創建一個新的線程以后去取這個值，發現新線程取到的為 null，意外着這個變量在不同線程中取到的值是不同的，不同線程之間對於 ThreadLocal 會有對應的副本，接着在線程 pool-1-thread-1 中執行對 THREAD_LOCAL 的修改，將值改為 子線程值，可以發現線程 pool-1-thread-1 獲取的值變為了 子線程值，主線程依然會讀取到屬於它的副本數據 主線程值，這就是線程的封閉。

看到這里，我相信大家一定會好奇 ThreadLocal 是如何做到多個線程對同一對象 set 操作，但是 get 獲取的值還都是每個線程 set 的值呢，接下來就讓我們進入源碼解析環節：

ThreadLocal 源碼解析

首先看下 ThreadLocal 都有哪些重要屬性：

// 當前 ThreadLocal 的 hashCode 由 nextHashCode 計算得來的，用於計算當前 ThreadLocal 再 ThreadLocalMap 中的索引位置
private final int threadLocalHashCode = nextHashCode();
// 哈希魔數，主要與斐波那契散列法和黃金分割相關
private static final int HASH_INCREMENT = 0x61c88647;
// 返回計算出的hash值，其值為 i * HASH_INCREMENT，其中 i 代表調用次數
private static int nextHashCode() {
    return nextHashCode.getAndAdd(HASH_INCREMENT);
}
// 保證了一台機器上，每個 ThreadLocal 的 threadLocalHashCode 值是唯一的
rivate static AtomicInteger nextHashCode = new AtomicInteger();

其中的 HASH_INCREMENT 也不是隨便取的，它轉化為十進制是 1640531527，2654435769 轉換成 int 類型就是 -1640531527，2654435769 等於 (√5-1)/2 乘以 2 的 32 次方。(√5-1)/2 就是黃金分割數，近似為 0.618，也就是說 0x61c88647 理解為一個黃金分割數乘以 2 的 32 次方，它可以保證 nextHashCode 生成的哈希值，均勻的分布在 2 的冪次方上，且小於 2 的 32 次方。

下面用例子來證明下：

@Slf4j
public class ThreadLocalUtil2 {

    private static final int HASH_INCREMENT = 0x61c88647;

    public static void main(String[] args) {
        int n = 5;
        int max = 2 << (n - 1);
        for (int i = 0; i < max; i++) {
            System.out.print(i * HASH_INCREMENT & (max - 1));
            System.out.print(" ");
        }
    }

}

運行結果為：

0 7 14 21 28 3 10 17 24 31 6 13 20 27 2 9 16 23 30 5 12 19 26 1 8 15 22 29 4 11 18 25

可以發現元素索引值完美的散列在數組當中，並沒有出現沖突。

ThreadLocalMap

除了上述屬性外，還有一個重要的屬性 ThreadLocalMap，ThreadLocalMap 是 ThreadLocal 的靜態內部類，當一個線程有多個 ThreadLocal 時，需要一個容器來管理多個 ThreadLocal，ThreadLocalMap 的作用就是管理線程中多個 ThreadLocal，源碼如下：

static class ThreadLocalMap {
    // 鍵值對的存儲結構
    static class Entry extends WeakReference<ThreadLocal<?>> {
        // ThreadLocal 對應的value值
        Object value;
        
        Entry(ThreadLocal<?> k, Object v) {
            // ThreadLocal 是弱引用的，當GC時會被回收掉，但是 value 不會被回收
            super(k);
            value = v;
        }
    }
    // 默認初始容量 16 必須是2的冪
    private static final int INITIAL_CAPACITY = 16;
    // 底層時 Entry 數組，根據需要進行擴容，數組的大小必須是 2 的冪
    private Entry[] table;
    // 數組的大小
    private int size = 0;
    // 數組的擴容閾值 默認是 0
    private int threshold;
    // 數組擴容閾值為 長度的 2/3
    private void setThreshold(int len) {
        threshold = len * 2 / 3;
    }

}

從源碼中看到 ThreadLocalMap 其實就是一個簡單的 Map 結構，底層是數組，有初始化大小，也有擴容閾值大小，數組的元素是 Entry，Entry 的 key 就是 ThreadLocal 的引用，value 是 ThreadLocal 的值。ThreadLocalMap 解決 hash 沖突的方式采用的是線性探測法，如果發生沖突會繼續尋找下一個空的位置。

這樣的就有可能會發生內存泄漏的問題，下面讓我們進行分析：

ThreadLocal 內存泄漏

ThreadLocal 在沒有外部強引用時，發生 GC 時會被回收，那么 ThreadLocalMap 中保存的 key 值就變成了 null，而 Entry 又被 threadLocalMap 對象引用，threadLocalMap 對象又被 Thread 對象所引用，那么當 Thread 一直不終結的話，value 對象就會一直存在於內存中，也就導致了內存泄漏，直至 Thread 被銷毀后，才會被回收。

那么如何避免內存泄漏呢？

在使用完 ThreadLocal 變量后，需要我們手動 remove 掉，防止 ThreadLocalMap 中 Entry 一直保持對 value 的強引用，導致 value 不能被回收，其中 remove 源碼如下所示：

public void remove() {
    ThreadLocalMap m = getMap(Thread.currentThread());
    if (m != null)
        m.remove(this);
}

remove 方法的時序圖如下所示：

remove 方法是先獲取到當前線程的 ThreadLocalMap，並且調用了它的 remove 方法，從 map 中清理當前 ThreadLocal 對象關聯的鍵值對，這樣 value 就可以被 GC 回收了。

那么 ThreadLocal 是如何實現線程隔離的呢？

ThreadLocal 的 set 方法

我們先去看下 ThreadLocal 的 set 方法，源碼如下：

// set 方法
public void set(T value) {
    // 獲取當前thread信息 
    Thread t = Thread.currentThread();
    // 獲取當前線程所在的 ThreadLocalMap
    ThreadLocalMap map = getMap(t);
    // map 不為空直接set值
    if (map != null)
        map.set(this, value);
    else
    // map 為空時，需要先創建 map
        createMap(t, value);
}

// 創建map，並保存值
void createMap(Thread t, T firstValue) {
    t.threadLocals = new ThreadLocalMap(this, firstValue);
}

set 方法的作用是把我們想要存儲的 value 給保存進去。set 方法的流程主要是：

先獲取到當前線程的引用
利用這個引用來獲取到 ThreadLocalMap
如果 map 為空，則去創建一個 ThreadLocalMap
如果 map 不為空，就利用 ThreadLocalMap 的 set 方法將 value 添加到 map 中

set 方法的時序圖如下所示：

其中 map 就是我們上面講到的 ThreadLocalMap，可以看到它是通過當前線程對象獲取到的 ThreadLocalMap，接下來我們看 getMap方法的源代碼：

ThreadLocalMap getMap(Thread t) {
    return t.threadLocals;
}

getMap 方法的作用主要是獲取當前線程內的 ThreadLocalMap 對象，原來這個 ThreadLocalMap 是線程的一個屬性，下面讓我們看看 Thread 中的相關代碼：

// ThreadLocalMap 是線程的一個屬性，所以可以保證在多線程環境下的線程安全
ThreadLocal.ThreadLocalMap threadLocals = null;

可以看出每個線程都有 ThreadLocalMap 對象，被命名為 threadLocals，默認為 null，所以每個線程的 ThreadLocals 都是隔離獨享的。

調用 ThreadLocalMap.set() 時，會把當前 threadLocal 對象作為 key，想要保存的對象作為 value，存入 map。

其中 ThreadLocalMap.set() 的源碼如下：

// ThreadLocalMap set 方法
private void set(ThreadLocal<?> key, Object value) {
    
    Entry[] tab = table;
    int len = tab.length;
    // 計算 key 在數組中的下標
    int i = key.threadLocalHashCode & (len-1);
    // 遍歷數組，找到 threadLocal 對象
    for (Entry e = tab[i]; e != null; e = tab[i = nextIndex(i, len)]) {
        // 獲取下標位置處的 ThreadLocal 對象
        ThreadLocal<?> k = e.get();
        // 鍵值 ThreadLocal 匹配成功的話，直接更新 map 對於下標的 value 值
        if (k == key) {
            e.value = value;
            return;
        }
        
        // 如果 key 不存在的話，說明 ThreadLocal 被GC清理了，直接替換掉 
        if (k == null) {
            // 替換 Entry 方法
            replaceStaleEntry(key, value, i);
            return;
        }
    }
    // 直接遇到了空槽也沒有匹配到ThreadLocal對象，那么在此空槽處保存ThreadLocal對象和value值
    tab[i] = new Entry(key, value);
    // 數組長度+1
    int sz = ++size;
    // 如果沒有卡槽需要清理並且數組長度 大於等於 數組長度的 2/3，數組需要擴容
    if (!cleanSomeSlots(i, sz) && sz >= threshold)
        // 擴容的過程就是對所有的 key 進行重新哈希的過程
        rehash();
}

// 判斷是否有卡槽需要清理的方法
private boolean cleanSomeSlots(int i, int n) {
    boolean removed = false;
    Entry[] tab = table;
    int len = tab.length;
    do {
        i = nextIndex(i, len);
        Entry e = tab[i];
        if (e != null && e.get() == null) {
            n = len;
            removed = true;
            // 清理卡槽的數據
            i = expungeStaleEntry(i);
        }
    } while ( (n >>>= 1) != 0);
    return removed;
}

相信到這里，大家應該對 Thread、ThreadLocal 以及 ThreadLocalMap 的關系有了進一步的理解，下圖為三者之間的關系：

ThreadLocal 的 get 方法

了解完 set 方法后，讓我們看下 get 方法，源碼如下：

// ThreadLocal get 方法
public T get() {
    // 獲取當前線程 
    Thread t = Thread.currentThread();
    // 獲取ThreadLocalMap 方法
    ThreadLocalMap map = getMap(t);
    if (map != null) {
        ThreadLocalMap.Entry e = map.getEntry(this);
        if (e != null) {
            @SuppressWarnings("unchecked")
            T result = (T)e.value;
            return result;
        }
    }
    // 如果 map 為空的話，需要初始化 map 
    return setInitialValue();
}

// 初始化 map 方法，返回的值 null
private T setInitialValue() {
    T value = initialValue();
    Thread t = Thread.currentThread();
    ThreadLocalMap map = getMap(t);
    if (map != null)
        map.set(this, value);
    else
        createMap(t, value);
    return value;
}

get 方法的主要流程為：

先獲取到當前線程的引用
獲取當前線程內部的 ThreadLocalMap
如果 map 存在，則獲取當前 ThreadLocal 對應的 value 值
如果 map 不存在或者找不到 value 值，則調用 setInitialValue() 進行初始化

get 方法的時序圖如下所示：

其中每個 Thread 的 ThreadLocalMap 以 threadLocal 作為 key，保存自己線程的 value 副本，也就是保存在每個線程中，並沒有保存在 ThreadLocal 對象中。

其中 ThreadLocalMap.getEntry() 方法的源碼如下

private Entry getEntry(ThreadLocal<?> key) {
    int i = key.threadLocalHashCode & (table.length - 1);
    Entry e = table[i];
    if (e != null && e.get() == key)
        return e;
    else
        return getEntryAfterMiss(key, i, e);
}

ThreadLocalMap 的 resize 方法

當 ThreadLocalMap 中的 ThreadLocal 的個數超過容量閾值時，ThreadLocalMap 就要開始擴容了，我們一起來看下 resize 的源代碼：

// 當需要擴容的時候，需要重新哈希
private void rehash() {
    // 清除需要清理的卡槽
    expungeStaleEntries();

    // 使用較低的閾值進行加倍以避免磁滯。2/3 * size * 3/4 = 1/2 * size
    if (size >= threshold - threshold / 4)
        // 擴容
        resize();
}

// 擴容算法，數組容量 * 2
private void resize() {
    Entry[] oldTab = table;
    int oldLen = oldTab.length;
    // 新的數組長度 = 舊長度*2
    int newLen = oldLen * 2;
    Entry[] newTab = new Entry[newLen];
    int count = 0;
    // 將數據重新哈希之后放到新數組中
    for (int j = 0; j < oldLen; ++j) {
        Entry e = oldTab[j];
        if (e != null) {
            ThreadLocal<?> k = e.get();
            // 如果有需要清理的ThreadLocal，把value置空，方便GC回收
            if (k == null) {
                e.value = null; // Help the GC
            } else {
                int h = k.threadLocalHashCode & (newLen - 1);
                while (newTab[h] != null)
                    h = nextIndex(h, newLen);
                newTab[h] = e;
                count++;
            }
        }
    }
    // 設置新的擴容閾值
    setThreshold(newLen);
    size = count;
    table = newTab;
}

resize 方法主要是進行擴容，同時會將垃圾值標記方便 GC 回收，擴容后數組大小是原來數組的兩倍。

ThreadLocal 應用場景

ThreadLocal 的特性也導致了應用場景比較廣泛，主要的應用場景如下：

線程間數據隔離，各線程的 ThreadLocal 互不影響
方便同一個線程使用某一對象，避免不必要的參數傳遞
全鏈路追蹤中的 traceId 或者流程引擎中上下文的傳遞一般采用 ThreadLocal
Spring 事務管理器采用了 ThreadLocal
Spring MVC 的 RequestContextHolder 的實現使用了 ThreadLocal

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 並發編程之：Lock 並發編程之：線程並發編程之：CountDownLatch Java並發編程：深入剖析ThreadLocal Java並發編程：深入剖析ThreadLocal 並發編程之異步爬蟲並發編程之：線程池（一） Java並發編程之ThreadGroup 並發編程之：協程並發編程之Fork/Join