Java編程的邏輯 (74) - 並發容器 - ConcurrentHashMap

本文轉載自查看原文 2017-03-16 08:31 1852 並發/ 程序思維/ 線程

本系列文章經補充和完善，已修訂整理成書《Java編程的邏輯》，由機械工業出版社華章分社出版，於2018年1月上市熱銷，讀者好評如潮！各大網店和書店有售，歡迎購買，京東自營鏈接：http://item.jd.com/12299018.html

本節介紹一個常用的並發容器 - ConcurrentHashMap，它是HashMap的並發版本，與HashMap相比，它有如下特點：

並發安全
直接支持一些原子復合操作
支持高並發、讀操作完全並行、寫操作支持一定程度的並行
與同步容器Collections.synchronizedMap相比，迭代不用加鎖，不會拋出ConcurrentModificationException
弱一致性

我們分別來看下。

並發安全

我們知道，HashMap不是並發安全的，在並發更新的情況下，HashMap的鏈表結構可能形成環，出現死循環，占滿CPU，我們看個例子：

public static void unsafeConcurrentUpdate() {
    final Map<Integer, Integer> map = new HashMap<>();
    for (int i = 0; i < 100; i++) {
        Thread t = new Thread() {
            Random rnd = new Random();

            @Override
            public void run() {
                for (int i = 0; i < 100; i++) {
                    map.put(rnd.nextInt(), 1);
                }
            }
        };
        t.start();
    }
}

運行上面的代碼，在我的機器上，每次都會出現死循環，占滿CPU。

為什么會出現死循環呢？死循環出現在多個線程同時擴容哈希表的時候，不是同時更新一個鏈表的時候，那種情況可能會出現更新丟失，但不會死循環，具體過程比較復雜，我們就不解釋了，感興趣的讀者可以參考這篇文章，http://coolshell.cn/articles/9606.html。

使用Collections.synchronizedMap方法可以生成一個同步容器，避免該問題，替換第一行代碼即可：

final Map<Integer, Integer> map = Collections.synchronizedMap(new HashMap<Integer, Integer>());

在Java中，HashMap還有一個同步版本Hashtable，它與使用synchronizedMap生成的Map基本是一樣的，也是在每個方法調用上加了synchronized，我們就不贅述了。

同步容器有幾個問題：

每個方法都需要同步，支持的並發度比較低
對於迭代和復合操作，需要調用方加鎖，使用比較麻煩，且容易忘記

ConcurrentHashMap沒有這些問題，它同樣實現了Map接口，也是基於哈希表實現的，上面的代碼替換第一行即可：

final Map<Integer, Integer> map = new ConcurrentHashMap<>();

原子復合操作

除了Map接口，ConcurrentHashMap還實現了一個接口ConcurrentMap，接口定義了一些條件更新操作，具體定義為：

public interface ConcurrentMap<K, V> extends Map<K, V> {
    //條件更新，如果Map中沒有key，設置key為value，返回原來key對應的值，如果沒有，返回null
    V putIfAbsent(K key, V value);
    //條件刪除，如果Map中有key，且對應的值為value，則刪除，如果刪除了，返回true，否則false
    boolean remove(Object key, Object value);
    //條件替換，如果Map中有key，且對應的值為oldValue，則替換為newValue，如果替換了，返回ture，否則false
    boolean replace(K key, V oldValue, V newValue);
    //條件替換，如果Map中有key，則替換值為value，返回原來key對應的值，如果原來沒有，返回null
    V replace(K key, V value);
}

如果使用同步容器，調用方必須加鎖，而ConcurrentMap將它們實現為了原子操作。實際上，使用ConcurrentMap，調用方也沒有辦法進行加鎖，它沒有暴露鎖接口，也不使用synchronized。

高並發

ConcurrentHashMap是為高並發設計的，它是怎么做的呢？具體實現比較復雜，我們簡要介紹其思路，主要有兩點：

分段鎖
讀不需要鎖

同步容器使用synchronized，所有方法，競爭同一個鎖，而ConcurrentHashMap采用分段鎖技術，將數據分為多個段，而每個段有一個獨立的鎖，每一個段相當於一個獨立的哈希表，分段的依據也是哈希值，無論是保存鍵值對還是根據鍵查找，都先根據鍵的哈希值映射到段，再在段對應的哈希表上進行操作。

采用分段鎖，可以大大提高並發度，多個段之間可以並行讀寫。默認情況下，段是16個，不過，這個數字可以通過構造方法進行設置，如下所示：

public ConcurrentHashMap(int initialCapacity, float loadFactor, int concurrencyLevel)

concurrencyLevel表示估計的並行更新的線程個數，ConcurrentHashMap會將該數轉換為2的整數次冪，比如14轉換為16，25轉換為32。

在對每個段的數據進行讀寫時，ConcurrentHashMap也不是簡單的使用鎖進行同步，內部使用了CAS、對一些寫采用原子方式，實現比較復雜，我們就不介紹了，實現的效果是，對於寫操作，需要獲取鎖，不能並行，但是讀操作可以，多個讀可以並行，寫的同時也可以讀，這使得ConcurrentHashMap的並行度遠遠大於同步容器。

迭代

我們在66節介紹過，使用同步容器，在迭代中需要加鎖，否則可能會拋出ConcurrentModificationException。ConcurrentHashMap沒有這個問題，在迭代器創建后，在迭代過程中，如果另一個線程對容器進行了修改，迭代會繼續，不會拋出異常。

問題是，迭代會反映別的線程的修改？還是像上節介紹的CopyOnWriteArrayList一樣，反映的是創建時的副本？答案是，都不是！我們看個例子：

public class ConcurrentHashMapIteratorDemo {
    public static void test() {
        final ConcurrentHashMap<String, String> map = new ConcurrentHashMap<>();
        map.put("a", "abstract");
        map.put("b", "basic");

        Thread t1 = new Thread() {
            @Override
            public void run() {
                for (Entry<String, String> entry : map.entrySet()) {
                    try {
                        Thread.sleep(1000);
                    } catch (InterruptedException e) {
                    }
                    System.out.println(entry.getKey() + "," + entry.getValue());
                }
            }
        };
        t1.start();
        // 確保線程t1啟動
        try {
            Thread.sleep(100);
        } catch (InterruptedException e) {
        }
        map.put("c", "call");
    }

    public static void main(String[] args) {
        test();
    }
}

t1啟動后，創建迭代器，但在迭代輸出每個元素前，先睡眠1秒鍾，主線程啟動t1后，先睡眠一下，確保t1先運行，然后給map增加了一個元素，程序輸出為：

a,abstract
b,basic
c,call

說明，迭代器反映了最新的更新，但我們將添加語句更改為：

map.put("g", "call");

你會發現，程序輸出為：

a,abstract
b,basic

這說明，迭代器沒有反映最新的更新，這是怎么回事呢？我們需要理解ConcurrentHashMap的弱一致性。

弱一致性

ConcurrentHashMap的迭代器創建后，就會按照哈希表結構遍歷每個元素，但在遍歷過程中，內部元素可能會發生變化，如果變化發生在已遍歷過的部分，迭代器就不會反映出來，而如果變化發生在未遍歷過的部分，迭代器就會發現並反映出來，這就是弱一致性。

類似的情況還會出現在ConcurrentHashMap的另一個方法：

//批量添加m中的鍵值對到當前Map
public void putAll(Map<? extends K, ? extends V> m)

該方法並非原子操作，而是調用put方法逐個元素進行添加的，在該方法沒有結束的時候，部分修改效果就會體現出來。

小結

本節介紹了ConcurrentHashMap，它是並發版的HashMap，通過分段鎖和其他技術實現了高並發，支持原子條件更新操作，不會拋出ConcurrentModificationException，實現了弱一致性。

Java中沒有並發版的HashSet，但可以通過Collections.newSetFromMap方法基於ConcurrentHashMap構建一個。

我們知道HashMap/HashSet基於哈希，不能對元素排序，對應的可排序的容器類是TreeMap/TreeSet，並發包中可排序的對應版本不是基於樹，而是基於Skip List（跳躍表）的，類分別是ConcurrentSkipListMap和ConcurrentSkipListSet，它們到底是什么呢？

(與其他章節一樣，本節所有代碼位於 https://github.com/swiftma/program-logic)

----------------

未完待續，查看最新文章，敬請關注微信公眾號“老馬說編程”(掃描下方二維碼)，從入門到高級，深入淺出，老馬和你一起探索Java編程及計算機技術的本質。用心原創，保留所有版權。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Java並發容器--ConcurrentHashMap Java編程的邏輯 (76) - 並發容器 - 各種隊列 Java並發容器——ConcurrentSkipListMap和ConcurrentHashMap Java並發容器——ConcurrentSkipListMap和ConcurrentHashMap Java編程的邏輯 (75) - 並發容器 - 基於SkipList的Map和Set Java並發編程筆記之ConcurrentHashMap原理探究 java並發編程——並發容器【Java並發編程二】同步容器和並發容器 Java並發編程：同步容器 Java編程的邏輯 (73) - 並發容器 - 寫時拷貝的List和Set