java基礎解析系列(五)---HashMap並發下的問題以及HashTable和CurrentHashMap的區別


java基礎解析系列(五)---HashMap並發下的問題以及HashTable和CurrentHashMap的區別

目錄

HashMap造成的死循環

resize分析

void resize(int newCapacity) {
472         Entry[] oldTable = table;
473         int oldCapacity = oldTable.length;
474         if (oldCapacity == MAXIMUM_CAPACITY) {
475             threshold = Integer.MAX_VALUE;
476             return;
477         }
478 
479         Entry[] newTable = new Entry[newCapacity];
480         transfer(newTable);
481         table = newTable;
482         threshold = (int)(newCapacity * loadFactor);
483     }
void transfer(Entry[] newTable) {
489         Entry[] src = table;
490         int newCapacity = newTable.length;
491         for (int j = 0; j < src.length; j++) {
492             Entry<K,V> e = src[j];
493             if (e != null) {
494                 src[j] = null;
495                 do {
496                     Entry<K,V> next = e.next;//用於判斷后面循環是否繼續
497                     int i = indexFor(e.hash, newCapacity);
498                     e.next = newTable[i];
499                     newTable[i] = e;
500                     e = next;
501                 } while (e != null);
502             }
503         }
504     }
  • 當hashmap大小超過閾值的時候,會進行擴容
  • 看看第497到500行代碼做了什么
  • 取出原table中的一個Entry e
  • 計算該Entry e的在新表的新下標,然后將新table該下標的Entry從新table拿出來,作為Entry e的next,再把將e放到newTable,newTable[i]=e
  • 那么其實他做的就是在原table的Entry取出來,計算他的新下標,然后將這個Entry放入新的table,放入新table的時候,是做為鏈頭,原來的Entry接在后面,實際上就相當於鏈表的頭插法

並發情況下的resize

  • put完成之后的結果

  • 如果此時有兩個線程,線程一完成resize,結果如下

  • 此前線程二之前只執行了第一層Entry<K,V> next = e.next,所以對於線程二來說,此時e為3,next是7(這個是判斷后面循環是否終止),然后繼續resize

  • 執行497到501的代碼

  • while(e!=null),此時e為7,e不為空,進入第二次循環
  • next=e.next,即next為7的next(這個是判斷后面循環是否終止),也就是3(線程一的結果),把7放到鏈表前頭

  • while(e!=null),此時e=3,e不等於null,進入第三次循環

  • next=e.next(這個是判斷后面循環是否終止),即3的next,也就是null(造成后面循環終止)

  • 放置3這個Entry,3的next設為7(e.next = newTable[i];),而上一步7的next是3,這樣就造成了一個循環

  • while(e!=null),e為null循環終止
  • 那么如果此時get一個鍵,如果這個鍵的hash值剛好和3相同,那么這個時候就會遍歷鏈表進行查找,而這個鏈表是個循環鏈表,就會造成死循環
  • 因此hashmap並不是線程安全

HashTable

對比



public synchronized V get(Object key){}
public synchronized V put(K key, V value) {}
public synchronized V remove(Object key){}
  • 用一個表來描述HashMap和HashTable的主要區別
對比 HashMap HashTable
鍵值 鍵和value允許null 不行
synchronized 非synchronzied synchronized
單線程情況下速度
擴容方式 2倍 2倍+1
容量 初始為16,必須為2的n次方 初始為11

缺點

  • 單線程情況下,也會加鎖

ConcurrentHashMap

HashEntry類


 static final class HashEntry<K,V> {
219         final K key;
220         final int hash;
221         volatile V value;
222         final HashEntry<K,V> next;
223 
224         HashEntry(K key, int hash, HashEntry<K,V> next, V value) {
225             this.key = key;
226             this.hash = hash;
227             this.next = next;
228             this.value = value;
229         }
230 
231         @SuppressWarnings("unchecked")
232         static final <K,V> HashEntry<K,V>[] More ...newArray(int i) {
233             return new HashEntry[i];
234         }
235     }

Segment類

static final class Segment<K,V> extends ReentrantLock implements Serializable {
transient volatile HashEntry<K,V>[] table

315         final float loadFactor;
316 
317         Segment(int initialCapacity, float lf) {
318             loadFactor = lf;
319             setTable(HashEntry.<K,V>newArray(initialCapacity));
320         }
321 

231         @SuppressWarnings("unchecked")
232         static final <K,V> HashEntry<K,V>[] newArray(int i) {
233             return new HashEntry[i];
234         }

        
Sets table to new HashEntry array. Call only while holding lock or in constructor.
330 
331         void setTable(HashEntry<K,V>[] newTable) {
332             threshold = (int)(newTable.length * loadFactor);
333             table = newTable;
334         }
  • Segment繼承了ReentrantLock顯示鎖
  • 一個Segement對象維護這一個HashEntry數組
  • 構造方法里面調用了newArray方法,這個方法用於創建一個HashEntry數組

CurrentHashMap構造方法

612     public .ConcurrentHashMap(int initialCapacity,
613                              float loadFactor, int concurrencyLevel) {
614         if (!(loadFactor > 0) || initialCapacity < 0 || concurrencyLevel <= 0)
615             throw new IllegalArgumentException();
616 
617         if (concurrencyLevel > MAX_SEGMENTS)
618             concurrencyLevel = MAX_SEGMENTS;
619 
620         // Find power-of-two sizes best matching arguments
621         int sshift = 0;
622         int ssize = 1;
623         while (ssize < concurrencyLevel) {
624             ++sshift;
625             ssize <<= 1;
626         }
627         segmentShift = 32 - sshift;
628         segmentMask = ssize - 1;
629         this.segments = Segment.newArray(ssize);
630 
631         if (initialCapacity > MAXIMUM_CAPACITY)
632             initialCapacity = MAXIMUM_CAPACITY;
633         int c = initialCapacity / ssize;
634         if (c * ssize < initialCapacity)
635             ++c;
636         int cap = 1;
637         while (cap < c)
638             cap <<= 1;
639 
640         for (int i = 0; i < this.segments.length; ++i)
641             this.segments[i] = new Segment<K,V>(cap, loadFactor);
642     }

  • 629行創建了一個Segment數組
  • 640-641為Segment數組中的每一個Segment創建一個HashEntry數組
  • 那么實際上初始化的時候是先創建一個Segemnt數組,然后每個Segment又創建一個HashEntry數組,可以類比二維數組

CurrentHashMap的put方法

 public V put(K key, V value) {
908         if (value == null)
909             throw new NullPointerException();
910         int hash = hash(key.hashCode());
911         return segmentFor(hash).put(key, hash, value, false);
912     }

200     final Segment<K,V> segmentFor(int hash) {
201         return segments[(hash >>> segmentShift) & segmentMask];
202     }
  • put的時候通過segmentFor找到segments數組的下標,然后在該segemnt存放鍵值對,實際上就是找到一個HashEntry數組,然后添加到該數組其中一個鏈表中

Segment的put方法

444         V put(K key, int hash, V value, boolean onlyIfAbsent) {
445             lock();
446             try {
447                 int c = count;
448                 if (c++ > threshold) // ensure capacity
449                     rehash();
450                 HashEntry<K,V>[] tab = table;
451                 int index = hash & (tab.length - 1);
452                 HashEntry<K,V> first = tab[index];
453                 HashEntry<K,V> e = first;
454                 while (e != null && (e.hash != hash || !key.equals(e.key)))
455                     e = e.next;
456 
457                 V oldValue;
458                 if (e != null) {
459                     oldValue = e.value;
460                     if (!onlyIfAbsent)
461                         e.value = value;
462                 }
463                 else {
464                     oldValue = null;
465                     ++modCount;
466                     tab[index] = new HashEntry<K,V>(key, hash, first, value);
467                     count = c; // write-volatile
468                 }
469                 return oldValue;
470             } finally {
471                 unlock();
472             }
473         }
  • 在前面已經知道Segment繼承了顯式鎖,從445看出,代碼會執行lock方法,也就是加鎖,這是對於一個Segment的,那么也就是如果put的時候找到的Segemnt是不一樣的,那么put的時候不是鎖對象不同就不會產生競爭,這就是相對於HashTable來說的一個優點,不會任何時候都加鎖

CurrentHashMap的get方法

795     public V get(Object key) {
796         int hash = hash(key.hashCode());
797         return segmentFor(hash).get(key, hash);
798     }
  • 和put一樣,先在segments數組中找到一個segment,然后執行他的get方法

Segment的get方法

362         V get(Object key, int hash) {
363             if (count != 0) { // read-volatile
364                 HashEntry<K,V> e = getFirst(hash);
365                 while (e != null) {
366                     if (e.hash == hash && key.equals(e.key)) {
367                         V v = e.value;
368                         if (v != null)
369                             return v;
370                         return readValueUnderLock(e); // recheck
371                     }
372                     e = e.next;
373                 }
374             }
375             return null;
376         }
377 
  • getFirst方法找到在Entry數組中對應位置的鏈表的鏈頭,然后對鏈表進行遍歷
  • 看下370行的readValueUnderLock方法,源碼也注釋了recheck,作用就是在找當找到對應的鍵后並且value為null的時候,再進行一次查找。

readValueUnderLock

351         V readValueUnderLock(HashEntry<K,V> e) {
352             lock();
353             try {
354                 return e.value;
355             } finally {
356                 unlock();
357             }
358         }
  • 這次查找會進行加鎖,這個過程可能讀到最近覆蓋的一個非空的value,這是對比HashTable的第二個好處,hashtable是對get用synchronized修飾,CurrentHashMap不會在get的時候全程加鎖,減小鎖的粒度,甚至不加鎖

我覺得分享是一種精神,分享是我的樂趣所在,不是說我覺得我講得一定是對的,我講得可能很多是不對的,但是我希望我講的東西是我人生的體驗和思考,是給很多人反思,也許給你一秒鍾、半秒鍾,哪怕說一句話有點道理,引發自己內心的感觸,這就是我最大的價值。(這是我喜歡的一句話,也是我寫博客的初衷)

作者:jiajun 出處: http://www.cnblogs.com/-new/
本文版權歸作者和博客園共有,歡迎轉載,但未經作者同意必須保留此段聲明,且在文章頁面明顯位置給出原文連接,否則保留追究法律責任的權利。如果覺得還有幫助的話,可以點一下右下角的【推薦】,希望能夠持續的為大家帶來好的技術文章!想跟我一起進步么?那就【關注】我吧。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM