深入理解HashMap的擴容機制 (JDK 1.7)


一、什么時候擴容:

網上總結的會有很多,但大多都總結的不夠完整或者不夠准確。大多數可能值說了滿足我下面條件一的情況。

擴容必須滿足兩個條件:

1、 存放新值的時候當前已有元素的個數必須大於等於閾值

2、 存放新值的時候當前存放數據發生hash碰撞(當前key計算的hash值換算出來的數組下標位置已經存在值)

二、下面我們看源碼,如下:

首先是put()方法

public V put(K key, V value) {
    //判斷當前Hashmap(底層是Entry數組)是否存值(是否為空數組)
    if (table == EMPTY_TABLE) {
      inflateTable(threshold);//如果為空,則初始化
    }
    
    //判斷key是否為空
    if (key == null)
      return putForNullKey(value);//hashmap允許key為空
    
    //計算當前key的哈希值    
    int hash = hash(key);
    //通過哈希值和當前數據長度,算出當前key值對應在數組中的存放位置
    int i = indexFor(hash, table.length);
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {
      Object k;
      //如果計算的哈希位置有值(及hash沖突),且key值一樣,則覆蓋原值value,並返回原值value
      if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
        V oldValue = e.value;
        e.value = value;
        e.recordAccess(this);
        return oldValue;
      }
    }
 
    modCount++;
    //存放值的具體方法
    addEntry(hash, key, value, i);
    return null;
  }

   

在put()方法中有調用addEntry()方法,這個方法里面是具體的存值,在存值之前還有判斷是否需要擴容

void addEntry(int hash, K key, V value, int bucketIndex) {
    //1、判斷當前個數是否大於等於閾值
    //2、當前存放是否發生哈希碰撞
    //如果上面兩個條件否發生,那么就擴容
    if ((size >= threshold) && (null != table[bucketIndex])) {
      //擴容,並且把原來數組中的元素重新放到新數組中
      resize(2 * table.length);
      hash = (null != key) ? hash(key) : 0;
      bucketIndex = indexFor(hash, table.length);
    }
 
    createEntry(hash, key, value, bucketIndex);
  }

  

如果需要擴容,調用擴容的方法resize()

void resize(int newCapacity) {
    Entry[] oldTable = table;
    int oldCapacity = oldTable.length;
    //判斷是否有超出擴容的最大值,如果達到最大值則不進行擴容操作
    if (oldCapacity == MAXIMUM_CAPACITY) {
      threshold = Integer.MAX_VALUE;
      return;
    }
 
    Entry[] newTable = new Entry[newCapacity];
    // transfer()方法把原數組中的值放到新數組中
    transfer(newTable, initHashSeedAsNeeded(newCapacity));
    //設置hashmap擴容后為新的數組引用
    table = newTable;
    //設置hashmap擴容新的閾值
    threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
  }

transfer()在實際擴容時候把原來數組中的元素放入新的數組中

void transfer(Entry[] newTable, boolean rehash) {
    int newCapacity = newTable.length;
    for (Entry<K,V> e : table) {
      while(null != e) {
        Entry<K,V> next = e.next;
        if (rehash) {
          e.hash = null == e.key ? 0 : hash(e.key);
        }
        //通過key值的hash值和新數組的大小算出在當前數組中的存放位置
        int i = indexFor(e.hash, newCapacity);
        e.next = newTable[i];
        newTable[i] = e;
        e = next;
      }
    }
  }

  

三、總結:

Hashmap的擴容需要滿足兩個條件:當前數據存儲的數量(即size())大小必須大於等於閾值;當前加入的數據是否發生了hash沖突。

因為上面這兩個條件,所以存在下面這些情況

(1)、就是hashmap在存值的時候(默認大小為16,負載因子0.75,閾值12),可能達到最后存滿16個值的時候,再存入第17個值才會發生擴容現象,因為前16個值,每個值在底層數組中分別占據一個位置,並沒有發生hash碰撞。

(2)、當然也有可能存儲更多值(超多16個值,最多可以存26個值)都還沒有擴容。原理:前11個值全部hash碰撞,存到數組的同一個位置(雖然hash沖突,但是這時元素個數小於閾值12,並沒有同時滿足擴容的兩個條件。所以不會擴容),后面所有存入的15個值全部分散到數組剩下的15個位置(這時元素個數大於等於閾值,但是每次存入的元素並沒有發生hash碰撞,也沒有同時滿足擴容的兩個條件,所以葉不會擴容),前面11+15=26,所以在存入第27個值的時候才同時滿足上面兩個條件,這時候才會發生擴容現象。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM