淺談HashMap原理，記錄entrySet中的一些疑問

本文轉載自查看原文 2017-10-06 15:27 1461 源代碼解讀/ HashMap/ entrySet/ 原理

HashMap的底層的一些變量：

      transient Node<K,V>[] table;        //存儲數據的Node數組
      
      transient Set<java.util.Map.Entry<K,V>> entrySet;
      
      transient int size;          //map中存放數據的個數，不等於table.length
      
      transient int modCount;         //修改的次數，防止
      
      int threshold;            //臨界值
      
      final float loadFactor;        //擴展因子，一般情況下threshold=table.length*loadFactor;

構造一個空的HashMap時，只有loadFactor被賦值為默認的0.75。代碼如下：

       public HashMapMmc(){
          this.loadFactor=DEFAULT_LOAD_FACTOR;
       }

這里我將介紹三個方法,put get remove,最后介紹entrySet()遍歷。

put()方法：

在調用put(key,value)方法時，底層調用的是這個方法:

 final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
              boolean evict) {
          Node<K,V>[] tab; Node<K,V> p; int n,i;
          if((tab=table)==null||(n=tab.length)==0)
              n=(tab=resize()).length;
          if((p=tab[i=(n-1)&hash])==null)
              tab[i]=newNode(hash,key,value,null);
          else{
              Node<K,V> e;K k;
              if(p.hash==hash&&((k=p.key)==key||(k!=null&&k.equals(key))))
                e=p;
              else if(p instanceof TreeNode)
                  e=((TreeNode<K,V>)p).putTreeVal(this,tab,hash,key,value);
              else{
                  for(int binCount=0;;++binCount){
                      if((e=p.next)==null){
                          p.next=newNode(hash,key,value,null);
                          if(binCount>=TREEIFY_THRESHOLD-1)
                              treeifyBin(tab,hash);
                          break;
                      }
                      if(e.hash==hash&&((k=e.key)==key||(key!=null&&key.equals(k))))
                          break;
                      p=e;
                  }
              }
              if(e!=null){          // existing mapping for key
                  V oldValue=e.value;
                  if(!onlyIfAbsent||oldValue==null)
                      e.value=value;
                  afterNodeAccess(e);
                  return oldValue;
              }
          }
          ++modCount;
          if(++size>threshold)
              resize();
          afterNodeInsertion(evict);
          return null;
      }

這個方法有5個參數，第一個為hash,可以理解為對key經過運算之后的一個值（具體算法:(key==null)?0:(h = key.hashCode())^(h>>>16)),第二個為key，第三個為value，這些都不用說了吧，第四個為onlyIfAbsent,這里代表的是是否覆蓋，如果為false,同樣的key放在map中，后面放入的值會覆蓋原來的值，put方法在調用這個putVal()方法時，onlyIfAbsent寫死為false的，所以HashMap中，是沒有重復的key值的，后來的value會覆蓋原來的value。看下面方法第四個參數：

 public V put(K key,V value ){
          return putVal(hash(key),key,value,false,true);
      }

然后說放入過程：

先檢查table夠不夠存放數據。剛剛new出來的HashMap，table是為空的。在放入時會先進行擴容，按照默認的大小16.
```
 Node<K,V>[] newTab=(Node<K,V>[])new Node[newCap];
```
計算要放入的位置，HashMap是沒有順序的，默認的16個索引位置中，會隨機的找一個放入。（注意：key是可以等於null的，key等於null時，計算出來的索引是0）計算索引的方法是:
```
(n-1)&hash                //n代表的是table的length,hash就是上面的第一個參數hash(key);
```
所謂的碰撞問題解析：正常情況下直接放入就行了，但是如果加入的元素和之前的元素計算出來的索引位置是一樣的。例如：新建一個HashMap,放入(1,"a")和(17,"b")時，他們計算出來的索引相同，這時第一個Node放入好之后，第二個Node不會在重新在table中占一個索引了，會在同一個索引的Node上形成鏈表。即Node1.next=Node2. Node1和Node2都在table數組里同一個索引里面。如果在放入一個(33,"c")，這個其實也是和上面兩個計算出來是同一個索引位置，會放在Node2.next=Node3.

  p.next=newNode(hash,key,value,null);                  //newNode方法會新聲明一個Node

2. get(Object key)方法：

知道了put方法，get(Object key)方法就比較簡單了，直接通過key算出他在table數組中的索引位置直接獲取就行了，因為有可能同一個索引位置放了幾個元素，所以他會先找到第一個元素，然后對比hash和key是否都相等。比如，在一個初始的table中，放入(33,"a"),(17,"b")。他們的hash分別為33和17，key也分別為33和17。當我調用get(17)時，先會根據17算出在table中的索引為1，然后取出在這個索引中的第一個元素(33,"aa")，讓對比他們的hash和key是否都相等。顯而易見，第一個元素的key和hash都是33，而我們想要get的hash和key都是17.所以不相等。那么他就會去獲取第一個元素的next是否存在，如果存在會獲取出來在判斷hash和key是否都相等。

3. remove(Object key)方法：

和get(Object key)方法類似，先計算索引位置，找出這個索引位置的第一個Node命名為p,在對比 p的key,hash和參數中的key,根據參數key計算出來的hash是否一樣，如果一樣那么就在這個索引位置的值設為null。如果在有碰撞的情況下，就會與p.next做對比，如果一樣那么p.next將指向這個p.next.next。然后這個元素沒有了指針也會就被jvm回收了。

4.entrySet()方法：

我遍歷了一個HashMap看了看，因為想看看他是怎么把碰撞的同一個索引位置的那么多數取出了的，發現這個代碼不是很好理解，經過百度和自己猜測，有了一點了解。當時情況是這樣的：

這個在代碼中是這樣的:調用entrySet方法來遍歷出一個個Map.Entry

  for(Map.Entry<? extends K,? extends V> e:m.entrySet()){
                  K key=e.getKey();
                  V value=e.getValue();
              }

entrySet()方法的代碼如下:

 public Set<Map.Entry<K, V>> entrySet(){
           Set<Map.Entry<K, V>> es;
           return (es=entrySet)==null?(es=new EntrySet()):es;
       }

這個entrySet是等於null的，也就是說每次都是new EntrySet();EntrySet類的代碼如下:

   final class EntrySet extends AbstractSet<Map.Entry<K, V>>{
           public final int size(){return size;}
           public final void clear(){HashMapMmc.this.clear();}

           public final Iterator<Map.Entry<K, V>> iterator(){
               return new EntryIterator();
           }
           
           public final boolean contains(Object o){
               if(!(o instanceof Map.Entry))
                   return false;
               Map.Entry<?, ?> e=(Map.Entry<?, ?>) o;
               Object key=e.getKey();
               Node<K,V> candidate=getNode(hash(key),key);
               return candidate!=null&&candidate.equals(o);
           }
           
           public final boolean remove(Object o){
               if(o instanceof Map.Entry){
                   Map.Entry<?, ?> e=(java.util.Map.Entry<?, ?>) o;
                   Object key= e.getKey();
                   Object value=e.getValue();
                   return removeNode(hash(key), key, value, true,true)!=null;
               }
                return false;   
           }
           
           public final Spliterator<Map.Entry<K, V>> spliterator(){
               return new EntrySpliterator<>(HashMapMmc.this,0,-1,0,0);
           }
           
           public final void forEach(Consumer<? super Map.Entry<K, V>> action){
               Node<K,V> [] tab;
               if(action==null)
                   throw new NullPointerException();
               if(size>0&&(tab=table)!=null){
                   int mc=modCount;
                   for(int i=0;i<tab.length;++i){
                       for(Node<K,V> e=tab[i];e!=null;e=e.next)
                           action.accept(e);
                   }
                   if(modCount!=mc)
                       throw new ConcurrentModificationException();
               }
           }
       }

看了EntrySet之后，感覺new EntrySet()里面不應該是空的嗎？怎么能夠遍歷出值來呢？

但是debug了下下面的這個e確實是有值的。最后查找了一下資料得出，增強性for循環內部是使用的iterator方法，又看了看果然EntrySet類中覆寫了iterator方法。返回的是一個new EntryIterator()，我又去找EntryIterator類，類里就只有一個方法。然后又發現它繼承了HashIterator類，
這個類東西就多了。看下面的代碼:

for(Map.Entry<? extends K,? extends V> e:m.entrySet()){}

 abstract class HashIterator{
          Node<K,V> next;
          Node<K,V> current;
          int expectedModeCount;
          int index;
          
          HashIterator(){
              expectedModeCount=modCount;
              Node<K,V>[] t=table;
              current=next=null;
              index=0;
              if(t!=null&&size>0){         //先入先進
                  do{}while(index<t.length&&(next=t[index++])==null);
              }
          }
          
          public final boolean hasNext(){
              return next!=null;
          }
          
          final Node<K,V> nextNode(){
              Node<K,V>[] t;
              Node<K,V> e= next;
              if(modCount!=expectedModeCount)
                  throw new ConcurrentModificationException();
              if(e==null)
                  throw new NoSuchElementException();
              if((next=(current=e).next)==null&&(t=table)!=null){
                  do{}while(index<t.length&&(next=t[index++])==null);
              }
              return e;
          }
          
          public final void remove(){
              Node<K,V> p=current;
              if(p==null)
                  throw new IllegalStateException();
              if(modCount!=expectedModeCount)
                  throw new ConcurrentModificationException();
              current=null;
              K key=p.key;
              removeNode(hash(key),key,null,false,false);
              expectedModeCount=modCount;
          }
      }

可以看出這個HashIterator迭代器的默認構造器中，會初始化一個next的變量，這個變量是在table數組中取得，索引是從0遞增的，即先入先出原則。構造初期會從0開始找有值的索引位置，找到后將這個Node賦值給next；然后要遍歷的時候是調用nextNode()方法，這個方法是先判斷next.next是否為空，如果為空繼續往上找有值的索引位置，如果不為空就找next.next。這樣就能都遍歷出來了，是從索引0到table.length去一個個尋找遍歷的。

第一次寫自己的理解，希望多多指正！

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 一些疑問 Java中HashMap的entrySet()方法: HashMap.entrySet() Python中關於try...finally的一些疑問關於Scalability的一些思考與疑問淺談Java中的HashMap結構及原理 HashMap 中的 entrySet()使用方法 2016.12.28 關於HashMap的一些思考淺談HashMap 的底層原理 HashMap中的hash算法中的幾個疑問 fastadmin開發api的時候，遇到一些疑問