HashMap？面試？我是誰？我在哪

本文轉載自查看原文 2018-11-19 23:24 4078 JAVA集合容器

　　現在是晚上11點了，學校屠豬館的自習室因為太晚要關閉了，勤奮且疲憊的小魯班也從屠豬館出來了，正准備回宿舍洗洗睡，由於自習室位置比較偏僻所以是接收不到手機網絡信號的，因此小魯班從兜里掏出手機的時候，信息可真是炸了呀，小魯班心想，微信群平時都沒什么人聊天，今晚肯定是發生了什么大事，仔細一看，才發現原來是小魯班的室友達摩（光頭）拿到了阿里巴巴JAVA開發實習生的offer，此時小魯班真替他室友感到高興的同時，心里也難免會產生一絲絲的失落感，那是因為自己投了很多份簡歷，別說拿不拿得到offer，就連給面試邀的公司也都寥寥無幾，小魯班這會可真是受到了一萬點真實暴擊，不過小魯班還是很樂觀的，很快調整了心態，帶上耳機，慢慢的走回了宿舍，正打算准備向他那神室友達摩取取經。

　　片刻后~

　　小魯班：666，聽說你拿到了阿里的offer，能透露一下面試內容和技巧嗎

　　達摩：嘿嘿嘿，沒問題鴨，叫聲爸爸我就告訴你

　　小魯班：耙耙（表面笑嘻嘻，心里MMP）

　　達摩：其實我也不是很記得了（請繼續裝），但我還是記得那么一些，如果你是面的JAVA，首先當然是

　　JAVA的基礎知識：數據結構（Map,List,Set等）,設計模式，算法，線程相關，IO/NIO，序列化等等
　　其次是高級特征：反射機制，並發與鎖，JVM（GC策略，類加載機制，內存模型）等等

　　小魯班：問這么多內容，那豈不是一個人都面試很久嗎？

　　達摩：不是的，面試官一般都會用連環炮的方式提問的。

　　小魯班：你說的連環炮是什么意思鴨？

　　達摩：那我舉個例子

　　就比如問你HashMap是不是有序的？

　　你回答不是有序的。那面試官就會可能繼續問你，有沒有有序的Map實現類呢？

　　你如果這個時候說不知道的話，那這塊問題就到此結束了。如果你說有TreeMap和LinkedHashMap。

　　那么面試官接下來就可能會問你，TreeMap和LinkedHashMap是如何保證它的順序的？

　　如果你回答不上來，那么到此為止。如果你說TreeMap是通過實現SortMap接口，能夠把它保存的鍵值對根據key排序，基於紅黑樹，從而保證TreeMap中所有鍵值對處於有序狀態。LinkedHashMap則是通過插入排序（就是你put的時候的順序是什么，取出來的時候就是什么樣子）和訪問排序（改變排序把訪問過的放到底部）讓鍵值有序。

　　那么面試官還會繼續問你，你覺得它們兩個哪個的有序實現比較好？

　　如果你依然可以回答的話，那么面試官會繼續問你，你覺得還有沒有比它更好或者更高效的實現方式。。無窮無盡深入，直到你回答不出來或者面試官認為問題到底了

　　小魯班捏了一把汗，我去。。。這是魔鬼吧，那我們來試試唄（因為小魯班剛剛在自習室才看了這章的知識，想趁機裝一波逼，畢竟剛剛叫了聲爸爸~~）

　　於是達摩and小魯班就開始了對決：

　　1.為什么用HashMap？

HashMap是一個散列桶（數組和鏈表），它存儲的內容是鍵值對(key-value)映射
HashMap采用了數組和鏈表的數據結構，能在查詢和修改方便繼承了數組的線性查找和鏈表的尋址修改
HashMap是非synchronized，所以HashMap很快
HashMap可以接受null鍵和值，而Hashtable則不能（原因就是equlas()方法需要對象，因為HashMap是后出的API經過處理才可以）

　　2.HashMap的工作原理是什么？

HashMap是基於hashing的原理，我們使用put(key, value)存儲對象到HashMap中，使用get(key)從HashMap中獲取對象。當我們給put()方法傳遞鍵和值時，我們先對鍵調用hashCode()方法，計算並返回的hashCode是用於找到Map數組的bucket位置來儲存Node 對象。這里關鍵點在於指出，HashMap是在bucket中儲存鍵對象和值對象，作為Map.Node 。

以下是HashMap初始化，簡單模擬數據結構

　　 Node[] table=new Node[16] 散列桶初始化，table

　　 class Node {

　　　　hash;//hash值

key;//鍵

　　　　value;//值

　　　　node next;//用於指向鏈表的下一層（產生沖突，用拉鏈法）

　　 }

以下是具體的put過程（JDK1.8版）

1.對Key求Hash值，然后再計算下標
2.如果沒有碰撞，直接放入桶中（碰撞的意思是計算得到的Hash值相同，需要放到同一個bucket中）
3.如果碰撞了，則調用equals() 比較value，相同則替換舊值，不同則以鏈表的方式鏈接到后面
4.如果鏈表長度超過閥值( TREEIFY THRESHOLD==8)，就把鏈表轉成紅黑樹，鏈表長度低於6，就把紅黑樹轉回鏈表
5.如果桶滿了(容量16*加載因子0.75)，就需要 resize（擴容2倍后重排）

以下是具體get過程(考慮特殊情況如果兩個鍵的hashcode相同，你如何獲取值對象？)

　　當我們調用get()方法，HashMap會使用鍵對象的hashcode找到bucket位置，找到bucket位置之后，會調用keys.equals()方法去找到鏈表中正確的節點，最終找到要找的值對象。

　　3.有什么方法可以減少碰撞？

擾動函數可以減少碰撞，原理是如果兩個不相等的對象返回不同的hashcode的話，那么碰撞的幾率就會小些，這就意味着存鏈表結構減小，這樣取值的話就不會頻繁調用equal方法，這樣就能提高HashMap的性能。（擾動即Hash方法內部的算法實現，目的是讓不同對象返回不同hashcode。）
使用不可變的、聲明作final的對象，並且采用合適的equals()和hashCode()方法的話，將會減少碰撞的發生。不可變性使得能夠緩存不同鍵的hashcode，這將提高整個獲取對象的速度，使用String，Interger這樣的wrapper類作為鍵是非常好的選擇。為什么String, Interger這樣的wrapper類適合作為鍵？因為String是final的，而且已經重寫了equals()和hashCode()方法了。不可變性是必要的，因為為了要計算hashCode()，就要防止鍵值改變，如果鍵值在放入時和獲取時返回不同的hashcode的話，那么就不能從HashMap中找到你想要的對象。

　　4.HashMap中hash函數怎么是是實現的?

　　我們可以看到在hashmap中要找到某個元素，需要根據key的hash值來求得對應數組中的位置。如何計算這個位置就是hash算法。前面說過hashmap的數據結構是數組和鏈表的結合，所以我們當然希望這個hashmap里面的元素位置盡量的分布均勻些，盡量使得每個位置上的元素數量只有一個，那么當我們用hash算法求得這個位置的時候，馬上就可以知道對應位置的元素就是我們要的，而不用再去遍歷鏈表。所以我們首先想到的就是把hashcode對數組長度取模運算，這樣一來，元素的分布相對來說是比較均勻的。但是，“模”運算的消耗還是比較大的，能不能找一種更快速，消耗更小的方式，我們來看看JDK1.8的源碼是怎么做的（被樓主修飾了一下）

static final int hash(Object key) {
    if (key == null){
        return 0;
    }
     int h;
     h=key.hashCode()；返回散列值也就是hashcode
      // ^ ：按位異或
      // >>>:無符號右移，忽略符號位，空位都以0補齊
      //其中n是數組的長度，即Map的數組部分初始化長度
     return  (n-1)&(h ^ (h >>> 16));
}

　　簡單來說就是

1.高16bt不變，低16bit和高16bit做了一個異或(得到的HASHCODE轉化為32位的二進制，前16位和后16位低16bit和高16bit做了一個異或)
2.(n-1)&hash=->得到下標

　　5.拉鏈法導致的鏈表過深問題為什么不用二叉查找樹代替，而選擇紅黑樹？為什么不一直使用紅黑樹？

　　之所以選擇紅黑樹是為了解決二叉查找樹的缺陷，二叉查找樹在特殊情況下會變成一條線性結構（這就跟原來使用鏈表結構一樣了，造成很深的問題），遍歷查找會非常慢。而紅黑樹在插入新數據后可能需要通過左旋，右旋、變色這些操作來保持平衡，引入紅黑樹就是為了查找數據快，解決鏈表查詢深度的問題，我們知道紅黑樹屬於平衡二叉樹，但是為了保持“平衡”是需要付出代價的，但是該代價所損耗的資源要比遍歷線性鏈表要少，所以當長度大於8的時候，會使用紅黑樹，如果鏈表長度很短的話，根本不需要引入紅黑樹，引入反而會慢。

　　6.說說你對紅黑樹的見解？

每個節點非紅即黑
根節點總是黑色的
如果節點是紅色的，則它的子節點必須是黑色的（反之不一定）
每個葉子節點都是黑色的空節點（NIL節點）
從根節點到葉節點或空子節點的每條路徑，必須包含相同數目的黑色節點（即相同的黑色高度）

　　7.解決hash 碰撞還有那些辦法？

　　開放定址法。

　　當沖突發生時，使用某種探查技術在散列表中形成一個探查(測)序列。沿此序列逐個單元地查找，直到找到給定的地址。

　　按照形成探查序列的方法不同，可將開放定址法區分為線性探查法、二次探查法、雙重散列法等。

　　下面給一個線性探查法的例子　　

　　問題：已知一組關鍵字為(26，36，41，38，44，15，68，12，06，51)，用除余法構造散列函數，用線性探查法解決沖突構造這組關鍵字的散列表。

　　解答：為了減少沖突，通常令裝填因子α由除余法因子是13的散列函數計算出的上述關鍵字序列的散列地址為(0，10，2，12，5，2，3，12，6，12)。

　前5個關鍵字插入時，其相應的地址均為開放地址，故將它們直接插入T[0]，T[10)，T[2]，T[12]和T[5]中。
　　當插入第6個關鍵字15時，其散列地址2(即h(15)=15％13=2)已被關鍵字41(15和41互為同義詞)占用。故探查h1=(2+1)％13=3，此地址開放，所以將15放入T[3]中。
　當插入第7個關鍵字68時，其散列地址3已被非同義詞15先占用，故將其插入到T[4]中。
　當插入第8個關鍵字12時，散列地址12已被同義詞38占用，故探查hl=(12+1)％13=0，而T[0]亦被26占用，再探查h2=(12+2)％13=1，此地址開放，可將12插入其中。
　類似地，第9個關鍵字06直接插入T[6]中；而最后一個關鍵字51插人時，因探查的地址12，0，1，…，6均非空，故51插入T[7]中。

　　8.如果HashMap的大小超過了負載因子(load factor)定義的容量，怎么辦？

　　默認的負載因子大小為0.75，也就是說，當一個map填滿了75%的bucket時候，和其它集合類(如ArrayList等)一樣，將會創建原來HashMap大小的兩倍的bucket數組，來重新調整map的大小，並將原來的對象放入新的bucket數組中。這個過程叫作rehashing，因為它調用hash方法找到新的bucket位置。這個值只可能在兩個地方，一個是原下標的位置，另一種是在下標為<原下標+原容量>的位置　　

　 9.重新調整HashMap大小存在什么問題嗎？

當重新調整HashMap大小的時候，確實存在條件競爭，因為如果兩個線程都發現HashMap需要重新調整大小了，它們會同時試着調整大小。在調整大小的過程中，存儲在鏈表中的元素的次序會反過來，因為移動到新的bucket位置的時候，HashMap並不會將元素放在鏈表的尾部，而是放在頭部，這是為了避免尾部遍歷(tail traversing)。如果條件競爭發生了，那么就死循環了。(多線程的環境下不使用HashMap）
為什么多線程會導致死循環，它是怎么發生的？

　　HashMap的容量是有限的。當經過多次元素插入，使得HashMap達到一定飽和度時，Key映射位置發生沖突的幾率會逐漸提高。這時候，HashMap需要擴展它的長度，也就是　　進行Resize。1.擴容：創建一個新的Entry空數組，長度是原數組的2倍。2.ReHash：遍歷原Entry數組，把所有的Entry重新Hash到新數組。

（這個過程比較燒腦，暫不作流程圖演示，有興趣去看看我的另一篇博文"HashMap擴容全過程"）

　　達摩：哎呦，小老弟不錯嘛~~意料之外呀

　　小魯班：嘿嘿，優秀吧，中場休息一波，我先喝口水

　　達摩：不僅僅是這些哦，面試官還會問你相關的集合類對比，比如：

　　10.HashTable

數組 + 鏈表方式存儲
默認容量： 11(質數為宜)
put:
- 索引計算 : （key.hashCode() & 0x7FFFFFFF）% table.length
- 若在鏈表中找到了，則替換舊值，若未找到則繼續
- 當總元素個數超過容量*加載因子時，擴容為原來 2 倍並重新散列。
- 將新元素加到鏈表頭部
對修改 Hashtable 內部共享數據的方法添加了 synchronized，保證線程安全。

　　11.HashMap ，HashTable 區別

默認容量不同。擴容不同
線程安全性，HashTable 安全
效率不同 HashTable 要慢因為加鎖

　　12.我們可以使用CocurrentHashMap來代替Hashtable嗎？

我們知道Hashtable是synchronized的，但是ConcurrentHashMap同步性能更好，因為它僅僅根據同步級別對map的一部分進行上鎖。ConcurrentHashMap當然可以代替HashTable，但是HashTable提供更強的線程安全性。它們都可以用於多線程的環境，但是當Hashtable的大小增加到一定的時候，性能會急劇下降，因為迭代時需要被鎖定很長的時間。因為ConcurrentHashMap引入了分割(segmentation)，不論它變得多么大，僅僅需要鎖定map的某個部分，而其它的線程不需要等到迭代完成才能訪問map。簡而言之，在迭代的過程中，ConcurrentHashMap僅僅鎖定map的某個部分，而Hashtable則會鎖定整個map。

　　13.CocurrentHashMap（1.7）

CocurrentHashMap是由Segment數組和HashEntry數組和鏈表組成
Segment是基於重入鎖(ReentrantLock：一個數據段競爭鎖，每個HashEntry一個鏈表結構的元素，利用Hash算法得到索引確定歸屬的數據段，也就是對應到在修改時需要競爭獲取的鎖。ConcurrentHashMap 支持 CurrencyLevel (Segment 數組數量)的線程並發。每當一個線程占用鎖訪問一個 Segment 時，不會影響到其他的 Segment。
核心數據如 value ，以及鏈表都是 volatile 修飾的，保證了獲取時的可見性
首先是通過 key 定位到 Segment，之后在對應的 Segment 中進行具體的 put操作如下。
1. 將當前 Segment 中的 table 通過 key 的 hashcode 定位到 HashEntry。
2. 遍歷該 HashEntry，如果不為空則判斷傳入的 key 和當前遍歷的 key 是否相等，相等則覆蓋舊的 value。
3. 不為空則需要新建一個 HashEntry 並加入到 Segment 中，同時會先判斷是否需要擴容。
4. 最后會解除在 1 中所獲取當前 Segment 的鎖。
雖然 HashEntry 中的 value 是用 volatile 關鍵詞修飾的，但是並不能保證並發的原子性，所以 put 操作時仍然需要加鎖處理。

首先第一步的時候會嘗試獲取鎖，如果獲取失敗肯定就有其他線程存在競爭，則利用 scanAndLockForPut() 自旋獲取鎖。
1. 嘗試自旋獲取鎖。
2. 如果重試的次數達到了 MAX_SCAN_RETRIES 則改為阻塞鎖獲取，保證能獲取成功。最后解除當前 Segment 的鎖

··　14.CocurrentHashMap（1.8）

其中拋棄了原有的 Segment 分段鎖，而采用了 CAS + synchronized 來保證並發安全性。
其中的 val next 都用了 volatile 修飾，保證了可見性
最大特點是引入了 CAS（借助 Unsafe 來實現【native code】）
1. CAS有3個操作數，內存值V，舊的預期值A，要修改的新值B。當且僅當預期值A和內存值V相同時，將內存值V修改為B，否則什么都不做。
2. Unsafe 借助 CPU 指令 cmpxchg 來實現
3. 使用實例：
  1. 對 sizeCtl 的控制都是用 CAS 來實現的
  1. sizeCtl ：默認為0，用來控制 table 的初始化和擴容操作。
    - -1 代表table正在初始化
    - N 表示有 -N-1 個線程正在進行擴容操作
    - 如果table未初始化，表示table需要初始化的大小。
    - 如果table初始化完成，表示table的容量，默認是table大小的0.75倍，居然用這個公式算0.75（n - (n >>> 2)）。
4. CAS 會出現的問題：ABA
  - 解決：對變量增加一個版本號，每次修改，版本號加 1，比較的時候比較版本號。

　　put過程

根據 key 計算出 hashcode 。
判斷是否需要進行初始化。
通過 key 定位出的 Node，如果為空表示當前位置可以寫入數據，利用 CAS 嘗試寫入，失敗則自旋保證成功。
如果當前位置的 hashcode == MOVED == -1,則需要進行擴容。
如果都不滿足，則利用 synchronized 鎖寫入數據。
如果數量大於 TREEIFY_THRESHOLD 則要轉換為紅黑樹。

　　get過程

根據計算出來的 hashcode 尋址，如果就在桶上那么直接返回值。
如果是紅黑樹那就按照樹的方式獲取值。
就不滿足那就按照鏈表的方式遍歷獲取值。

　　此時躺着床上的張飛哄了一聲：睡覺了睡覺了~

　　見此不太妙：小魯班立馬回到床上（泉水），把被子蓋過頭，心里有一絲絲愉悅感，不對。好像還沒洗澡。。。

　　by the way

　　CocurrentHashMap在JAVA8中存在一個bug，會進入死循環，原因是遞歸創建ConcurrentHashMap 對象，但是在1.9已經修復了,場景重現如下

public class ConcurrentHashMapDemo{
        
    private Map<Integer,Integer> cache =new ConcurrentHashMap<>(15);
        
    public static void main(String[]args){
        ConcurrentHashMapDemo ch =    new ConcurrentHashMapDemo();
        System.out.println(ch.fibonaacci(80));        
    }
        
    public int fibonaacci(Integer i){        
        if(i==0||i ==1) {                
            return i;        
    }
            
    return cache.computeIfAbsent(i,(key) -> {
        System.out.println("fibonaacci : "+key);
        return fibonaacci(key -1)+fibonaacci(key - 2);        
    });       
    
    }
}

　　轉載請注明出處，謝謝

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 面試(一)-HashMap 有關 HashMap 面試會問的一切 HashMap面試總結 HashMap、ConcurrentHashMap以及HashTable(面試向) 為什么面試要問 hashmap 的原理面試總結hashmap HashMap面試題 Java面試必問之---HashMap HashMap面試題講解面試必會之HashMap源碼分析