正文開始 注:JDK版本為1.8
HashMap1.8和1.8之前的源碼差別很大
- 目錄
- 簡介
- 數據結構
- 類結構
- 屬性
- 構造方法
- 增加
- 刪除
- 修改
- 總結
- 簡介
1.HashMap簡介
HashMap基於哈希表的Map接口實現,是以key-value存儲形式存在。(除了不同步和允許使用 null 之外,HashMap 類與 Hashtable 大致相同。)
HashMap 的實現不是同步的,這意味着它不是線程安全的。它的key、value都可以為null。此外,HashMap中的映射不是有序的。在 JDK1.8 中,HashMap 是由 數組+鏈表+紅黑樹構成,新增了紅黑樹作為底層數據結構,結構變得復雜了,但是效率也變的更高效。
1.2 HashMap數據結構
在 JDK1.8 中,HashMap 是由 數組+鏈表+紅黑樹構成,新增了紅黑樹作為底層數據結構,結構變得復雜了,但是效率也變的更高效。當一個值中要存儲到Map的時候會根據Key的值來計算出他的
hash,通過哈希來確認到數組的位置,如果發生哈希碰撞就以鏈表的形式存儲在Object源碼分析中解釋過
,但是這樣如果鏈表過長來的話,HashMap會把這個鏈表轉換成紅黑樹來存儲。
來看依一下HashMap的存儲結構
但是這樣的話問題來了,HashMap為什么要使用紅黑樹呢,這樣結構的話不是更麻煩了嗎??
這個問題我也沒有想過,其實很多在看的時候只會在乎紅黑樹的實現而忽略到了為什么要使用的這個問題,我也是在寫本文的時候突發疑惑。參考了網上的例子,同時也解釋了為什么閥值為8:
因為Map中桶的元素初始化是鏈表保存的,其查找性能是O(n),而樹結構能將查找性能提升到O(log(n))。當鏈表長度很小的時候,即使遍歷,速度也非常快,但是當鏈表長度不斷變長,肯定會對查詢性能有一定的影響,所以才需要轉成樹。至於為什么閾值是8,我想,去源碼中找尋答案應該是最可靠的途徑。
2.類結構
我們來看一下類結構
在閱讀源碼的時候一直有個問題很困惑就是HashMap已經繼承了AbstractMap而AbstractMap類實現了Map接口,那為什么HashMap還要在實現Map接口呢?同樣在ArrayList中LinkedList中都是這種結構。
據 java 集合框架的創始人Josh Bloch描述,這樣的寫法是一個失誤。在java集合框架中,類似這樣的寫法很多,最開始寫java集合框架的時候,他認為這樣寫,在某些地方可能是有價值的,直到他意識到錯了。顯然的,JDK的維護者,后來不認為這個小小的失誤值得去修改,所以就這樣存在下來了。
- Cloneable 空接口,表示可以克隆
- Serializable 序列化
- AbstractMap 提供Map實現接口
3.屬性
初始化容量(必須是二的n次冪)
集合最大容量(必須是二的冪)
負載因子,默認的0.75
當鏈表的值超過8則會轉紅黑樹(1.8新增)
當鏈表的值小於6則會從紅黑樹轉回鏈表
當Map里面的數量超過這個值時,表中的桶才能進行樹形化 ,否則桶內元素太多時會擴容,而不是樹形化 為了避免進行擴容、樹形化選擇的沖突,這個值不能小於 4 * TREEIFY_THRESHOLD
table用來初始化(必須是二的n次冪)
用來存放緩存
HashMap中存儲的數量
用來記錄HashMap的修改次數
用來調整大小下一個容量的值計算方式為(容量*負載因子)
哈希表的加載因子
重點屬性
- **table **在JDK1.8中我們了解到HashMap是由數組加鏈表加紅黑樹來組成的結構其中table就是HashMap中的數組
- **Size **為HashMap中K-V的實時數量
- **loadFactor **加載因子,是用來衡量 HashMap 滿的程度,計算HashMap的實時加載因子的方法為:size/capacity,而不是占用桶的數量去除以capacity。capacity 是桶的數量,也就是 table 的長度length。
- **threshold **計算公式:capacity * loadFactor。這個值是當前已占用數組長度的最大值。過這個數目就重新resize(擴容),擴容后的 HashMap 容量是之前容量的兩倍
4.構造方法
開始看構造方法。
4.1 HashMap()
構造一個空的 HashMap
,默認初始容量(16)和默認負載因子(0.75)。
4.2 HashMap(int initialCapacity)
構造一個空的 HashMap
具有指定的初始容量和默認負載因子(0.75)。
4.3 HashMap(int initialCapacity, float loadFactor)
構造一個空的 HashMap
具有指定的初始容量和負載因子。我們來分析一下。
最后調用了tableSizeFor,來看一下方法實現:
5.增加
現在我們開始分析put()方法
我們可以看到put調用的是putVal來進行數據插入,但是要注意到key在這里執行了一下hash()方法,來看一下Hash方法是如何實現的。
從上面可以得知HashMap是支持Key為空的,而HashTable是直接用過Key來獲取HashCode所以key為空會拋異常其實上面就已經解釋了為什么HashMap的長度為什么要是2的冪因為HashMap 使用的方法很巧妙,它通過 hash & (table.length -1)來得到該對象的保存位,前面說過 HashMap 底層數組的長度總是2的n次方,這是HashMap在速度上的優化。當 length 總是2的n次方時,hash & (length-1)運算等價於對 length 取模,也就是 hash%length,但是&比%具有更高的效率。比如 n % 32 = n & (32 -1)。
現在看putVal()方法,看看它到底做了什么。
主要參數:
- hash key的hash值
- key 原始Key
- value 要存放的值
- onlyIfAbsent 如果true代表不更改現有的值
- evict 如果為false表示table為創建狀態
完整源碼分析,放圖片的話會太長了,所以就截取了一下分為兩部。
暫時分析到添加 ,首發亂敲代碼公眾號