Java中常見數據結構Map之LinkedHashMap


前面已經說完了HashMap, 接着來說下LinkedHashMap。
看到Linked就知道它是有序的Map,即插入順序和取出順序是一致的, 究竟是怎樣做到的呢? 下面就一窺源碼吧。

1, LinkedHashMap基本結構
LinkedHashMap是HashMap的一個子類,它保留插入的順序,如果需要輸出的順序和輸入時的相同,那么就選用LinkedHashMap。
LinkedHashMap是Map接口的哈希表和鏈接列表實現,具有可預知的迭代順序。此實現提供所有可選的映射操作,並允許使用null值和null鍵。此類不保證映射的順序,特別是它不保證該順序恆久不變
LinkedHashMap實現與HashMap的不同之處在於,后者維護着一個運行於所有條目的雙重鏈接列表。此鏈接列表定義了迭代順序,該迭代順序可以是插入順序或者是訪問順序。
注意,此實現不是同步的。如果多個線程同時訪問鏈接的哈希映射,而其中至少一個線程從結構上修改了該映射,則它必須保持外部同步。

 

根據鏈表中元素的順序可以分為:按插入順序的鏈表,和按訪問順序(調用get方法)的鏈表。 

默認是按插入順序排序,如果指定按訪問順序排序,那么調用get方法后,會將這次訪問的元素移至鏈表尾部,不斷訪問可以形成按訪問順序排序的鏈表。  可以重寫removeEldestEntry方法返回true值指定插入元素時移除最老的元素。

(以下源碼截圖皆為JDK7)
Image(4)
 
LinkedHashMap是繼承HashMap, 也就是說LinkedHashMap的結構也是和HashMap那樣(數組+鏈表)。
LinkedHashMap最大的差別在於Entry的定義上:
Image(5)
 
這里維護了一個before和after的Entry, 見名思意, 就是每個Entry<K,V>都維護它的上一個元素和下一個元素的關系。這也是LinkedHashMap有序的關鍵所在。
接着我們再看下header的定義:
Image(6)
 
上圖可以看出header的hash值為-1, 所以並不在hash表的table上。 其實header就是為了記錄雙向鏈表的頭結點和尾節點。
LinkedHashMap的元素關系如下:
 
Image(7)
 
 
2, LinkedHashMap中主要方法介紹

LinkedHashMap中重寫的方法不是很多, 請看下圖:
Image(8)
 
以下部分截取自: http://www.cnblogs.com/xiaoxi/p/6170590.html   感謝原作者, 寫的確實很好。     
假如有這么一段代碼:
復制代碼
1 public static void main(String[] args) 2 { 3 LinkedHashMap<String, String> linkedHashMap = 4 new LinkedHashMap<String, String>(); 5 linkedHashMap.put("111", "111"); 6 linkedHashMap.put("222", "222"); 7 } 
復制代碼

首先是第3行~第4行,new一個LinkedHashMap出來,看一下做了什么:

通過源代碼可以看出,在LinkedHashMap的構造方法中,實際調用了父類HashMap的相關構造方法來構造一個底層存放的table數組。

1 public LinkedHashMap() { 2 super(); 3 accessOrder = false; 4 } 
1 public HashMap() { 2 this.loadFactor = DEFAULT_LOAD_FACTOR; 3 threshold = (int)(DEFAULT_INITIAL_CAPACITY * DEFAULT_LOAD_FACTOR); 4 table = new Entry[DEFAULT_INITIAL_CAPACITY]; 5  init(); 6 } 

我們已經知道LinkedHashMap的Entry元素繼承HashMap的Entry,提供了雙向鏈表的功能。在上述HashMap的構造器中,最后會調用init()方法,進行相關的初始化,這個方法在HashMap的實現中並無意義,只是提供給子類實現相關的初始化調用。
LinkedHashMap重寫了init()方法,在調用父類的構造方法完成構造后,進一步實現了對其元素Entry的初始化操作。

1 void init() { 2 header = new Entry<K,V>(-1, null, null, null); 3 header.before = header.after = header; 4 } 

這里出現了第一個多態:init()方法。盡管init()方法定義在HashMap中,但是由於:

1、LinkedHashMap重寫了init方法

2、實例化出來的是LinkedHashMap

因此實際調用的init方法是LinkedHashMap重寫的init方法。假設header的地址是0x00000000,那么初始化完畢,實際上是這樣的:

注意這個header,hash值為-1,其他都為null,也就是說這個header不放在數組中,就是用來指示開始元素和標志結束元素的。

header的目的是為了記錄第一個插入的元素是誰,在遍歷的時候能夠找到第一個元素。

五、LinkedHashMap存儲元素

LinkedHashMap並未重寫父類HashMap的put方法,而是重寫了父類HashMap的put方法調用的子方法void recordAccess(HashMap m)  ,void addEntry(int hash, K key, V value, int bucketIndex) 和void createEntry(int hash, K key, V value, int bucketIndex),提供了自己特有的雙向鏈接列表的實現。

繼續看LinkedHashMap存儲元素,也就是put("111","111")做了什么,首先當然是調用HashMap的put方法:

復制代碼
 1 //這個方法應該挺熟悉的,如果看了HashMap的解析的話 2 public V put(K key, V value) {  3 //key為null的情況 4 if (key == null)  5 return putForNullKey(value);  6 //通過key算hash,進而算出在數組中的位置,也就是在第幾個桶中 7 int hash = hash(key.hashCode());  8 int i = indexFor(hash, table.length);  9 //查看桶中是否有相同的key值,如果有就直接用新值替換舊值,而不用再創建新的entry了10 for (Entry<K,V> e = table[i]; e != null; e = e.next) { 11  Object k; 12 if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { 13 V oldValue = e.value; 14 e.value = value; 15 e.recordAccess(this); 16 return oldValue; 17  } 18  } 19 20 modCount++; 21 //上面度是熟悉的東西,最重要的地方來了,就是這個方法,LinkedHashMap執行到這里,addEntry()方法不會執行HashMap中的方法, 22 //而是執行自己類中的addEntry方法,23  addEntry(hash, key, value, i); 24 return null; 25 } 
復制代碼

第23行又是一個多態,因為LinkedHashMap重寫了addEntry方法,因此addEntry調用的是LinkedHashMap重寫了的方法:

復制代碼
 1 void addEntry(int hash, K key, V value, int bucketIndex) {  2 //調用create方法,將新元素以雙向鏈表的的形式加入到映射中 3  createEntry(hash, key, value, bucketIndex);  4  5 // Remove eldest entry if instructed, else grow capacity if appropriate  6 // 刪除最近最少使用元素的策略定義  7 Entry<K,V> eldest = header.after;  8 if (removeEldestEntry(eldest)) {  9  removeEntryForKey(eldest.key); 10 } else { 11 if (size >= threshold) 12 resize(2 * table.length); 13  } 14 } 
復制代碼

因為LinkedHashMap由於其本身維護了插入的先后順序,因此LinkedHashMap可以用來做緩存,第7行~第9行是用來支持FIFO算法的,這里暫時不用去關心它。看一下createEntry方法: 

復制代碼
1 void createEntry(int hash, K key, V value, int bucketIndex) { 2 HashMap.Entry<K,V> old = table[bucketIndex]; 3 Entry<K,V> e = new Entry<K,V>(hash, key, value, old); 4 table[bucketIndex] = e; 5 //將該節點插入到鏈表尾部6  e.addBefore(header); 7 size++; 8 } 
復制代碼
private void addBefore(Entry<K,V> existingEntry) { after = existingEntry; before = existingEntry.before; before.after = this; after.before = this; }

createEntry(int hash,K key,V value,int bucketIndex)方法覆蓋了父類HashMap中的方法。這個方法不會拓展table數組的大小。該方法首先保留table中bucketIndex處的節點,然后調用Entry的構造方法(將調用到父類HashMap.Entry的構造方法)添加一個節點,即將當前節點的next引用指向table[bucketIndex] 的節點,之后調用的e.addBefore(header)是修改鏈表,將e節點添加到header節點之前。

第2行~第4行的代碼和HashMap沒有什么不同,新添加的元素放在table[i]上,差別在於LinkedHashMap還做了addBefore操作,這四行代碼的意思就是讓新的Entry和原鏈表生成一個雙向鏈表。假設字符串111放在位置table[1]上,生成的Entry地址為0x00000001,那么用圖表示是這樣的:

如果熟悉LinkedList的源碼應該不難理解,還是解釋一下,注意下existingEntry表示的是header:

1、after=existingEntry,即新增的Entry的after=header地址,即after=0x00000000

2、before=existingEntry.before,即新增的Entry的before是header的before的地址,header的before此時是0x00000000,因此新增的Entry的before=0x00000000

3、before.after=this,新增的Entry的before此時為0x00000000即header,header的after=this,即header的after=0x00000001

4、after.before=this,新增的Entry的after此時為0x00000000即header,header的before=this,即header的before=0x00000001

這樣,header與新增的Entry的一個雙向鏈表就形成了。再看,新增了字符串222之后是什么樣的,假設新增的Entry的地址為0x00000002,生成到table[2]上,用圖表示是這樣的:

 

就不細解釋了,只要before、after清除地知道代表的是哪個Entry的就不會有什么問題。

注意,這里的插入有兩重含義:

1.從table的角度看,新的entry需要插入到對應的bucket里,當有哈希沖突時,采用頭插法將新的entry插入到沖突鏈表的頭部。
2.從header的角度看,新的entry需要插入到雙向鏈表的尾部。

總得來看,再說明一遍,LinkedHashMap的實現就是HashMap+LinkedList的實現方式,以HashMap維護數據結構,以LinkList的方式維護數據插入順序。

3、LinkedHashMap讀取元素

LinkedHashMap重寫了父類HashMap的get方法,實際在調用父類getEntry()方法取得查找的元素后,再判斷當排序模式accessOrder為true時(即按訪問順序排序),先將當前節點從鏈表中移除,然后再將當前節點插入到鏈表尾部。由於的鏈表的增加、刪除操作是常量級的,故並不會帶來性能的損失。

復制代碼
/**  * 通過key獲取value,與HashMap的區別是:當LinkedHashMap按訪問順序排序的時候,會將訪問的當前節點移到鏈表尾部(頭結點的前一個節點) */public V get(Object key) { // 調用父類HashMap的getEntry()方法,取得要查找的元素。  Entry<K,V> e = (Entry<K,V>)getEntry(key); if (e == null) return null; // 記錄訪問順序。 e.recordAccess(this); return e.value; }
復制代碼
復制代碼
/**  * 在HashMap的put和get方法中,會調用該方法,在HashMap中該方法為空 * 在LinkedHashMap中,當按訪問順序排序時,該方法會將當前節點插入到鏈表尾部(頭結點的前一個節點),否則不做任何事 */void recordAccess(HashMap<K,V> m) { LinkedHashMap<K,V> lm = (LinkedHashMap<K,V>)m; //當LinkedHashMap按訪問排序時 if (lm.accessOrder) { lm.modCount++; //移除當前節點 remove(); //將當前節點插入到頭結點前面 addBefore(lm.header); } }
復制代碼
復制代碼
/**  * 移除節點,並修改前后引用 */private void remove() { before.after = after; after.before = before; }
復制代碼
private void addBefore(Entry<K,V> existingEntry) { after = existingEntry; before = existingEntry.before; before.after = this; after.before = this; }

4、利用LinkedHashMap實現LRU算法緩存

前面講了LinkedHashMap添加元素,刪除、修改元素就不說了,比較簡單,和HashMap+LinkedList的刪除、修改元素大同小異,下面講一個新的內容。

LinkedHashMap可以用來作緩存,比方說LRUCache,看一下這個類的代碼,很簡單,就十幾行而已:

復制代碼
public class LRUCache extends LinkedHashMap { public LRUCache(int maxSize) { super(maxSize, 0.75F, true); maxElements = maxSize; } protected boolean removeEldestEntry(java.util.Map.Entry eldest) { return size() > maxElements; } private static final long serialVersionUID = 1L; protected int maxElements; }
復制代碼

顧名思義,LRUCache就是基於LRU算法的Cache(緩存),這個類繼承自LinkedHashMap,而類中看到沒有什么特別的方法,這說明LRUCache實現緩存LRU功能都是源自LinkedHashMap的。LinkedHashMap可以實現LRU算法的緩存基於兩點:

1、LinkedList首先它是一個Map,Map是基於K-V的,和緩存一致

2、LinkedList提供了一個boolean值可以讓用戶指定是否實現LRU

那么,首先我們了解一下什么是LRU:LRU即Least Recently Used,最近最少使用,也就是說,當緩存滿了,會優先淘汰那些最近最不常訪問的數據。比方說數據a,1天前訪問了;數據b,2天前訪問了,緩存滿了,優先會淘汰數據b。

我們看一下LinkedList帶boolean型參數的構造方法:

public LinkedHashMap(int initialCapacity, float loadFactor, boolean accessOrder) { super(initialCapacity, loadFactor); this.accessOrder = accessOrder; }

就是這個accessOrder,它表示:

(1)false,所有的Entry按照插入的順序排列

(2)true,所有的Entry按照訪問的順序排列

第二點的意思就是,如果有1 2 3這3個Entry,那么訪問了1,就把1移到尾部去,即2 3 1。每次訪問都把訪問的那個數據移到雙向隊列的尾部去,那么每次要淘汰數據的時候,雙向隊列最頭的那個數據不就是最不常訪問的那個數據了嗎?換句話說,雙向鏈表最頭的那個數據就是要淘汰的數據。

"訪問",這個詞有兩層意思:

1、根據Key拿到Value,也就是get方法

2、修改Key對應的Value,也就是put方法

首先看一下get方法,它在LinkedHashMap中被重寫:

復制代碼
public V get(Object key) { Entry<K,V> e = (Entry<K,V>)getEntry(key); if (e == null) return null; e.recordAccess(this); return e.value; }
復制代碼

然后是put方法,沿用父類HashMap的:

復制代碼
 1 public V put(K key, V value) {  2 if (key == null)  3 return putForNullKey(value);  4 int hash = hash(key.hashCode());  5 int i = indexFor(hash, table.length);  6 for (Entry<K,V> e = table[i]; e != null; e = e.next) {  7  Object k;  8 if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {  9 V oldValue = e.value; 10 e.value = value; 11 e.recordAccess(this); 12 return oldValue; 13  } 14  } 15 16 modCount++; 17  addEntry(hash, key, value, i); 18 return null; 19 } 
復制代碼

修改數據也就是第6行~第14行的代碼。看到兩端代碼都有一個共同點:都調用了recordAccess方法且這個方法是Entry中的方法,也就是說每次的recordAccess操作的都是某一個固定的Entry。

recordAccess,顧名思義,記錄訪問,也就是說你這次訪問了雙向鏈表,我就把你記錄下來,怎么記錄?把你訪問的Entry移到尾部去這個方法在HashMap中是一個空方法,就是用來給子類記錄訪問用的,看一下LinkedHashMap中的實現:

復制代碼
void recordAccess(HashMap<K,V> m) { LinkedHashMap<K,V> lm = (LinkedHashMap<K,V>)m; if (lm.accessOrder) { lm.modCount++; remove(); addBefore(lm.header); } }
復制代碼
private void remove() { before.after = after; after.before = before; }
private void addBefore(Entry<K,V> existingEntry) { after = existingEntry; before = existingEntry.before; before.after = this; after.before = this; }

看到每次recordAccess的時候做了兩件事情:

1、把待移動的Entry的前后Entry相連

2、把待移動的Entry移動到尾部

當然,這一切都是基於accessOrder=true的情況下。最后用一張圖表示一下整個recordAccess的過程吧:

void recordAccess(HashMap<K,V> m) 這個方法就是我們一開始說的,accessOrder為true時,就是使用的訪問順序,訪問次數最少到訪問次數最多,此時要做特殊處理。處理機制就是訪問了一次,就將自己往后移一位,這里就是先將自己刪除了,然后在把自己添加,這樣,近期訪問的少的就在鏈表的開始,最近訪問的元素就會在鏈表的末尾。如果為false。那么默認就是插入順序,直接通過鏈表的特點就能依次找到插入元素,不用做特殊處理。

5、代碼演示LinkedHashMap按照訪問順序排序的效果

最后代碼演示一下LinkedList按照訪問順序排序的效果,驗證一下上一部分LinkedHashMap的LRU功能:

復制代碼
public static void main(String[] args) { LinkedHashMap<String, String> linkedHashMap = new LinkedHashMap<String, String>(16, 0.75f, true); linkedHashMap.put("111", "111"); linkedHashMap.put("222", "222"); linkedHashMap.put("333", "333"); linkedHashMap.put("444", "444"); loopLinkedHashMap(linkedHashMap); linkedHashMap.get("111"); loopLinkedHashMap(linkedHashMap); linkedHashMap.put("222", "2222"); loopLinkedHashMap(linkedHashMap); } public static void loopLinkedHashMap(LinkedHashMap<String, String> linkedHashMap) { Set<Map.Entry<String, String>> set = inkedHashMap.entrySet(); Iterator<Map.Entry<String, String>> iterator = set.iterator(); while (iterator.hasNext()) { System.out.print(iterator.next() + "\t"); } System.out.println(); }
復制代碼

注意這里的構造方法要用三個參數那個且最后的要傳入true,這樣才表示按照訪問順序排序。看一下代碼運行結果:

111=111    222=222    333=333    444=444    
222=222    333=333    444=444    111=111    
333=333    444=444    111=111    222=2222   

代碼運行結果證明了兩點:

1、LinkedList是有序的

2、每次訪問一個元素(get或put),被訪問的元素都被提到最后面去了


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM