Golang map的底層實現

本文轉載自查看原文 2019-06-22 23:11 2343 Golang

轉自https://blog.csdn.net/i6448038/article/details/82057424並修改

map是Go語言中基礎的數據結構，在日常的使用中經常被用到。但是它底層是如何實現的呢？

總體來說golang的map是hashmap，是使用數組+鏈表的形式實現的，使用拉鏈法消除hash沖突。

golang的map由兩種重要的結構，hmap和bmap(下文中都有解釋)，主要就是hmap中包含一個指向bmap數組的指針，key經過hash函數之后得到一個數，這個數低位用於選擇bmap(當作bmap數組指針的下表)，高位用於放在bmap的[8]uint8數組中，用於快速試錯。然后一個bmap可以指向下一個bmap(拉鏈)。

Golang中map的底層實現是一個散列表，因此實現map的過程實際上就是實現散表的過程。在這個散列表中，主要出現的結構體有兩個，一個叫hmap(a header for a go map)，一個叫bmap(a bucket for a Go map，通常叫其bucket)。這兩種結構的樣子分別如下所示：

hmap:

圖中有很多字段，但是便於理解map的架構，你只需要關心的只有一個，就是標紅的字段：buckets數組。Golang的map中用於存儲的結構是bucket數組。而bucket(即bmap)的結構是怎樣的呢？

bucket：

相比於hmap，bucket的結構顯得簡單一些，標紅的字段依然是“核心”，我們使用的map中的key和value就存儲在這里。“高位哈希值”數組記錄的是當前bucket中key相關的“索引”，稍后會詳細敘述。還有一個字段是一個指向擴容后的bucket的指針，使得bucket會形成一個鏈表結構。例如下圖：

由此看出hmap和bucket的關系是這樣的：

而bucket又是一個鏈表，所以，整體的結構應該是這樣的：

哈希表的特點是會有一個哈希函數，對你傳來的key進行哈希運算，得到唯一的值，一般情況下都是一個數值。Golang的map中也有這么一個哈希函數，也會算出唯一的值，對於這個值的使用，Golang也是很有意思。

Golang把求得的值按照用途一分為二：高位和低位。

這里寫圖片描述

如圖所示，藍色為高位，紅色為低位。然后低位用於尋找當前key屬於hmap中的哪個bucket，而高位用於尋找bucket中的哪個key。上文中提到：bucket中有個屬性字段是“高位哈希值”數組，這里存的就是藍色的高位值，用來聲明當前bucket中有哪些“key”，便於搜索查找。需要特別指出的一點是：我們map中的key/value值都是存到同一個數組中的。數組中的順序是這樣的:

這里寫圖片描述

並不是key0/value0/key1/value1的形式，這樣做的好處是：在key和value的長度不同的時候，可以消除padding(內存對齊)帶來的空間浪費。

現在，我們可以得到Go語言map的整個的結構圖了：(hash結果的低位用於選擇把KV放在bmap數組中的哪一個bmap中，高位用於key的快速預覽，用於快速試錯)

這里寫圖片描述

map的擴容

當以上的哈希表增長的時候，Go語言會將bucket數組的數量擴充一倍，產生一個新的bucket數組，並將舊數組的數據遷移至新數組。

加載因子
判斷擴充的條件，就是哈希表中的加載因子(即loadFactor)。

加載因子是一個閾值，一般表示為：散列包含的元素數除以位置總數。是一種“產生沖突機會”和“空間使用”的平衡與折中：加載因子越小，說明空間空置率高，空間使用率小，但是加載因子越大，說明空間利用率上去了，但是“產生沖突機會”高了。

每種哈希表的都會有一個加載因子，數值超過加載因子就會為哈希表擴容。
Golang的map的加載因子的公式是：map長度 / 2^B(這是代表bmap數組的長度，B是取的低位的位數)閾值是6.5。其中B可以理解為已擴容的次數。

當Go的map長度增長到大於加載因子所需的map長度時，Go語言就會將產生一個新的bucket數組，然后把舊的bucket數組移到一個屬性字段oldbucket中。注意：並不是立刻把舊的數組中的元素轉義到新的bucket當中，而是，只有當訪問到具體的某個bucket的時候，會把bucket中的數據轉移到新的bucket中。

如下圖所示：當擴容的時候，Go的map結構體中，會保存舊的數據，和新生成的數組

上面部分代表舊的有數據的bucket，下面部分代表新生成的新的bucket。藍色代表存有數據的bucket，橘黃色代表空的bucket。
擴容時map並不會立即把新數據做遷移，而是當訪問原來舊bucket的數據的時候，才把舊數據做遷移，如下圖：

注意：這里並不會直接刪除舊的bucket，而是把原來的引用去掉，利用GC清除內存。

map中數據的刪除
如果理解了map的整體結構，那么查找、更新、刪除的基本步驟應該都很清楚了。這里不再贅述。
值得注意的是，找到了map中的數據之后，針對key和value分別做如下操作：

1、如果``key``是一個指針類型的，則直接將其置為空，等待GC清除；
2、如果是值類型的，則清除相關內存。
3、同理，對``value``做相同的操作。
4、最后把key對應的高位值對應的數組index置為空。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 golang的引用類型(slice,map,channel)底層實現 go map底層實現 Map底層實現 Map的底層實現原理 golang底層實現資料 Golang Map實現（一） Golang Map 實現（二） golang中map的delete操作不會真正釋放底層內存 Golang - sync.map 設計思想和底層源碼分析 Golang Map實現（四） map 的賦值和擴容