Golang Map 實現（二）

本文轉載自查看原文 2020-04-26 09:41 1291 golang

本文在golang map 數據結構的基礎上，學習一個make 是如何構造的。

map 創建示例

在golang 中，初始化一個map 算是有兩種方式。

example1Map := make(map[int64]string)
example2Map := make(map[int64]string, 100)

第一種方式默認不指定map的容量，第二種會指定后續map的容量估計為100，希望在創建的時候把空間就分配好。

當make創建map時，底層做了什么

對於不同的初始化方式，會使用不同的方式。下面是提供的幾種初始化方法：

// hint 就是 make 初始化map 的第二個參數
func makemap(t *maptype, hint int, h *hmap) *hmap
func makemap64(t *maptype, hint int64, h *hmap) *hmap
func makemap_small() *hmap

區別在於：
如果不指定 hint，就調用makemap_small；
如果make 第二個參數為int64, 則調用makemap64；
其他情況調用makemap方法。下面我們逐一學習。

makemap_small

func makemap_small() *hmap {  
  h := new(hmap)
  h.hash0 = fastrand()
  return h
}

fastrand 是創建一個seed，在生成hash值時使用。
所以在makemap_small 時，只是創建了一個hmap 的結構體，並沒有初始化buckets.

makemap64

func makemap64(t *maptype, hint int64, h *hmap) *hmap {
  if int64(int(hint)) != hint {
    hint = 0
  }
  return makemap(t, int(hint), h)
}

makemap64 是對於傳入的第二個參數為int64 的變量使用的。如果hint的值大於int最大值，就將hint賦值為0，否則和makemap 初始化沒有差別。為什么不把大於2^31 - 1 的map 直接初始化呢？因為在hmap 中 count 的值就是int，也就是說map最大就是 2^31 - 1 的大小。

makemap

這個是初始化map的核心代碼了，需要我們慢慢品味。

一開始，我們需要了解下maptype這個結構， maptype 標識一個map 數據類型的定義，當然還有其他的類型，比如說interfacetype，slicetype，chantype 等。maptype 的定義如下：

type maptype struct {
  typ        _type  // type 類型
  key        *_type // key 的type
  elem       *_type // value 的type
  bucket     *_type // internal type representing a hash bucket
  keysize    uint8  // key 的大小
  valuesize  uint8  // value 的大小
  bucketsize uint16 // size of bucket
  flags      uint32
}

maptype 里面存儲了kv的對象類型，bucket類型，以及kv占用內存的大小。以及bucketsize的大小，還有一些標記字段（flags）。在map 實現時，需要用到這些字段做偏移計算等。

下面是 makemap 的代碼：


// hint 需要創建的 map 大小(預計要添加多少元素)
func makemap(t *maptype, hint int, h *hmap) *hmap {
  mem, overflow := math.MulUintptr(uintptr(hint), t.bucket.size)
  if overflow || mem > maxAlloc {
    hint = 0
  }

  // initialize Hmap
  if h == nil {
    h = new(hmap)
  }

  // xorshift64+ 算法, 可以研究下
  h.hash0 = fastrand()

  // 計算B 的值
  // 如果大於8，就先申請好。
  // 申請規則就是剛好滿足 hint < 6.5 * 2 ^ B 的時候 （B 最大是63）
  // 其中6.5 相當於每個bucket 鏈表中，平均有6.5個bucket
  // 所以最長的map，應該是 6.5 * 2^63 (正常用肯定不會溢出)
  
  B := uint8(0)
  for overLoadFactor(hint, B) {
    B++
  }
  h.B = B

  // 接着數據初始化, 如果 容量小於等於8的，就在用的時候初始化, B 為0
  if h.B != 0 {
    var nextOverflow *bmap
    // 申請一個buckets 數組
    h.buckets, nextOverflow = makeBucketArray(t, h.B, nil)
    if nextOverflow != nil {
      h.extra = new(mapextra)
      h.extra.nextOverflow = nextOverflow
    }
  }

  return h
}

首先，通過bucketsize 和hint 的值，計算出需要分配的內存大小mem，以及是否會overflow （大於指針的最大地址范圍），如果溢出或者申請的內存大於最大可以申請的內存時，就設置hint為0了，直接不初始化buckets了。

接着，和makemap_small 一樣，初始化一個隨機的種子。

然后，計算B的值. 在overLoadfactor 中，判斷了hint 的大小。如果小於等於8，那B就不再賦值，直接不初始化數據。如果B大於8，那就計算B了。這里涉及到一個填充因子的概念。大概意思就是說，每個hash值（也就是pos）中，平均放多少個kv數據，默認是6.5；所以判斷標准就是hint 必須滿足如下的條件：

hint < 6.5 * (1 << B)

通過增加B的值，直到上面的表達式滿足為止。這樣B就初始化好了。

最后，申請一個bucket數組，賦值給buckets，如果有多申請出來的buckets，那就賦值給extra.nextOverflow, 當溢出之后，從多申請出來的buckets 里面取（也是為了避免內存分配）。

下面就詳細看下初始化一個buckets的構建。

makeBucketArray

makeBucketArray 用於初始化一個Bucket 數組。也就是hmap 中的buckets，下面是相關代碼：

func makeBucketArray(t *maptype, b uint8, dirtyalloc unsafe.Pointer) (buckets unsafe.Pointer, nextOverflow *bmap) {
  base := bucketShift(b)
  nbuckets := base
  // 為了防止溢出的遷移，加一點冗余的bucket
  if b >= 4 {  
    // ... 修改nbuckets
  }

  // 如果之前沒有分配過，那直接分配
  if dirtyalloc == nil {
    buckets = newarray(t.bucket, int(nbuckets))
  } else {
    // 使用以前分配好的
    buckets = dirtyalloc
    size := t.bucket.size * nbuckets
    if t.bucket.kind&kindNoPointers == 0 {
      memclrHasPointers(buckets, size)
    } else {
      memclrNoHeapPointers(buckets, size)
    }
  }

  if base != nbuckets {
	// 處理多申請出來的bucket
  }
  return buckets, nextOverflow
}

這里用到了比較多的指針計算，需要細細品讀。

首先，就是就是通過B計算一個base值，base = 1 << B （2 ^ B)
nbuckets 是需要申請的數組的長度，正常情況下 base 值就是數組長度。但是，如果 base 大於16時，會預分配一些需要后期做overflow的bucket。這個overflow的計算規則如下：

    nbuckets += bucketShift(b - 4)
    sz := t.bucket.size * nbuckets
    up := roundupsize(sz)
    if up != sz {
      nbuckets = up / t.bucket.size
    }

在base 的基礎上，多分配 base / 16 長度的bucket。然后根據內存的分配規則（包括了頁大小和內存對齊等規則），計算出合適的分配內存的大小，然后計算出 bucket 的分配個數 nbuckets.

其次，如果有之前未分配內存，那就初始化一個數組（終於等到了這一步），如過有dirtyalloc，那就使用dirtyalloc 的內存（其實是用來清除map中數據使用的），然后把dirtyalloc中不需要的數據清除引用。
最后，如果除了需要申請的base 長度的bucket外，還多申請了一些bucket，下面是對多申請的數據做的處理：

    // 上面添加了一些nbuckets 防止溢出，所以B 值取模就不太合理了，所以有一個mapextra 的數據節點
    // 數據分配也很有趣，從剛申請的buckets數組中，取出后面的一段分給mapextra
    // nextOverflow 分配給mapextra
    nextOverflow = (*bmap)(add(buckets, base*uintptr(t.bucketsize)))

    // 取nextOverflow 里面的最后一個元素，並把最后一個buckets 的末尾偏移的指針指向空閑的bucket (目前就是第一個buckets 了)
    last := (*bmap)(add(buckets, (nbuckets-1)*uintptr(t.bucketsize)))
    last.setoverflow(t, (*bmap)(buckets))

先計算出多申請出來的內存地址 nextOverflow，然后計算出申請的最后一塊bucket的地址，然后將最后一塊bucket的overflow指針（指向鏈表的指針）指向buckets 的首部。原因呢，是為了將來判斷是否還有空的bucket 可以讓溢出的bucket空間使用。

今天的作業就交完了。下一篇將學習golang map的數據初始化實現。

參考

[1] 深入理解 Go map:初始化和訪問

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Golang Map實現（一） golang map實現原理淺析源碼解讀 Golang 的 sync.Map 實現原理 golang ----map按key排序 Golang教程：Map Golang:sync.Map golang map 聲明，賦值 golang struct轉map golang map是線程安全的嗎 golang之map進階