圖解Go語言內存分配

本文轉載自查看原文 2019-03-13 08:29 2944 Golang

基礎概念
內存管理單元
內存管理組件
- mcache
- mcentral
- mheap
內存分配流程
總結
參考資料

Go語言內置運行時（就是runtime），拋棄了傳統的內存分配方式，改為自主管理。這樣可以自主地實現更好的內存使用模式，比如內存池、預分配等等。這樣，不會每次內存分配都需要進行系統調用。

Golang運行時的內存分配算法主要源自 Google 為 C 語言開發的TCMalloc算法，全稱Thread-Caching Malloc。核心思想就是把內存分為多級管理，從而降低鎖的粒度。它將可用的堆內存采用二級分配的方式進行管理：每個線程都會自行維護一個獨立的內存池，進行內存分配時優先從該內存池中分配，當內存池不足時才會向全局內存池申請，以避免不同線程對全局內存池的頻繁競爭。

基礎概念

Go在程序啟動的時候，會先向操作系統申請一塊內存（注意這時還只是一段虛擬的地址空間，並不會真正地分配內存），切成小塊后自己進行管理。

申請到的內存塊被分配了三個區域，在X64上分別是512MB，16GB，512GB大小。

堆區總覽

arena區域就是我們所謂的堆區，Go動態分配的內存都是在這個區域，它把內存分割成8KB大小的頁，一些頁組合起來稱為mspan。

bitmap區域標識arena區域哪些地址保存了對象，並且用4bit標志位表示對象是否包含指針、GC標記信息。bitmap中一個byte大小的內存對應arena區域中4個指針大小（指針大小為 8B ）的內存，所以bitmap區域的大小是512GB/(4*8B)=16GB。

bitmap arena

從上圖其實還可以看到bitmap的高地址部分指向arena區域的低地址部分，也就是說bitmap的地址是由高地址向低地址增長的。

spans區域存放mspan（也就是一些arena分割的頁組合起來的內存管理基本單元，后文會再講）的指針，每個指針對應一頁，所以spans區域的大小就是512GB/8KB*8B=512MB。除以8KB是計算arena區域的頁數，而最后乘以8是計算spans區域所有指針的大小。創建mspan的時候，按頁填充對應的spans區域，在回收object時，根據地址很容易就能找到它所屬的mspan。

內存管理單元

mspan：Go中內存管理的基本單元，是由一片連續的8KB的頁組成的大塊內存。注意，這里的頁和操作系統本身的頁並不是一回事，它一般是操作系統頁大小的幾倍。一句話概括：mspan是一個包含起始地址、mspan規格、頁的數量等內容的雙端鏈表。

每個mspan按照它自身的屬性Size Class的大小分割成若干個object，每個object可存儲一個對象。並且會使用一個位圖來標記其尚未使用的object。屬性Size Class決定object大小，而mspan只會分配給和object尺寸大小接近的對象，當然，對象的大小要小於object大小。還有一個概念：Span Class，它和Size Class的含義差不多，

Size_Class = Span_Class / 2

這是因為其實每個 Size Class有兩個mspan，也就是有兩個Span Class。其中一個分配給含有指針的對象，另一個分配給不含有指針的對象。這會給垃圾回收機制帶來利好，之后的文章再談。

如下圖，mspan由一組連續的頁組成，按照一定大小划分成object。

page mspan

Go1.9.2里mspan的Size Class共有67種，每種mspan分割的object大小是8*2n的倍數，這個是寫死在代碼里的：

// path: /usr/local/go/src/runtime/sizeclasses.go

const _NumSizeClasses = 67

var class_to_size = [_NumSizeClasses]uint16{0, 8, 16, 32, 48, 64, 80, 96, 112, 128, 144, 160, 176, 192, 208, 224, 240, 256, 288, 320, 352, 384, 416, 448, 480, 512, 576, 640, 704, 768, 896, 1024, 1152, 1280, 1408, 1536,1792, 2048, 2304, 2688, 3072, 3200, 3456, 4096, 4864, 5376, 6144, 6528, 6784, 6912, 8192, 9472, 9728, 10240, 10880, 12288, 13568, 14336, 16384, 18432, 19072, 20480, 21760, 24576, 27264, 28672, 32768}

根據mspan的Size Class可以得到它划分的object大小。比如Size Class等於3，object大小就是32B。 32B大小的object可以存儲對象大小范圍在17B~32B的對象。而對於微小對象（小於16B），分配器會將其進行合並，將幾個對象分配到同一個object中。

數組里最大的數是32768，也就是32KB，超過此大小就是大對象了，它會被特別對待，這個稍后會再介紹。順便提一句，類型Size Class為0表示大對象，它實際上直接由堆內存分配，而小對象都要通過mspan來分配。

對於mspan來說，它的Size Class會決定它所能分到的頁數，這也是寫死在代碼里的：

// path: /usr/local/go/src/runtime/sizeclasses.go

const _NumSizeClasses = 67

var class_to_allocnpages = [_NumSizeClasses]uint8{0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 2, 1, 2, 1, 3, 2, 3, 1, 3, 2, 3, 4, 5, 6, 1, 7, 6, 5, 4, 3, 5, 7, 2, 9, 7, 5, 8, 3, 10, 7, 4}

比如當我們要申請一個object大小為32B的mspan的時候，在class_to_size里對應的索引是3，而索引3在class_to_allocnpages數組里對應的頁數就是1。

mspan結構體定義：

// path: /usr/local/go/src/runtime/mheap.go

type mspan struct {
    //鏈表前向指針，用於將span鏈接起來
	next *mspan	
	
	//鏈表前向指針，用於將span鏈接起來
	prev *mspan	
	
	// 起始地址，也即所管理頁的地址
	startAddr uintptr 
	
	// 管理的頁數
	npages uintptr 
	
	// 塊個數，表示有多少個塊可供分配
	nelems uintptr 

    //分配位圖，每一位代表一個塊是否已分配
	allocBits *gcBits 

    // 已分配塊的個數
	allocCount uint16 
	
	// class表中的class ID，和Size Classs相關
	spanclass spanClass  

    // class表中的對象大小，也即塊大小
	elemsize uintptr 
}

我們將mspan放到更大的視角來看：

mspan更大視角

上圖可以看到有兩個S指向了同一個mspan，因為這兩個S指向的P是同屬一個mspan的。所以，通過arena上的地址可以快速找到指向它的S，通過S就能找到mspan，回憶一下前面我們說的mspan區域的每個指針對應一頁。

假設最左邊第一個mspan的Size Class等於10，根據前面的class_to_size數組，得出這個msapn分割的object大小是144B，算出可分配的對象個數是8KB/144B=56.89個，取整56個，所以會有一些內存浪費掉了，Go的源碼里有所有Size Class的mspan浪費的內存的大小；再根據class_to_allocnpages數組，得到這個mspan只由1個page組成；假設這個mspan是分配給無指針對象的，那么spanClass等於20。

startAddr直接指向arena區域的某個位置，表示這個mspan的起始地址，allocBits指向一個位圖，每位代表一個塊是否被分配了對象；allocCount則表示總共已分配的對象個數。

這樣，左起第一個mspan的各個字段參數就如下圖所示：

左起第一個mspan具體值

內存管理組件

內存分配由內存分配器完成。分配器由3種組件構成：mcache, mcentral, mheap。

mcache

mcache：每個工作線程都會綁定一個mcache，本地緩存可用的mspan資源，這樣就可以直接給Goroutine分配，因為不存在多個Goroutine競爭的情況，所以不會消耗鎖資源。

mcache的結構體定義：

//path: /usr/local/go/src/runtime/mcache.go

type mcache struct {
    alloc [numSpanClasses]*mspan
}

numSpanClasses = _NumSizeClasses << 1

mcache用Span Classes作為索引管理多個用於分配的mspan，它包含所有規格的mspan。它是_NumSizeClasses的2倍，也就是67*2=134，為什么有一個兩倍的關系，前面我們提到過：為了加速之后內存回收的速度，數組里一半的mspan中分配的對象不包含指針，另一半則包含指針。

對於無指針對象的mspan在進行垃圾回收的時候無需進一步掃描它是否引用了其他活躍的對象。后面的垃圾回收文章會再講到，這次先到這里。

mcache

mcache在初始化的時候是沒有任何mspan資源的，在使用過程中會動態地從mcentral申請，之后會緩存下來。當對象小於等於32KB大小時，使用mcache的相應規格的mspan進行分配。

mcentral

mcentral：為所有mcache提供切分好的mspan資源。每個central保存一種特定大小的全局mspan列表，包括已分配出去的和未分配出去的。每個mcentral對應一種mspan，而mspan的種類導致它分割的object大小不同。當工作線程的mcache中沒有合適（也就是特定大小的）的mspan時就會從mcentral獲取。

mcentral被所有的工作線程共同享有，存在多個Goroutine競爭的情況，因此會消耗鎖資源。結構體定義：

//path: /usr/local/go/src/runtime/mcentral.go

type mcentral struct {
    // 互斥鎖
    lock mutex 
    
    // 規格
    sizeclass int32 
    
    // 尚有空閑object的mspan鏈表
    nonempty mSpanList 
    
    // 沒有空閑object的mspan鏈表，或者是已被mcache取走的msapn鏈表
    empty mSpanList 
    
    // 已累計分配的對象個數
    nmalloc uint64 
}

mcentral

empty表示這條鏈表里的mspan都被分配了object，或者是已經被cache取走了的mspan，這個mspan就被那個工作線程獨占了。而nonempty則表示有空閑對象的mspan列表。每個central結構體都在mheap中維護。

簡單說下mcache從mcentral獲取和歸還mspan的流程：

獲取
加鎖；從nonempty鏈表找到一個可用的mspan；並將其從nonempty鏈表刪除；將取出的mspan加入到empty鏈表；將mspan返回給工作線程；解鎖。
歸還
加鎖；將mspan從empty鏈表刪除；將mspan加入到nonempty鏈表；解鎖。

mheap

mheap：代表Go程序持有的所有堆空間，Go程序使用一個mheap的全局對象_mheap來管理堆內存。

當mcentral沒有空閑的mspan時，會向mheap申請。而mheap沒有資源時，會向操作系統申請新內存。mheap主要用於大對象的內存分配，以及管理未切割的mspan，用於給mcentral切割成小對象。

同時我們也看到，mheap中含有所有規格的mcentral，所以，當一個mcache從mcentral申請mspan時，只需要在獨立的mcentral中使用鎖，並不會影響申請其他規格的mspan。

mheap結構體定義：

//path: /usr/local/go/src/runtime/mheap.go

type mheap struct {
	lock mutex
	
	// spans: 指向mspans區域，用於映射mspan和page的關系
	spans []*mspan 
	
	// 指向bitmap首地址，bitmap是從高地址向低地址增長的
	bitmap uintptr 

    // 指示arena區首地址
	arena_start uintptr 
	
	// 指示arena區已使用地址位置
	arena_used  uintptr 
	
	// 指示arena區末地址
	arena_end   uintptr 

	central [67*2]struct {
		mcentral mcentral
		pad [sys.CacheLineSize - unsafe.Sizeof(mcentral{})%sys.CacheLineSize]byte
	}
}

mheap

上圖我們看到，bitmap和arena_start指向了同一個地址，這是因為bitmap的地址是從高到低增長的，所以他們指向的內存位置相同。

內存分配流程

上一篇文章《Golang之變量去哪兒》中我們提到了，變量是在棧上分配還是在堆上分配，是由逃逸分析的結果決定的。通常情況下，編譯器是傾向於將變量分配到棧上的，因為它的開銷小，最極端的就是"zero garbage"，所有的變量都會在棧上分配，這樣就不會存在內存碎片，垃圾回收之類的東西。

Go的內存分配器在分配對象時，根據對象的大小，分成三類：小對象（小於等於16B）、一般對象（大於16B，小於等於32KB）、大對象（大於32KB）。

大體上的分配流程：

32KB 的對象，直接從mheap上分配；
<=16B 的對象使用mcache的tiny分配器分配；
(16B,32KB] 的對象，首先計算對象的規格大小，然后使用mcache中相應規格大小的mspan分配；
- 如果mcache沒有相應規格大小的mspan，則向mcentral申請
- 如果mcentral沒有相應規格大小的mspan，則向mheap申請
- 如果mheap中也沒有合適大小的mspan，則向操作系統申請

總結

Go語言的內存分配非常復雜，它的一個原則就是能復用的一定要復用。源碼很難追，后面可能會再來一篇關於內存分配的源碼閱讀相關的文章。簡單總結一下本文吧。

文章從一個比較粗的角度來看Go的內存分配，並沒有深入細節。一般而言，了解它的原理，到這個程度也可以了。

Go在程序啟動時，會向操作系統申請一大塊內存，之后自行管理。
Go內存管理的基本單元是mspan，它由若干個頁組成，每種mspan可以分配特定大小的object。
mcache, mcentral, mheap是Go內存管理的三大組件，層層遞進。mcache管理線程在本地緩存的mspan；mcentral管理全局的mspan供所有線程使用；mheap管理Go的所有動態分配內存。
極小對象會分配在一個object中，以節省資源，使用tiny分配器分配內存；一般小對象通過mspan分配內存；大對象則直接由mheap分配內存。