Go語言內置運行時(就是runtime),拋棄了傳統的內存分配方式,改為自主管理。這樣可以自主地實現更好的內存使用模式,比如內存池、預分配等等。這樣,不會每次內存分配都需要進行系統調用。
Golang運行時的內存分配算法主要源自 Google 為 C 語言開發的TCMalloc算法
,全稱Thread-Caching Malloc
。核心思想就是把內存分為多級管理,從而降低鎖的粒度。它將可用的堆內存采用二級分配的方式進行管理:每個線程都會自行維護一個獨立的內存池,進行內存分配時優先從該內存池中分配,當內存池不足時才會向全局內存池申請,以避免不同線程對全局內存池的頻繁競爭。
基礎概念
Go在程序啟動的時候,會先向操作系統申請一塊內存(注意這時還只是一段虛擬的地址空間,並不會真正地分配內存),切成小塊后自己進行管理。
申請到的內存塊被分配了三個區域,在X64上分別是512MB,16GB,512GB大小。
arena區域
就是我們所謂的堆區,Go動態分配的內存都是在這個區域,它把內存分割成8KB
大小的頁,一些頁組合起來稱為mspan
。
bitmap區域
標識arena
區域哪些地址保存了對象,並且用4bit
標志位表示對象是否包含指針、GC
標記信息。bitmap
中一個byte
大小的內存對應arena
區域中4個指針大小(指針大小為 8B )的內存,所以bitmap
區域的大小是512GB/(4*8B)=16GB
。
從上圖其實還可以看到bitmap的高地址部分指向arena區域的低地址部分,也就是說bitmap的地址是由高地址向低地址增長的。
spans區域
存放mspan
(也就是一些arena
分割的頁組合起來的內存管理基本單元,后文會再講)的指針,每個指針對應一頁,所以spans
區域的大小就是512GB/8KB*8B=512MB
。除以8KB是計算arena
區域的頁數,而最后乘以8是計算spans
區域所有指針的大小。創建mspan
的時候,按頁填充對應的spans
區域,在回收object
時,根據地址很容易就能找到它所屬的mspan
。
內存管理單元
mspan
:Go中內存管理的基本單元,是由一片連續的8KB
的頁組成的大塊內存。注意,這里的頁和操作系統本身的頁並不是一回事,它一般是操作系統頁大小的幾倍。一句話概括:mspan
是一個包含起始地址、mspan
規格、頁的數量等內容的雙端鏈表。
每個mspan
按照它自身的屬性Size Class
的大小分割成若干個object
,每個object
可存儲一個對象。並且會使用一個位圖來標記其尚未使用的object
。屬性Size Class
決定object
大小,而mspan
只會分配給和object
尺寸大小接近的對象,當然,對象的大小要小於object
大小。還有一個概念:Span Class
,它和Size Class
的含義差不多,
Size_Class = Span_Class / 2
這是因為其實每個 Size Class
有兩個mspan
,也就是有兩個Span Class
。其中一個分配給含有指針的對象,另一個分配給不含有指針的對象。這會給垃圾回收機制帶來利好,之后的文章再談。
如下圖,mspan
由一組連續的頁組成,按照一定大小划分成object
。
Go1.9.2里mspan
的Size Class
共有67種,每種mspan
分割的object大小是8*2n的倍數,這個是寫死在代碼里的:
// path: /usr/local/go/src/runtime/sizeclasses.go
const _NumSizeClasses = 67
var class_to_size = [_NumSizeClasses]uint16{0, 8, 16, 32, 48, 64, 80, 96, 112, 128, 144, 160, 176, 192, 208, 224, 240, 256, 288, 320, 352, 384, 416, 448, 480, 512, 576, 640, 704, 768, 896, 1024, 1152, 1280, 1408, 1536,1792, 2048, 2304, 2688, 3072, 3200, 3456, 4096, 4864, 5376, 6144, 6528, 6784, 6912, 8192, 9472, 9728, 10240, 10880, 12288, 13568, 14336, 16384, 18432, 19072, 20480, 21760, 24576, 27264, 28672, 32768}
根據mspan
的Size Class
可以得到它划分的object
大小。 比如Size Class
等於3,object
大小就是32B。 32B大小的object可以存儲對象大小范圍在17B~32B的對象。而對於微小對象(小於16B),分配器會將其進行合並,將幾個對象分配到同一個object
中。
數組里最大的數是32768,也就是32KB,超過此大小就是大對象了,它會被特別對待,這個稍后會再介紹。順便提一句,類型Size Class
為0表示大對象,它實際上直接由堆內存分配,而小對象都要通過mspan
來分配。
對於mspan來說,它的Size Class
會決定它所能分到的頁數,這也是寫死在代碼里的:
// path: /usr/local/go/src/runtime/sizeclasses.go
const _NumSizeClasses = 67
var class_to_allocnpages = [_NumSizeClasses]uint8{0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 2, 1, 2, 1, 3, 2, 3, 1, 3, 2, 3, 4, 5, 6, 1, 7, 6, 5, 4, 3, 5, 7, 2, 9, 7, 5, 8, 3, 10, 7, 4}
比如當我們要申請一個object
大小為32B
的mspan
的時候,在class_to_size里對應的索引是3,而索引3在class_to_allocnpages
數組里對應的頁數就是1。
mspan
結構體定義:
// path: /usr/local/go/src/runtime/mheap.go
type mspan struct {
//鏈表前向指針,用於將span鏈接起來
next *mspan
//鏈表前向指針,用於將span鏈接起來
prev *mspan
// 起始地址,也即所管理頁的地址
startAddr uintptr
// 管理的頁數
npages uintptr
// 塊個數,表示有多少個塊可供分配
nelems uintptr
//分配位圖,每一位代表一個塊是否已分配
allocBits *gcBits
// 已分配塊的個數
allocCount uint16
// class表中的class ID,和Size Classs相關
spanclass spanClass
// class表中的對象大小,也即塊大小
elemsize uintptr
}
我們將mspan
放到更大的視角來看:
上圖可以看到有兩個S
指向了同一個mspan
,因為這兩個S
指向的P
是同屬一個mspan
的。所以,通過arena
上的地址可以快速找到指向它的S
,通過S
就能找到mspan
,回憶一下前面我們說的mspan
區域的每個指針對應一頁。
假設最左邊第一個mspan
的Size Class
等於10,根據前面的class_to_size
數組,得出這個msapn
分割的object
大小是144B,算出可分配的對象個數是8KB/144B=56.89
個,取整56個,所以會有一些內存浪費掉了,Go的源碼里有所有Size Class
的mspan
浪費的內存的大小;再根據class_to_allocnpages
數組,得到這個mspan
只由1個page
組成;假設這個mspan
是分配給無指針對象的,那么spanClass
等於20。
startAddr
直接指向arena
區域的某個位置,表示這個mspan
的起始地址,allocBits
指向一個位圖,每位代表一個塊是否被分配了對象;allocCount
則表示總共已分配的對象個數。
這樣,左起第一個mspan
的各個字段參數就如下圖所示:
內存管理組件
內存分配由內存分配器完成。分配器由3種組件構成:mcache
, mcentral
, mheap
。
mcache
mcache
:每個工作線程都會綁定一個mcache,本地緩存可用的mspan
資源,這樣就可以直接給Goroutine分配,因為不存在多個Goroutine競爭的情況,所以不會消耗鎖資源。
mcache
的結構體定義:
//path: /usr/local/go/src/runtime/mcache.go
type mcache struct {
alloc [numSpanClasses]*mspan
}
numSpanClasses = _NumSizeClasses << 1
mcache
用Span Classes
作為索引管理多個用於分配的mspan
,它包含所有規格的mspan
。它是_NumSizeClasses
的2倍,也就是67*2=134
,為什么有一個兩倍的關系,前面我們提到過:為了加速之后內存回收的速度,數組里一半的mspan
中分配的對象不包含指針,另一半則包含指針。
對於無指針對象的mspan
在進行垃圾回收的時候無需進一步掃描它是否引用了其他活躍的對象。 后面的垃圾回收文章會再講到,這次先到這里。
mcache
在初始化的時候是沒有任何mspan
資源的,在使用過程中會動態地從mcentral
申請,之后會緩存下來。當對象小於等於32KB大小時,使用mcache
的相應規格的mspan
進行分配。
mcentral
mcentral
:為所有mcache
提供切分好的mspan
資源。每個central
保存一種特定大小的全局mspan
列表,包括已分配出去的和未分配出去的。 每個mcentral
對應一種mspan
,而mspan
的種類導致它分割的object
大小不同。當工作線程的mcache
中沒有合適(也就是特定大小的)的mspan
時就會從mcentral
獲取。
mcentral
被所有的工作線程共同享有,存在多個Goroutine競爭的情況,因此會消耗鎖資源。結構體定義:
//path: /usr/local/go/src/runtime/mcentral.go
type mcentral struct {
// 互斥鎖
lock mutex
// 規格
sizeclass int32
// 尚有空閑object的mspan鏈表
nonempty mSpanList
// 沒有空閑object的mspan鏈表,或者是已被mcache取走的msapn鏈表
empty mSpanList
// 已累計分配的對象個數
nmalloc uint64
}
empty
表示這條鏈表里的mspan
都被分配了object
,或者是已經被cache
取走了的mspan
,這個mspan
就被那個工作線程獨占了。而nonempty
則表示有空閑對象的mspan
列表。每個central
結構體都在mheap
中維護。
簡單說下mcache
從mcentral
獲取和歸還mspan
的流程:
-
獲取
加鎖;從nonempty
鏈表找到一個可用的mspan
;並將其從nonempty
鏈表刪除;將取出的mspan
加入到empty
鏈表;將mspan
返回給工作線程;解鎖。 -
歸還
加鎖;將mspan
從empty
鏈表刪除;將mspan
加入到nonempty
鏈表;解鎖。
mheap
mheap
:代表Go程序持有的所有堆空間,Go程序使用一個mheap
的全局對象_mheap
來管理堆內存。
當mcentral
沒有空閑的mspan
時,會向mheap
申請。而mheap
沒有資源時,會向操作系統申請新內存。mheap
主要用於大對象的內存分配,以及管理未切割的mspan
,用於給mcentral
切割成小對象。
同時我們也看到,mheap
中含有所有規格的mcentral
,所以,當一個mcache
從mcentral
申請mspan
時,只需要在獨立的mcentral
中使用鎖,並不會影響申請其他規格的mspan
。
mheap
結構體定義:
//path: /usr/local/go/src/runtime/mheap.go
type mheap struct {
lock mutex
// spans: 指向mspans區域,用於映射mspan和page的關系
spans []*mspan
// 指向bitmap首地址,bitmap是從高地址向低地址增長的
bitmap uintptr
// 指示arena區首地址
arena_start uintptr
// 指示arena區已使用地址位置
arena_used uintptr
// 指示arena區末地址
arena_end uintptr
central [67*2]struct {
mcentral mcentral
pad [sys.CacheLineSize - unsafe.Sizeof(mcentral{})%sys.CacheLineSize]byte
}
}
上圖我們看到,bitmap和arena_start指向了同一個地址,這是因為bitmap的地址是從高到低增長的,所以他們指向的內存位置相同。
內存分配流程
上一篇文章《Golang之變量去哪兒》中我們提到了,變量是在棧上分配還是在堆上分配,是由逃逸分析的結果決定的。通常情況下,編譯器是傾向於將變量分配到棧上的,因為它的開銷小,最極端的就是"zero garbage",所有的變量都會在棧上分配,這樣就不會存在內存碎片,垃圾回收之類的東西。
Go的內存分配器在分配對象時,根據對象的大小,分成三類:小對象(小於等於16B)、一般對象(大於16B,小於等於32KB)、大對象(大於32KB)。
大體上的分配流程:
-
32KB 的對象,直接從mheap上分配;
- <=16B 的對象使用mcache的tiny分配器分配;
- (16B,32KB] 的對象,首先計算對象的規格大小,然后使用mcache中相應規格大小的mspan分配;
- 如果mcache沒有相應規格大小的mspan,則向mcentral申請
- 如果mcentral沒有相應規格大小的mspan,則向mheap申請
- 如果mheap中也沒有合適大小的mspan,則向操作系統申請
總結
Go語言的內存分配非常復雜,它的一個原則就是能復用的一定要復用。源碼很難追,后面可能會再來一篇關於內存分配的源碼閱讀相關的文章。簡單總結一下本文吧。
文章從一個比較粗的角度來看Go的內存分配,並沒有深入細節。一般而言,了解它的原理,到這個程度也可以了。
- Go在程序啟動時,會向操作系統申請一大塊內存,之后自行管理。
- Go內存管理的基本單元是mspan,它由若干個頁組成,每種mspan可以分配特定大小的object。
- mcache, mcentral, mheap是Go內存管理的三大組件,層層遞進。mcache管理線程在本地緩存的mspan;mcentral管理全局的mspan供所有線程使用;mheap管理Go的所有動態分配內存。
- 極小對象會分配在一個object中,以節省資源,使用tiny分配器分配內存;一般小對象通過mspan分配內存;大對象則直接由mheap分配內存。
參考資料
【簡單易懂,非常清晰】https://yq.aliyun.com/articles/652551
【內存分配器的初始化過程,分配流程圖很詳細】https://www.jianshu.com/p/47691d870756
【全局的圖】https://swanspouse.github.io/2018/08/22/golang-memory-model/
【雨痕 Go1.5源碼閱讀】https://github.com/qyuhen/book
【圖不錯】https://www.jianshu.com/p/47691d870756
【整體感】https://juejin.im/post/59f2e19f5188253d6816d504
【源碼解讀】http://legendtkl.com/2017/04/02/golang-alloc/
【重點推薦 深入到晶體管了 圖很好】https://www.linuxzen.com/go-memory-allocator-visual-guide.html
【總體描述對象分配流程】http://gocode.cc/project/4/article/103
【實際Linux命令】https://mikespook.com/2014/12/理解-go-語言的內存使用/
【整體流程圖 對象分配函數調用鏈路】http://blog.newbmiao.com/2018/08/20/go-source-analysis-of-memory-alloc.html
【源碼講解 非常細致】https://www.cnblogs.com/zkweb/p/7880099.html