快捷導(dǎo)航

詳解Go是如何優(yōu)雅的進(jìn)行內(nèi)存管理

更新時(shí)間：2023年09月24日 14:10:25 作者：MysTic_Zhong

Go語言拋棄C/C++中的開發(fā)者管理內(nèi)存的方式,實(shí)現(xiàn)了主動(dòng)申請與主動(dòng)釋放管理,增加了逃逸分析和垃圾回收,將開發(fā)者從內(nèi)存管理中釋放出來,作為進(jìn)階的Go開發(fā),了解掌握Go的內(nèi)存管理還是很有必要的

前言

Go語言拋棄C/C++中的開發(fā)者管理內(nèi)存的方式，實(shí)現(xiàn)了主動(dòng)申請與主動(dòng)釋放管理，增加了逃逸分析和垃圾回收，將開發(fā)者從內(nèi)存管理中釋放出來。
所以我們在日常編寫代碼的時(shí)候不需要精通內(nèi)存的管理，它確實(shí)很復(fù)雜。但是另一方面，如果你掌握了Go內(nèi)存管理的基本概念和知識(shí)點(diǎn)，可以讓你寫出更高質(zhì)量的，更壓榨機(jī)器性能的代碼；另外，還能幫助你更快更精準(zhǔn)得定位Bug，快速解決問題。所以，作為進(jìn)階的Go開發(fā)，了解掌握Go的內(nèi)存管理還是很有必要的。

管理分配

核心思想

Go在程序啟動(dòng)的時(shí)候，會(huì)分配一塊連續(xù)的內(nèi)存（虛擬的地址空間，還沒有真正地分配內(nèi)存），切成小塊后自己進(jìn)行管理，對內(nèi)存的分配遵循以下思想。

1.每次從操作系統(tǒng)申請一大塊內(nèi)存, 以減少系統(tǒng)調(diào)用。

2.將申請到的大塊內(nèi)存按照特定大小預(yù)先切分成小塊, 構(gòu)成鏈表。

3.為對象分配內(nèi)存時(shí), 只需從大小合適的鏈表提取一個(gè)小塊即可。

4.回收對象內(nèi)存時(shí), 將該小塊內(nèi)存重新歸還到原鏈表, 以便復(fù)用。

5.如閑置內(nèi)存過多, 則嘗試歸還部分內(nèi)存給操作系統(tǒng), 降低整體開銷。

內(nèi)存管理由mcache、mcentral、mheap組成一個(gè)三級管理結(jié)構(gòu)，本質(zhì)上都是對mspan的管理，三者用于不同的目的來共同配合管理所有mspan。

mspan

mspan是Go中內(nèi)存管理的基本單元，是由一片連續(xù)的8kB的page組成的內(nèi)存塊。但是小對象和大對象分配的位置不用，大對象在mheap上分配，mheap向操作系統(tǒng)申請新內(nèi)存時(shí)，是向虛擬內(nèi)存申請；小對象使用mcache的tiny分配器分配。
一組連續(xù)的Page組成1個(gè)Span，go把內(nèi)存分為67個(gè)大小不同的span，并且大小是不固定的。

源碼文件src/runtime/sizeclasses.go對67種span的定義（源碼版本為go-1.17.1,本文下所有源碼展示均為此版本）

延伸擴(kuò)展：67種定義列表里面有一列的名稱叫做"max waste",代表的是這個(gè)span下可能出現(xiàn)的最大內(nèi)存浪費(fèi)比例。舉個(gè)例子解釋，看第4個(gè)規(guī)格的情況：

class  bytes/obj  bytes/span  objects  tail waste  max waste  min align
    4         32        8192      256           0     21.88%         32

4的對象最小內(nèi)存長度為25字節(jié)（因?yàn)樾∮?5的只會(huì)申請3或3以下的，要不到4），所以如果每個(gè)object都被25字節(jié)的對象申請，此時(shí)內(nèi)存浪費(fèi)最大，對應(yīng)浪費(fèi)率為：(32-25)/32 = 21.88%。

再通過觀察整個(gè)列表可以看到，"max waste"一列并非線性遞減的，熟悉Linux的同學(xué)應(yīng)該猜到原因了，沒錯(cuò)，這個(gè)設(shè)計(jì)跟大名鼎鼎的伙伴算法是非常相似的。

伙伴算法（buddy算法），就是將內(nèi)存分成若干塊，然后以最適合的方式滿足程序內(nèi)存需求的一種內(nèi)存管理算法，伙伴算法是盡可能地在提高內(nèi)存利用率的同時(shí)減少內(nèi)存碎片。但是算法中，一個(gè)很小的塊往往會(huì)阻礙一個(gè)大塊的合并，一個(gè)系統(tǒng)中，對內(nèi)存塊的分配，大小是隨機(jī)的，一片內(nèi)存中僅一個(gè)小的內(nèi)存塊沒有釋放，旁邊兩個(gè)大的就不能合并，這也是造成上面現(xiàn)象的根因。（完整解讀伙伴算法需要非常大的篇幅和難度，本文就不展開了，文章最后有參考鏈接，讀者可自行研究）

回來主題，上面說到的Spans有3種類型：
空閑-span，沒有對象，可以釋放回操作系統(tǒng)，或重用于堆分配，或重用于堆棧內(nèi)存。
正在使用-span，至少有一個(gè)堆對象，可能有更多的空間。
棧-span，用于 goroutine 堆棧。此跨度可以存在于堆棧中或堆中，但不能同時(shí)存在。

源碼文件src/runtime/mheap.go對mspan結(jié)構(gòu)體的定義

type mspan struct {
	next *mspan     // 鏈表后向指針
	prev *mspan     // 鏈表前向指針
	list *mSpanList // 雙端隊(duì)列的head（已無實(shí)際用途）
	startAddr uintptr // span起始位置的地址指針
	npages    uintptr // 可供分配的頁數(shù)
	...
	manualFreeList gclinkptr // 在mSpanManual的空閑對象
	allocCache uint64  // 在freeindex處的allocBits的緩存
	...
	allocBits  *gcBits // 標(biāo)記span中的elem哪些是被使用的，哪些是未被使用的
	gcmarkBits *gcBits // 標(biāo)記span中的elem哪些是被標(biāo)記的，哪些是未被標(biāo)記的
	speciallock mutex  // 互斥鎖
}

管理組件說明

內(nèi)存管理器由mcache, mcentral, mheap3種組件構(gòu)成：三級管理結(jié)構(gòu)是為了方便對span進(jìn)行管理，加速對span對象的訪問和分配，這三個(gè)結(jié)構(gòu)在runtime中分別有對應(yīng)的mcache.go、mcentral.go、mheap.go文件。

mcache：保存的是各種大小的Span，并按Span class分類，小對象直接從mcache分配內(nèi)存，它起到了緩存的作用，并且可以無鎖訪問Go中是每個(gè)P擁有1個(gè)mcache，因?yàn)樵贕o程序中，當(dāng)前最多有GOMAXPROCS個(gè)線程在運(yùn)行，所以最多需要GOMAXPROCS個(gè)mcache就可以保證各線程對mcache的無鎖訪問。
mcentral：是所有線程共享的緩存，需要加鎖訪問，它按Span class對Span分類，串聯(lián)成鏈表，當(dāng)mcache的某個(gè)級別Span的內(nèi)存被分配光時(shí)，它會(huì)向mcentral申請1個(gè)當(dāng)前級別的Span。
mheap：是堆內(nèi)存的抽象，把從OS（系統(tǒng)）申請出的內(nèi)存頁組織成Span，并保存起來。當(dāng)mcentral的Span不夠用時(shí)會(huì)向mheap申請，mheap的Span不夠用時(shí)會(huì)向OS申請，向OS的內(nèi)存申請是按頁來的，然后把申請來的內(nèi)存頁生成Span組織起來，同樣也是需要加鎖訪問的。mheap主要用于大對象的內(nèi)存分配，以及管理未切割的mspan，用于給mcentral切割成小對象。

熟悉的金字塔，熟悉的結(jié)構(gòu)

通俗的理解：mcache, mcentral, mheap就是對ThreadCache, CentralCache, PageHeap的繼承沿用和基于go體系的優(yōu)化處理版本。

分配流程

Go的內(nèi)存分配器在分配對象時(shí)，根據(jù)對象的大小，分成三類：小對象（<=16B）、一般對象（>16B && <=32KB）、大對象（>32KB）。

源碼文件src/runtime/malloc.go根據(jù)分配對象的大小選擇對應(yīng)的空間申請

大體上的分配流程：
1.>32KB 的對象，直接從mheap上分配。
2.<=16B 的對象使用mcache的tiny分配器分配。
3.>16B && <=32KB 的對象，首先計(jì)算對象的規(guī)格大小，然后使用mcache中相應(yīng)規(guī)格大小的mspan分配。
如果mcache沒有相應(yīng)規(guī)格大小的mspan，則向mcentral申請；如果mcentral沒有相應(yīng)規(guī)格大小的mspan，則向mheap申請；如果mheap中也沒有合適大小的mspan，則向OS申請。

源碼文件src/runtime/mheap.go內(nèi)存分配初始化過程

小結(jié)

Go內(nèi)存管理源自TCMalloc，優(yōu)秀作品源于繼承和優(yōu)化（在這里我自己想到了一句話：如果說我比別人看得更遠(yuǎn)些，那是因?yàn)槲艺驹诹司奕说募缟?-牛頓）。但它比TCMalloc還多了2件東西：逃逸分析（后面篇幅會(huì)提及）和垃圾回收。

總結(jié)一下它在底層設(shè)計(jì)上著重用到的2個(gè)重要觀念：

使用緩存提高效率：在存儲(chǔ)的整個(gè)體系中到處可見緩存的思想，利用緩存減少了系統(tǒng)調(diào)用的次數(shù)，降低了鎖的粒度、減少加鎖的次數(shù)，提高了管理效率。

以空間換時(shí)間：空間換時(shí)間是一種常用的性能優(yōu)化思想，數(shù)據(jù)庫的索引/許多數(shù)據(jù)結(jié)構(gòu)的本質(zhì)就是空間換時(shí)間。

關(guān)聯(lián)知識(shí)點(diǎn)

逃逸分析

Go堆內(nèi)存所使用的內(nèi)存頁與goroutine的棧所使用的內(nèi)存頁是交織在一起的，帶GC（垃圾回收）功能的GO語言會(huì)對位于堆上的對象進(jìn)行自動(dòng)管理。當(dāng)某個(gè)對象不可達(dá)時(shí)，即沒有其對象引用它時(shí)，它將會(huì)被回收并被重用（三色標(biāo)記）。但GC是會(huì)給程序帶來性能損耗的，尤其是當(dāng)堆內(nèi)存上有大量待掃描的堆內(nèi)存對象時(shí)，將會(huì)給GC帶來過大的壓力，從而消耗更多的計(jì)算和存儲(chǔ)資源。于是開發(fā)者們都想盡量減少在堆上的內(nèi)存分配，可以在棧上分配的變量盡量留在棧上。

逃逸分析（escape analysis）就是在程序編譯階段根據(jù)程序代碼中的數(shù)據(jù)流，對代碼中哪些變量需要在棧上分配，哪些變量需要在堆上分配進(jìn)行靜態(tài)分析的方法。

分析準(zhǔn)則：逃逸分析是在編譯器完成的，也就是只存在于編譯階段；如果變量在函數(shù)外部沒有引用，則優(yōu)先放到棧中；如果變量在函數(shù)外部存在引用，則必定放在堆中。

命令：go build -gcflags '-m -m -l' xxx.go

內(nèi)存對齊

CPU訪問內(nèi)存時(shí)，并不是逐個(gè)字節(jié)訪問，而是以字長為單位訪問。這樣是為了是減少CPU訪問內(nèi)存的次數(shù)，提升CPU訪問內(nèi)存的吞吐量。如果訪問對象在內(nèi)存的存儲(chǔ)空間是對齊的話，CPU讀取一次即可，否則就要讀取兩次甚至多次，如下圖清晰可見。

對齊規(guī)則

1.第一個(gè)成員在與結(jié)構(gòu)體變量偏移量為0的地址處；2.其他成員變量要對齊到對齊數(shù)的整數(shù)倍的地址處；3.結(jié)構(gòu)體總大小為最大對齊數(shù)的整數(shù)倍。

下圖是不同類型的對齊系數(shù)和占用字節(jié)數(shù)

所以我們在日常編碼過程中，要盡量對結(jié)構(gòu)體的變量類型做針對性的順序調(diào)整，以符合對齊原則。

One More Thing

介紹完了Go的情況，最后來簡單看下其他語言的，作者本人對Java不太熟悉，就不摻和了，就用最簡單的描述來講一下相對熟悉的php和python。

php：php也是有一個(gè)基本的分配單元叫chunk，chunk分配了512個(gè)page，page的大小為4KB。內(nèi)存分配模式也是有3種，small（小于等于3KB），large（大于3KB小于等于2MB-4KB內(nèi)存），huge（大于2MB-4KB內(nèi)存），GC機(jī)制是引用計(jì)數(shù)方式，對堆區(qū)zend_mm_heap的管控就相對非常隨意了（純個(gè)人心得理解）。

python：py最大的特色是有個(gè)內(nèi)存池，可以減少內(nèi)存碎片化，提高執(zhí)行效率?；厥諜C(jī)制也是引用計(jì)數(shù)，但是它有標(biāo)記/清除和分代回收兩個(gè)輔助功能。

綜合3種語言對比，可以看到既有共同交集的地方，也有各自的私有屬性特色，各自的管理分配方式用到自己的語言環(huán)境下都能發(fā)揮最大的作用和效率。這也驗(yàn)證了一句至高的哲學(xué)：方案設(shè)計(jì)或者架構(gòu)理念，是沒有最優(yōu)秀最完美的，但是會(huì)有最適合最貼近使用場景的。

以上就是詳解Go是如何優(yōu)雅進(jìn)行內(nèi)存管理的詳細(xì)內(nèi)容，更多關(guān)于Go內(nèi)存管理的資料請關(guān)注腳本之家其它相關(guān)文章！

您可能感興趣的文章: