帶你一文讀懂Python垃圾回收機(jī)制
得益于 Python 的自動(dòng)垃圾回收機(jī)制,在 Python 中創(chuàng)建對象時(shí)無須手動(dòng)釋放。這對開發(fā)者非常友好,讓開發(fā)者無須關(guān)注低層內(nèi)存管理。但如果對其垃圾回收機(jī)制不了解,很多時(shí)候?qū)懗龅?nbsp;Python 代碼會非常低效。
垃圾回收算法有很多,主要有: 引用計(jì)數(shù) 、 標(biāo)記-清除 、 分代收集 等。
在 python 中,垃圾回收算法以 引用計(jì)數(shù) 為主, 標(biāo)記-清除 和 分代收集 兩種機(jī)制為輔。
1 引用計(jì)數(shù)
1.1 引用計(jì)數(shù)算法原理
引用計(jì)數(shù)原理比較簡單:
每個(gè)對象有一個(gè)整型的引用計(jì)數(shù)屬性。用于記錄對象被引用的次數(shù)。例如對象 A ,如果有一個(gè)對象引用了 A ,則 A 的引用計(jì)數(shù) +1 。當(dāng)引用刪除時(shí), A 的引用計(jì)數(shù) -1 。當(dāng) A 的引用計(jì)數(shù)為0時(shí),即表示對象 A 不可能再被使用,直接回收。
在 Python 中,可以通過 sys 模塊的 getrefcount 函數(shù)獲取指定對象的引用計(jì)數(shù)器的值,我們以實(shí)際例子來看。
import sys
class A():
def __init__(self):
pass
a = A()
print(sys.getrefcount(a))運(yùn)行上面代碼,可以得到輸出結(jié)果為 2 。
1.2 計(jì)數(shù)器增減條件
上面我們看到,創(chuàng)建一個(gè) A 對象,并將對象賦值給 a 變量后,對象的引用計(jì)數(shù)器值為 2 。那么什么時(shí)候計(jì)數(shù)器會 +1 ,什么時(shí)候計(jì)數(shù)器會 -1 呢?
1.2.1 引用計(jì)數(shù)+1的條件
A() a=A() func(a) arr=[a,a]
1.2.2 引用計(jì)數(shù)-1的條件
對象被顯式銷毀,如 del a 。變量重新賦予新的對象,例如 a=0 。對象離開它的作用域,如 func 函數(shù)執(zhí)行完畢時(shí), func 函數(shù)中的局部變量(全局變量不會)。
對象所在的容器被銷毀,或從容器中刪除對象。
1.2.3 代碼實(shí)戰(zhàn)
為了更好的理解計(jì)數(shù)器的增減,我們運(yùn)行實(shí)際代碼,一目了然。
import sys
class A():
def __init__(self):
pass
print("創(chuàng)建對象 0 + 1 =", sys.getrefcount(A()))
a = A()
print("創(chuàng)建對象并賦值 0 + 2 =", sys.getrefcount(a))
b = a
c = a
print("賦給2個(gè)變量 2 + 2 =", sys.getrefcount(a))
b = None
print("變量重新賦值 4 - 1 =", sys.getrefcount(a))
del c
print("del對象 3 - 1 =", sys.getrefcount(a))
d = [a, a, a]
print("3次加入列表 2 + 3 =", sys.getrefcount(a))
def func(c):
print('傳入函數(shù) 1 + 2 = ', sys.getrefcount(c))
func(A())輸出結(jié)果如下:
創(chuàng)建對象 0 + 1 = 1 創(chuàng)建對象并賦值 0 + 2 = 2 賦給2個(gè)變量 2 + 2 = 4 變量重新賦值 4 - 1 = 3 del對象 3 - 1 = 2 3次加入列表 2 + 3 = 5 傳入函數(shù) 1 + 2 = 3
1.3 引用計(jì)數(shù)的優(yōu)點(diǎn)與缺點(diǎn)
1.3.1 引用計(jì)數(shù)優(yōu)點(diǎn)
- 高效、邏輯簡單,只需根據(jù)規(guī)則對計(jì)數(shù)器做加減法。
- 實(shí)時(shí)性。一旦對象的計(jì)數(shù)器為零,就說明對象永遠(yuǎn)不可能再被用到,無須等待特定時(shí)機(jī),直接釋放內(nèi)存。
1.3.2 引用計(jì)數(shù)缺點(diǎn)
需要為對象分配引用計(jì)數(shù)空間,增大了內(nèi)存消耗。
當(dāng)需要釋放的對象比較大時(shí),如字典對象,需要對引用的所有對象循環(huán)嵌套調(diào)用,可能耗時(shí)比較長。
循環(huán)引用。 這是引用計(jì)數(shù)的致命傷,引用計(jì)數(shù)對此是無解的,因此必須要使用其它的垃圾回收算法對其進(jìn)行補(bǔ)充。

2 標(biāo)記-清除
上一小節(jié)提到,引用計(jì)數(shù)算法無法解決循環(huán)引用問題,循環(huán)引用的對象會導(dǎo)致大家的計(jì)數(shù)器永遠(yuǎn)都不會等于 0 ,帶來無法回收的問題。
標(biāo)記-清除 算法主要用于潛在的循環(huán)引用問題,該算法分為2步:
- 標(biāo)記階段。將所有的對象看成圖的節(jié)點(diǎn),根據(jù)對象的引用關(guān)系構(gòu)造圖結(jié)構(gòu)。從圖的根節(jié)點(diǎn)遍歷所有的對象,所有訪問到的對象被打上標(biāo)記,表明對象是“可達(dá)”的。
- 清除階段。遍歷所有對象,如果發(fā)現(xiàn)某個(gè)對象沒有標(biāo)記為“可達(dá)”,則就回收。
以具體代碼示例說明:
class A():
def __init__(self):
self.obj = None
def func():
a = A()
b = A()
c = A()
d = A()
a.obj = b
b.obj = a
return [c, d]
e = func()上面代碼中,a和b相互引用,e引用了c和d。整個(gè)引用關(guān)系如下圖所示

如果采用引用計(jì)數(shù)器算法,那么a和b兩個(gè)對象將無法被回收。而采用標(biāo)記清除法,從根節(jié)點(diǎn)(即e對象)開始遍歷,c、d、e三個(gè)對象都會被標(biāo)記為 可達(dá) ,而a和b無法被標(biāo)記。因此a和b會被回收。
這是讀者可能會有疑問,為什么確定根節(jié)點(diǎn)是e,而不會是a、b、c、d呢?這里就有講究了,什么樣的對象會被看成是根節(jié)點(diǎn)呢?一般而言,根節(jié)點(diǎn)的選取包括(但不限于)如下幾種:
- 當(dāng)前棧幀中的本地變量表中引用的對象,如各個(gè)線程被調(diào)用的方法堆棧中使用到的參數(shù)、 局部變量、 臨時(shí)變量等。
- 全局靜態(tài)變量
- ...
3 分代收集
3.1 分代收集原理
在執(zhí)行垃圾回收過程中,程序會被暫停,即 stop-the-world 。這里很好理解:你媽媽在打掃房間的時(shí)候,肯定不允許你在房間內(nèi)到處丟垃圾,要不然永遠(yuǎn)也無法打掃干凈。
為了減少程序的暫停時(shí)間,采用 分代回收 ( Generational Collection )降低垃圾收集耗時(shí)。
分代回收基于這樣的法則:
- 接大部分的對象生命周期短,大部分對象都是朝生夕滅。
- 經(jīng)歷越多次數(shù)的垃圾收集且活下來的對象,說明該對象越不可能是垃圾,應(yīng)該越少去收集。
Python 中,對象一共有3種世代: G0 , G1 , G2 。
- 對象剛創(chuàng)建時(shí)為
G0。 - 如果在一輪
GC掃描中存活下來,則移至G1,處于G1的對象被掃描次數(shù)會減少。 - 如果再次在掃描中活下來,則進(jìn)入
G2,處于G1的對象被掃描次數(shù)將會更少。
3.2 觸發(fā)GC時(shí)機(jī)
當(dāng)某世代中分配的對象數(shù)量與被釋放的對象之差達(dá)到某個(gè)閾值的時(shí),將觸發(fā)對該代的掃描。當(dāng)某世代觸發(fā)掃描時(shí),比該世代年輕的世代也會觸發(fā)掃描。
那么這個(gè)閾值是多少呢?我們可以通過代碼查看或者修改,示例代碼如下
import gc
threshold = gc.get_threshold()
print("各世代的閾值:", threshold)
# 設(shè)置各世代閾值
# gc.set_threshold(threshold0[, threshold1[, threshold2]])
gc.set_threshold(800, 20, 20)輸出結(jié)果如下:
各世代的閾值: (700, 10, 10)
到此這篇關(guān)于帶你一文讀懂Python垃圾回收機(jī)制的文章就介紹到這了,更多相關(guān)Python垃圾回收機(jī)制內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python 動(dòng)態(tài)渲染 mysql 配置文件的示例
這篇文章主要介紹了python 動(dòng)態(tài)渲染 mysql 配置文件的示例,幫助大家更好的理解和使用python,感興趣的朋友可以了解下2020-11-11
Python時(shí)區(qū)設(shè)置方法與pytz查詢時(shí)區(qū)教程
這篇文章主要介紹了Python時(shí)區(qū)設(shè)置的方法和pytz查詢時(shí)區(qū)的方法,大家參考使用吧2013-11-11
matplotlib subplots 設(shè)置總圖的標(biāo)題方法
今天小編就為大家分享一篇matplotlib subplots 設(shè)置總圖的標(biāo)題方法,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-05-05
關(guān)于Python自動(dòng)化操作Excel
這篇文章主要介紹了關(guān)于Python自動(dòng)化操作Excel, Python 是一種功能強(qiáng)大的編程語言,可以用于許多任務(wù),包括處理 Excel 文件,需要的朋友可以參考下2023-04-04
使用Python進(jìn)行時(shí)間序列分析的8種繪圖類型
時(shí)間序列數(shù)據(jù)是按時(shí)間順序按固定時(shí)間間隔排列的觀測值的集合,每個(gè)觀察對應(yīng)于一個(gè)特定的時(shí)間點(diǎn),并且可以以各種頻率(例如,每天、每月、每年)記錄數(shù)據(jù),本文介紹了幾種類型的繪圖,可幫助您使用 Python 進(jìn)行時(shí)間序列分析,并提供使用可免費(fèi)訪問的數(shù)據(jù)集的詳細(xì)示例2023-09-09
68行Python代碼實(shí)現(xiàn)帶難度升級的貪吃蛇
本文主要介紹了Python代碼實(shí)現(xiàn)帶難度升級的貪吃蛇,文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-01-01
Python Web框架之Django框架cookie和session用法分析
這篇文章主要介紹了Python Web框架之Django框架cookie和session用法,結(jié)合實(shí)例形式分析了Django框架cookie和session的常見使用技巧與操作注意事項(xiàng),需要的朋友可以參考下2019-08-08
python經(jīng)典趣味24點(diǎn)游戲程序設(shè)計(jì)
這篇文章主要介紹了python經(jīng)典趣味24點(diǎn)游戲程序設(shè)計(jì),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07

