python 垃圾收集機(jī)制的實(shí)例詳解
python 垃圾收集機(jī)制的實(shí)例詳解
pythonn垃圾收集方面的內(nèi)容如果要細(xì)講還是挺多的,這里只是做一個(gè)大概的概括
Python最主要和絕大多數(shù)時(shí)候用的都是引用計(jì)數(shù),每一個(gè)PyObject定義如下:
#define PyObject_HEAD \ Py_ssize_t ob_refcnt; \ struct _typeobject *ob_type; typedef struct _object { PyObject_HEAD } PyObject;
每個(gè)pyobject都有一個(gè)refcnt來(lái)記錄他們自己的引用數(shù),一旦引用數(shù)為0,就進(jìn)行回收
引用計(jì)數(shù)的優(yōu)點(diǎn)在于實(shí)時(shí)性,一旦沒(méi)有其他對(duì)象引用了,就能立馬進(jìn)行回收,看起來(lái)十分不錯(cuò),但為什么好多語(yǔ)言都沒(méi)有采用該方案,因?yàn)橐糜?jì)數(shù)有一個(gè)致命的缺點(diǎn),無(wú)法解決循環(huán)引用問(wèn)題,比如:
a = [] b = [] a.append(b) b.append(a)
其實(shí)并沒(méi)有其他變量引用a,b那么他們實(shí)際上應(yīng)該被回收掉,但由于相互引用的關(guān)系,他們的引用數(shù)都為1,無(wú)法被回收。
在python中,相互引用的問(wèn)題僅僅存在與容器里面,例如list,dictionary,class,instance。為了解決該問(wèn)題,python引入了標(biāo)記——清除和分代——回收另外兩種機(jī)制。
事實(shí)上,python中的容器并沒(méi)有之前講的那么簡(jiǎn)單,在pyobject_head之前,還有一個(gè)PyGC_head,也就是專門(mén)用來(lái)處理容器的循環(huán)引用問(wèn)題的。
typedef union _gc_head { struct { union _gc_head *gc_next; union _gc_head *gc_prev; Py_ssize_t gc_refs; } gc; long double dummy; /* force worst-case alignment */ } PyGC_Head;
所有創(chuàng)建的容器類的對(duì)象都會(huì)被記錄到可收集對(duì)象鏈表中,通過(guò)上面的結(jié)構(gòu)我們可以知道其實(shí)是構(gòu)建了一個(gè)雙向鏈表,這樣我們就可以來(lái)跟蹤所有可能產(chǎn)生循環(huán)引用的情況了。而像int,string等簡(jiǎn)單的不是容器類型的,只要引用技術(shù)為0,就會(huì)被回收。但是如果頻繁的malloc和free會(huì)嚴(yán)重影響效率,所以python采用了大量的對(duì)象池來(lái)提高效率。
標(biāo)記——清除包括了垃圾回收的兩個(gè)方面:(1)尋找可以回收的對(duì)象(2)回收對(duì)象,python中的標(biāo)記會(huì)從root object開(kāi)始,遍歷所有容器類對(duì)象,查找出可以通過(guò)引用來(lái)到達(dá)的一些對(duì)象,把他們放到由reachable維護(hù)的鏈表中,對(duì)于不能到達(dá)的放到unbreachable維護(hù)的鏈表中,此過(guò)程結(jié)束之后,對(duì)unreachable里面的元素進(jìn)行回收即可。
那么如何對(duì)應(yīng)之前循環(huán)引用的情況呢?python里面會(huì)產(chǎn)生一個(gè)有效的引用數(shù),存在gc.gc_refs里面,像上面的a,b真實(shí)引用數(shù)為1,但有效的引用數(shù)為0(循環(huán)中的引用數(shù)都減1),由于不能直接改pyobjec里面的refcnt,否則會(huì)產(chǎn)生一系列問(wèn)題,我們可以將有效的引用數(shù)記到gc.gc_refs里面,那么a,b 的真實(shí)有效引用數(shù)都為0,所以他們可以被回收。
下面是另外一種情況:
a = [] b = [] c = a a.append(b) b.append(a)
這里ab也是循環(huán)引用,但是多了c來(lái)引用a,通過(guò)計(jì)算循環(huán)中的有效引用計(jì)數(shù)可得a的引用數(shù)為1,b的引用數(shù)為0,看起來(lái)b應(yīng)該被回收,但實(shí)際上因?yàn)閍是不可被回收的,a又引用了b,所以b也會(huì)被放入在reachable鏈表中,不被回收,其gc.gc_refs還是會(huì)被置1的。
另外一種分代回收,是說(shuō)內(nèi)存中有的對(duì)象會(huì)頻繁的malloc和free,有的則比較長(zhǎng)久,如果一個(gè)對(duì)象經(jīng)過(guò)多次垃圾收集和清除之后還存在的話,那么我們就可以認(rèn)為,這個(gè)對(duì)象是長(zhǎng)時(shí)間有用的,不用去頻繁檢測(cè)回收它。python中分為3代,分別是3個(gè)鏈表維護(hù),0代最多維護(hù)700個(gè)對(duì)象,1代10個(gè),2代10個(gè),如果對(duì)象超過(guò)這個(gè)數(shù)了,就會(huì)調(diào)用標(biāo)記——清除算法來(lái)進(jìn)行回收??梢韵氲?,0代的對(duì)象經(jīng)過(guò)一段時(shí)間后會(huì)到1代2代中去,然后對(duì)它們的檢測(cè)回收會(huì)相比于0代的不那么頻繁了
要注意的是,python主要的機(jī)制還是引用技術(shù),標(biāo)記——清除和分代收集只是為了彌補(bǔ)引用計(jì)數(shù)的缺點(diǎn)而添加的,也就是說(shuō),后兩者基本只在容器類的循環(huán)引用上能發(fā)揮作用
以上就是python 垃圾收集機(jī)制的實(shí)例詳解,如有疑問(wèn)請(qǐng)留言或者到本站社區(qū)交流討論,感謝閱讀,希望能幫助到大家,謝謝大家對(duì)本站的支持!
相關(guān)文章
python基于物品協(xié)同過(guò)濾算法實(shí)現(xiàn)代碼
這篇文章主要為大家詳細(xì)介紹了python基于物品協(xié)同過(guò)濾算法實(shí)現(xiàn)代碼,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-05-05Python使用sftp實(shí)現(xiàn)上傳和下載功能
這篇文章主要為大家詳細(xì)介紹了Python使用sftp實(shí)現(xiàn)上傳和下載功能,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-04-04詳解利用python-highcharts庫(kù)繪制交互式可視化圖表
本文主要和大家分享一個(gè)超強(qiáng)交互式可視化繪制工具-python-highcharts。python-highcharts就是使用Python進(jìn)行Highcharts項(xiàng)目繪制,簡(jiǎn)單的說(shuō)就是實(shí)現(xiàn)Python和Javascript之間的簡(jiǎn)單轉(zhuǎn)換層,感興趣的可以了解一下2022-03-03Python random模塊(獲取隨機(jī)數(shù))常用方法和使用例子
這篇文章主要介紹了Python random模塊(獲取隨機(jī)數(shù))常用方法和使用例子,需要的朋友可以參考下2014-05-05Python基礎(chǔ)練習(xí)之用戶登錄實(shí)現(xiàn)代碼分享
這篇文章主要介紹了Python基礎(chǔ)練習(xí)之用戶登錄實(shí)現(xiàn)代碼分享,還是比較不錯(cuò)的,這里分享給大家,供需要的朋友參考。2017-11-11Tensorflow深度學(xué)習(xí)使用CNN分類英文文本
這篇文章主要為大家介紹了Tensorflow深度學(xué)習(xí)CNN實(shí)現(xiàn)英文文本分類示例解析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步2021-11-11python連接、操作mongodb數(shù)據(jù)庫(kù)的方法實(shí)例詳解
這篇文章主要介紹了python連接、操作mongodb數(shù)據(jù)庫(kù)的方法,結(jié)合實(shí)例形式詳細(xì)分析了Python針對(duì)MongoDB數(shù)據(jù)庫(kù)的連接、查詢、排序等相關(guān)操作技巧,需要的朋友可以參考下2019-09-09