快捷導(dǎo)航

Python對(duì)象的底層實(shí)現(xiàn)源碼學(xué)習(xí)

更新時(shí)間：2022年05月18日 08:48:39 作者：Blanker_711

這篇文章主要為大家介紹了Python對(duì)象的底層實(shí)現(xiàn)源碼學(xué)習(xí)，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進(jìn)步，早日升職加薪

1. PyObject：對(duì)象的基石

在Python解釋器的C層面，一切對(duì)象都是以PyObject為基礎(chǔ)的

C源碼如下：

typedef struct _object {
    _PyObject_HEAD_EXTRA
    Py_ssize_t ob_refcnt;
    PyTypeObject *ob_type;
} PyObject;

源碼解讀：

_PyObject_HEAD_EXTRA：主要用于實(shí)現(xiàn)雙向鏈表（分析源碼時(shí)暫時(shí)忽略）

ob_refcnt：引用計(jì)數(shù)，用于垃圾回收機(jī)制，當(dāng)這個(gè)參數(shù)減少為0時(shí)即代表對(duì)象要被刪除了（Py_ssize_t當(dāng)作int或long即可，感興趣的話可以去看下它的定義）

ob_type：類型指針，指向?qū)ο蟮念愋蛯?duì)象（PyTypeObject，稍后介紹），類型對(duì)象描述實(shí)例對(duì)象的數(shù)據(jù)及行為。如PyLongObject的ob_type指向的就是PyLong_Type

2. PyVarObject：變長(zhǎng)對(duì)象的基礎(chǔ)

PyVarObject與PyObject相比只多了一個(gè)屬性ob_size，它指明了邊長(zhǎng)對(duì)象中有多少個(gè)元素

C源碼如下：

typedef struct {
    PyObject ob_base;
    Py_ssize_t ob_size; /* Number of items in variable part */
} PyVarObject;

定長(zhǎng)對(duì)象和變長(zhǎng)對(duì)象的大致結(jié)構(gòu)圖示如下：

宏定義：對(duì)于具體對(duì)象，視其大小是否固定，需要包含頭部PyObject或PyVarObject，為此，頭文件準(zhǔn)備了兩個(gè)宏定義，方便其他對(duì)象使用：

#define PyObject_HEAD       PyObject ob_base;
#define PyObject_VAR_HEAD   PyVarObject ob_base;

2.1 浮點(diǎn)對(duì)象

這里簡(jiǎn)單的以浮點(diǎn)對(duì)象作為定長(zhǎng)對(duì)象的例子，介紹一下相關(guān)概念，后續(xù)會(huì)詳細(xì)分析float對(duì)象的源碼。

對(duì)于大小固定的浮點(diǎn)對(duì)象，需要在PyObject頭部的基礎(chǔ)上，用一個(gè)雙精度浮點(diǎn)數(shù)double加以實(shí)現(xiàn)：

typedef struct {
    PyObject_HEAD
    double ob_fval;
} PyFloatObject;

圖示如下：

2.2 列表對(duì)象

這里簡(jiǎn)單的以列表對(duì)象作為變長(zhǎng)對(duì)象的例子，介紹一下相關(guān)概念，后續(xù)會(huì)詳細(xì)分析list對(duì)象的源碼。

對(duì)于大小不固定的列表對(duì)象，需要在PyVarObject頭部的基礎(chǔ)上，用一個(gè)動(dòng)態(tài)數(shù)組加以實(shí)現(xiàn)，數(shù)組存儲(chǔ)了列表包含的對(duì)象的指針，即PyObject指針：

typedef struct {
    PyObject_VAR_HEAD
    PyObject **ob_item;
    Py_ssize_t allocated;
} PyListObject;

源碼解讀：

ob_item：指向動(dòng)態(tài)數(shù)組的指針，數(shù)組中保存元素對(duì)象指針

allocated：動(dòng)態(tài)數(shù)組的總長(zhǎng)度，即列表當(dāng)前的“容量”

ob_size：當(dāng)前元素個(gè)數(shù)，即列表當(dāng)前的長(zhǎng)度（這里的長(zhǎng)度是指：列表包含n個(gè)元素，則長(zhǎng)度為n）

圖示如下：

3. PyTypeObject：類型的基石

問題：不同類型的對(duì)象所需存儲(chǔ)空間不同，創(chuàng)建對(duì)象時(shí)從哪得知存儲(chǔ)信息呢？以及如何判斷一個(gè)給定對(duì)象支持哪些操作呢？

注意到，PyObject結(jié)構(gòu)體中包含一個(gè)指針ob_type，指向的就是類型對(duì)象，其中就包含了上述問題所需要的信息

C源碼如下：（只列出了部分，后續(xù)會(huì)結(jié)合具體類型進(jìn)行分析）

typedef struct _typeobject {
    PyObject_VAR_HEAD
    const char *tp_name; /* For printing, in format "<module>.<name>" */
    Py_ssize_t tp_basicsize, tp_itemsize; /* For allocation */
    /* Methods to implement standard operations */
    destructor tp_dealloc;
    printfunc tp_print
    getattrfunc tp_getattr;
    setattrfunc tp_setattr;
    // ...
    /* Attribute descriptor and subclassing stuff */
    PyObject *tp_bases;
	// ...
} PyTypeObject;

源碼解讀：

PyObject_VAR_HEAD表示PyTypeObject是變長(zhǎng)對(duì)象

tp_name：類型名稱

tp_basicsize、tp_itemsize：創(chuàng)建實(shí)例對(duì)象時(shí)所需的內(nèi)存信息

tp_print、tp_getattr等：表示該類型支持的相關(guān)操作信息

tp_bases：指向基類對(duì)象，表示類型的繼承信息

PyTypeObject就是類型對(duì)象在C層面的表示形式，對(duì)應(yīng)面向?qū)ο笾?rdquo;類“的概念，其中保存著對(duì)象的”元信息“（即一類對(duì)象的操作、數(shù)據(jù)等）。

下面以浮點(diǎn)類型為例，列出了PyFloatObject和PyTypeObject之間的關(guān)系結(jié)構(gòu)圖示：（其中兩個(gè)浮點(diǎn)實(shí)例對(duì)象都是PyFloatObject結(jié)構(gòu)體，浮點(diǎn)類型對(duì)象float是一個(gè)PyTypeObject結(jié)構(gòu)體變量）

由于浮點(diǎn)類型對(duì)象唯一，在C語言層面作為一個(gè)全局變量靜態(tài)定義即可。C源碼如下：（只列出了部分）

PyTypeObject PyFloat_Type = {
    PyVarObject_HEAD_INIT(&PyType_Type, 0)
    "float",
    sizeof(PyFloatObject),
    0,
    (destructor)float_dealloc,                  /* tp_dealloc */
    // ...
    (reprfunc)float_repr,                       /* tp_repr */
    // ...
};

源碼解讀：

第二行PyVarObject_HEAD_INIT(&PyType_Type, 0)：初始化了ob_refcnt、ob_type、ob_sie三個(gè)字段，其中ob_type指向了PyType_Type（稍后會(huì)繼續(xù)介紹，它就是type），即：float的類型是type

第三行"float"：將tp_name字段初始化為類型名稱float

4. PyType_Type：類型的類型

通過PyFloat_Type的ob_type字段，我們找到了type所對(duì)應(yīng)的C語言層面結(jié)構(gòu)體變量：PyType_Type，C源碼如下：（只列出了部分）

PyTypeObject PyType_Type = {
    PyVarObject_HEAD_INIT(&PyType_Type, 0)
    "type",                                     /* tp_name */
    sizeof(PyHeapTypeObject),                   /* tp_basicsize */
    sizeof(PyMemberDef),                        /* tp_itemsize */
    (destructor)type_dealloc,                   /* tp_dealloc */
    // ...
    (reprfunc)type_repr,                        /* tp_repr */
    // ...
};

內(nèi)建類型和自定義類對(duì)應(yīng)的PyTypeObject對(duì)象都是通過這個(gè)PyType_Type創(chuàng)建的。在第二行PyVarObject_HEAD_INIT(&PyType_Type, 0)中，PyType_Type把自己的ob_type字段設(shè)置成了它自己，即type的類型是type

把PyType_Type加入到結(jié)構(gòu)圖中，圖示如下：

5. PyBaseObject_Type：類型之基

object是另外一個(gè)特殊的類型，它是所有類型的基類。如果要找到object對(duì)應(yīng)的結(jié)構(gòu)體，我們可以通過PyFloat_Type的tp_base字段來尋找，因?yàn)樗赶虻木褪莊loat的基類object。但是我們查看源碼發(fā)現(xiàn)，PyFloat_Type中并沒有初始化tp_base字段：

同樣地，我們查看Objects文件夾下的各種不同類型所對(duì)應(yīng)的結(jié)構(gòu)體，發(fā)現(xiàn)tp_base字段均沒有初始化，于是尋找將tp_base字段初始化的函數(shù)：

void
_Py_ReadyTypes(void)
{
    if (PyType_Ready(&PyBaseObject_Type) < 0)
        Py_FatalError("Can't initialize object type");
    if (PyType_Ready(&PyType_Type) < 0)
        Py_FatalError("Can't initialize type type");
    // ...
    if (PyType_Ready(&PyFloat_Type) < 0)
        Py_FatalError("Can't initialize float type");
    // ...
}

_Py_ReadyTypes中統(tǒng)一調(diào)用了PyType_Ready()函數(shù)，為各種類型設(shè)置tp_base字段：

int
PyType_Ready(PyTypeObject *type)
{
    // ...
    /* Initialize tp_base (defaults to BaseObject unless that's us) */
    base = type->tp_base;
    if (base == NULL && type != &PyBaseObject_Type) {
        base = type->tp_base = &PyBaseObject_Type;
        Py_INCREF(base);
    }
    // ...
}

可以看到，PyType_Ready在初始化tp_base字段時(shí)，對(duì)于PyBaseObject_Type，不會(huì)設(shè)置tp_base字段，即object是沒有基類的，這就是為了保證繼承鏈有一個(gè)終點(diǎn)。

PyBaseObject_Type源碼如下：（只列出了部分）

PyTypeObject PyBaseObject_Type = {
    PyVarObject_HEAD_INIT(&PyType_Type, 0)
    "object",                                   /* tp_name */
    sizeof(PyObject),                           /* tp_basicsize */
    0,                                          /* tp_itemsize */
    object_dealloc,                             /* tp_dealloc */
    // ...
    object_repr,                                /* tp_repr */
    // ...
    0,                                          /* tp_base */
    // ...
};

源碼解讀：

第二行PyVarObject_HEAD_INIT(&PyType_Type, 0)：把ob_type設(shè)置為PyType_Type，即object的類型是type

將PyBaseObject_Type加入到結(jié)構(gòu)圖中，圖示如下：

6. 補(bǔ)充

object的類型是type，type的基類是object。先有雞還是先有蛋？

答：

前面我們提到，在各種類型對(duì)應(yīng)的C語言結(jié)構(gòu)體變量初始化的時(shí)候，tp_base字段都是沒有設(shè)置具體值的，直到_Py_ReadyTypes()函數(shù)執(zhí)行時(shí)，才通過PyType_Ready()去初始化各類型的tp_base。

在PyBaseObject_Type初始化時(shí)，會(huì)將ob_tyep字段設(shè)置為PyType_Type，即object的類型為type；在_Py_ReadyTypes函數(shù)中，會(huì)通過PyType_Ready()設(shè)置PyType_Type的tp_base字段為PyBaseObject_Type。所以這里本質(zhì)上不是一個(gè)先有雞還是先有蛋的問題。

PyTypeObject保存元信息：某種類型的實(shí)例對(duì)象所共有的信息保存在類型對(duì)象中，實(shí)例對(duì)象所特有的信息保存在實(shí)例對(duì)象中。以float為例：

無論是3.14，還是2.71，作為float對(duì)象，它們都支持加法運(yùn)算，因此加法處理函數(shù)的指針就會(huì)保存在類型對(duì)象中，即float中。
而這兩個(gè)float對(duì)象的具體值都是各自特有的，因此具體數(shù)值會(huì)通過一個(gè)double類型的字段保存在實(shí)例對(duì)象中。

以上就是Python對(duì)象的底層實(shí)現(xiàn)源碼學(xué)習(xí)的詳細(xì)內(nèi)容，更多關(guān)于Python對(duì)象底層的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章！

您可能感興趣的文章: