欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python的Dict對象源碼分析

 更新時間:2023年08月16日 10:19:46   作者:efeics  
這篇文章主要介紹了Python的Dict對象源碼分析,PyDictObject即字典對象,類似于C++ STL中的map,但STL中以紅黑樹實現(xiàn),Python中dict以hash表(散列表)實現(xiàn),需要的朋友可以參考下

Python的Dict對象源碼分析

PyDictObject即字典對象,類似于C++ STL中的map,但STL中以紅黑樹實現(xiàn),Python中dict以hash表(散列表)實現(xiàn)。

散列表,通過Hash函數(shù)將特定對象映射為特定數(shù)字;

當裝載率大于2/3時,散列沖突概率增加,解決散列沖突,STL采用開鏈法,而Python采用開放定址法。

開放定址法法,在探測沖突鏈上依次跳轉,如果刪除探測沖突鏈上某個元素,會使探測沖突鏈斷裂。

故而,刪除某元素時,不可在物理上真正刪除。

1、entry與dict對象

typedef struct {
    Py_ssize_t me_hash;	     // key的hash值
    PyObject *me_key;
    PyObject *me_value;
} PyDictEntry;
struct _dictobject {
    PyObject_HEAD
    Py_ssize_t ma_fill;        /* # Active + # Dummy */
    Py_ssize_t ma_used;        /* # Active */
    Py_ssize_t ma_mask;        // dict對象所擁有的entry數(shù)量
    PyDictEntry *ma_table;     // 指向存放元素的內存區(qū)域
    PyDictEntry *(*ma_lookup)(PyDictObject *mp, PyObject *key, long hash);    // 搜索函數(shù)指針
    PyDictEntry ma_smalltable[PyDict_MINSIZE];      // 自帶少量元素內存
};

元素數(shù)量不同時,可使用不同策略

2、搜索策略

由于采用開放定址法,探測沖突鏈上元素不可刪除,Python將每個元素設為三種狀態(tài)。

  1. 從未使用是unused
  2. 正在使用是Active
  3. 當將某個Active的元素刪除時將其置為dummy。

通過ma_key與ma_value的值來判定狀態(tài)。

Python每種類型的對象都實現(xiàn)了各自的hash函數(shù),如string對象函數(shù)函數(shù)如下:

int len = strObject->length;
unsignedchar * p = (unsignedchar *)strObject->value;
long x = *p << 7;
while (--len >= 0)
    x = (1000003*x) ^ *p++;
x ^= strObject->length;
if (x == -1)
    x = -2;
strObject->hashValue = x;

產(chǎn)生散列沖突時,采用二次探測函數(shù),Python中如下:

for (perturb = hash; ; perturb >>= 5) {
	i = (i << 2) + i + perturb + 1;
	ep = &ep0[i & mask];
}

沖突探測鏈開端為通過hash函數(shù)找到的第一個entry,結尾為第一個unused狀態(tài)entry。

搜索整體思想為,在探測鏈上依次尋找;

遇到dummy狀態(tài)則記錄為freesplot,并繼續(xù)探測;

直至探測到匹配的元素,返回該對象;

或者直到最后一個元素即unused狀態(tài)entry,此時若freesplot為空則返回該unused,若不為空則返回freesplot記錄的dummy。

有圖示幾種情況,1-6依次返回A、C、D、E、X、Y。

3、dict對象使用

dict對象的各種應用均依賴與搜索策略,而在python中使用PyStringObject*做key的情況特別多,python默認使用針對string優(yōu)化的搜索函數(shù),如果key不是string對象,返回通用搜索函數(shù)。

元素的插入,需注意dict對象會自動調整內存大小,以裝載率大于2/3為基準。

調整大小時會重新分布元素,故dummy態(tài)不再需要,被銷毀。 元素的刪除,需注意該元素置為dummuy態(tài)。

元素的設置,若存在該key,直接更改value;

若不存在,添加該entry,即(key,value)。

4、dict對象緩沖池

和list對象緩沖池類似,在此就不多贅述。

到此這篇關于Python的Dict對象源碼分析的文章就介紹到這了,更多相關Python的Dict源碼內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • 這三個好用的python函數(shù)你不能不知道!

    這三個好用的python函數(shù)你不能不知道!

    作為21世紀最流行的語言之一,Python當然有很多有趣的功能值得深入探索和研究.今天通過理論和實際例子來討論,需要的朋友可以參考下
    2021-06-06
  • Python之字典添加元素的幾種方法

    Python之字典添加元素的幾種方法

    這篇文章主要介紹了Python之字典添加元素的幾種方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2020-09-09
  • Python發(fā)送郵件實現(xiàn)基礎解析

    Python發(fā)送郵件實現(xiàn)基礎解析

    這篇文章主要介紹了Python發(fā)送郵件實現(xiàn)基礎解析,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2020-08-08
  • python opencv實現(xiàn)gif圖片分解的示例代碼

    python opencv實現(xiàn)gif圖片分解的示例代碼

    這篇文章主要介紹了python opencv實現(xiàn)gif圖片分解的示例代碼,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2019-12-12
  • anaconda安裝后打不開解決方式(親測有效)

    anaconda安裝后打不開解決方式(親測有效)

    Anaconda是一個和Canopy類似的科學計算環(huán)境,但用起來更加方便,下面這篇文章主要給大家介紹了關于anaconda安裝后打不開解決的相關資料,文中通過圖文介紹的非常詳細,需要的朋友可以參考下
    2022-09-09
  • 詳解Python程序與服務器連接的WSGI接口

    詳解Python程序與服務器連接的WSGI接口

    這篇文章主要介紹了Python程序與服務器連接的WSGI接口,是Python網(wǎng)絡編程學習當中的重要內容,需要的朋友可以參考下
    2015-04-04
  • selenium+PhantomJS爬取豆瓣讀書

    selenium+PhantomJS爬取豆瓣讀書

    這篇文章主要為大家詳細介紹了selenium+PhantomJS爬取豆瓣讀書,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2019-08-08
  • Python面向對象之入門類和對象

    Python面向對象之入門類和對象

    這篇文章主要為大家介紹了Python入門類和對象,具有一定的參考價值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來幫助
    2021-12-12
  • pandas 時間偏移的實現(xiàn)

    pandas 時間偏移的實現(xiàn)

    時間偏移就是在指定時間往前推或者往后推一段時間,即加減一段時間之后的時間,本文使用Python實現(xiàn),感興趣的可以了解一下
    2021-08-08
  • python矩陣轉換為一維數(shù)組的實例

    python矩陣轉換為一維數(shù)組的實例

    今天小編就為大家分享一篇python矩陣轉換為一維數(shù)組的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-06-06

最新評論