快捷導(dǎo)航

Python 列表(List)的底層實現(xiàn)原理分析

更新時間：2021年03月09日 15:45:59 作者：EUNC

這篇文章主要介紹了Python 列表(List)的底層實現(xiàn)原理分析，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

Python 列表的數(shù)據(jù)結(jié)構(gòu)是怎么樣的？

列表實際上采用的就是數(shù)據(jù)結(jié)構(gòu)中的順序表，而且是一種采用分離式技術(shù)實現(xiàn)的動態(tài)順序表

但這是不是Python的列表？

我的結(jié)論是順序表是列表的一種實現(xiàn)方式。

書上說的是：列表實現(xiàn)可以是數(shù)組和鏈表。

順序表是怎么回事？順序表一般是數(shù)組。

列表是一個線性的集合，它允許用戶在任何位置插入、刪除、訪問和替換元素。

列表實現(xiàn)是基于數(shù)組或基于鏈表結(jié)構(gòu)的。當(dāng)使用列表迭代器的時候，雙鏈表結(jié)構(gòu)比單鏈表結(jié)構(gòu)更快。

有序的列表是元素總是按照升序或者降序排列的元素。

實現(xiàn)細(xì)節(jié)

python中的列表的英文名是list，因此很容易和其它語言(C++, Java等)標(biāo)準(zhǔn)庫中常見的鏈表混淆。事實上CPython的列表根本不是列表（可能換成英文理解起來容易些：python中的list不是list）。在CPython中，列表被實現(xiàn)為長度可變的數(shù)組。

可參考《Python高級編程（第2版）》

從細(xì)節(jié)上看，Python中的列表是由對其它對象的引用組成的連續(xù)數(shù)組。指向這個數(shù)組的指針及其長度被保存在一個列表頭結(jié)構(gòu)中。

這意味著，每次添加或刪除一個元素時，由引用組成的數(shù)組需要該標(biāo)大小（重新分配）。

幸運的是，Python在創(chuàng)建這些數(shù)組時采用了指數(shù)分配，所以并不是每次操作都需要改變數(shù)組的大小。但是，也因為這個原因添加或取出元素的平攤復(fù)雜度較低。

不幸的是，在普通鏈表上“代價很小”的其它一些操作在Python中計算復(fù)雜度相對過高。

利用 list.insert(i,item) 方法在任意位置插入一個元素——復(fù)雜度O(N)

利用 list.pop(i) 或 list.remove(value) 刪除一個元素——復(fù)雜度O(N)

列表的算法效率

可以采用時間復(fù)雜度來衡量：

index() O(1)

append O(1)

pop() O(1)

pop(i) O(n)

insert(i,item) O(n)

del operator O(n)

iteration O(n)

contains(in) O(n)

get slice[x:y] O(k)

del slice O(n)

set slice O(n+k)

reverse O(n)

concatenate O(k)

sort O(nlogn)

multiply O(nk)

O括號里面的值越大代表效率越低

列表和元組

列表和元組的區(qū)別是顯然的：

列表是動態(tài)的，其大小可以該標(biāo) (重新分配)；

而元組是不可變的，一旦創(chuàng)建就不能修改。

list和tuple在c實現(xiàn)上是很相似的，對于元素數(shù)量大的時候，

都是一個數(shù)組指針，指針指向相應(yīng)的對象，找不到tuple比list快的理由。

但對于小對象來說，tuple會有一個對象池，所以小的、重復(fù)的使用tuple還有益處的。

為什么要有tuple，還有很多的合理性。

實際情況中的確也有不少大小固定的列表結(jié)構(gòu)，例如二維地理坐標(biāo)等；

另外tuple也給元素天然地賦予了只讀屬性。

認(rèn)為tuple比list快的人大概是把python的tuple和list類比成C++中的數(shù)組和列表了。

補(bǔ)充：python list, tuple, dictionary, set的底層細(xì)節(jié)

list, tuple, dictionary, set是python中4中常見的集合類型。在筆者之前的學(xué)習(xí)中，只是簡單了學(xué)習(xí)它們4者的使用，現(xiàn)記錄一下更深底層的知識。

列表和元組

列表和元組的區(qū)別是顯然的：列表是動態(tài)的，其大小可以該標(biāo)；而元組是不可變的，一旦創(chuàng)建就不能修改。

實現(xiàn)細(xì)節(jié)

python中的列表的英文名是list，因此很容易和其它語言(C++, Java等)標(biāo)準(zhǔn)庫中常見的鏈表混淆。事實上CPython的列表根本不是列表（可能換成英文理解起來容易些：python中的list不是list）。在CPython中，列表被實現(xiàn)為長度可變的數(shù)組。

從細(xì)節(jié)上看，Python中的列表是由對其它對象的引用組成的連續(xù)數(shù)組。指向這個數(shù)組的指針及其長度被保存在一個列表頭結(jié)構(gòu)中。這意味著，每次添加或刪除一個元素時，由引用組成的數(shù)組需要該標(biāo)大?。ㄖ匦路峙洌Ｐ疫\的是，Python在創(chuàng)建這些數(shù)組時采用了指數(shù)過分配，所以并不是每次操作都需要改變數(shù)組的大小。但是，也因為這個原因添加或取出元素的平攤復(fù)雜度較低。

不幸的是，在普通鏈表上“代價很小”的其它一些操作在Python中計算復(fù)雜度相對過高。

利用 list.insert方法在任意位置插入一個元素——復(fù)雜度O(N)

利用 list.delete或del刪除一個元素——復(fù)雜度O(N)

操作	復(fù)雜度
復(fù)制	O(N)
添加元素(在尾部添加)	O(1)
插入元素(在指定位置插入)	O(N)
獲取元素	O(1)
修改元素	O(1)
刪除元素	O(N)
遍歷	O(N)
獲取長度為k的切片	O(k)
刪除切片	O(N)
列表擴(kuò)展	O(k)
測試是否在列表中	O(N)
min()/max()	O(n)
獲取列表長度	O(1)

列表推導(dǎo)

要習(xí)慣用列表推導(dǎo)，因為這更加高效和簡短，涉及的語法元素少。在大型的程序中，這意味著更少的錯誤，代碼也更容易閱讀。

>>>[i for i in range(10) if i % 2 == 0]
 [0, 2, 4, 6, 8]

其它習(xí)語

1.使用enumerate.在循環(huán)使用序列時，這個內(nèi)置函數(shù)可以方便的獲取其索引：

for i, element in enumerate(['one', 'two', 'three']):
 print(i, element)

result：

0 one
1 two
2 three

2.如果需要一個一個合并多個列表中的元素，可以使用zip()。對兩個大小相等的可迭代對象進(jìn)行均勻遍歷時，這是一個非常常用的模式：

for item in zip([1, 2, 3], [4, 5, 6]):
 print(item)

(1, 4)
(2, 5)
(3, 6)

3.序列解包

#帶星號的表達(dá)式可以獲取序列的剩余部分
>>>first, second, *reset = 0, 1, 2, 3
>>>first
0
>>>second
1
>>>reset
[2, 3]

字典

字典是python中最通用的數(shù)據(jù)結(jié)構(gòu)之一。dict可以將一組唯一的鍵映射到相應(yīng)的值。

我們也可以用前面列表推導(dǎo)的方式來創(chuàng)建一個字典。

squares = {number: number**2 for number in range(10)}
print(squares)

result：

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}

在遍歷字典元素時，有一點需要特別注意。字典里的keys(), values()和items()3個方法的返回值不再是列表，而是視圖對象（view objects）。

keys(): 返回dict_keys對象，可以查看字典所有鍵

values():返回dict_values對象，可以查看字典的所有值

items():返回dict_items對象，可以查看字典所有的{key, value}二元元組。

視圖對象可以動態(tài)查看字典的內(nèi)容，因此每次字典發(fā)生變化的時候，視圖都會相應(yīng)的改變，見下面這個例子：

words = {'foo': 'bar', 'fizz': 'bazz'}
items= words.items()
words['spam'] = 'eggs'
print(items)

result：

dict_items([('foo', 'bar'), ('fizz', 'bazz'), ('spam', 'eggs')])

視圖無需冗余的將所有值都保存在內(nèi)存中，像列表那樣。但你仍然可以獲取其長度（使用len）,也可以測試元素是否包含在其中（使用in子句）。當(dāng)然，視圖是迭代的。

實現(xiàn)細(xì)節(jié)

CPython使用偽隨機(jī)探測(pseudo-random probing)的散列表(hash table)作為字典的底層數(shù)據(jù)結(jié)構(gòu)。由于這個實現(xiàn)細(xì)節(jié)，只有可哈希的對象才能作為字典的鍵。

Python中所有不可變的內(nèi)置類型都是可哈希的?？勺冾愋停ㄈ缌斜?，字典和集合）就是不可哈希的，因此不能作為字典的鍵。

字典的三個基本操作（添加元素，獲取元素和刪除元素）的平均事件復(fù)雜度為O(1)，但是他們的平攤最壞情況復(fù)雜度要高得多，為O(N).

操作	平均復(fù)雜度	平攤最壞情況復(fù)雜度
獲取元素	O(1)	O(n)
修改元素	O(1)	O(n)
刪除元素	O(1)	O(n)
復(fù)制	O(n)	O(n)
遍歷	O(n)	O(n)

還有一點很重要，在復(fù)制和遍歷字典的操作中，最壞的復(fù)雜度中的n是字典曾經(jīng)達(dá)到的最大元素數(shù)目，而不是當(dāng)前的元素數(shù)目。換句話說，如果一個字典曾經(jīng)元素個數(shù)很多，后來又大大減小了，那么遍歷這個字典可能會花費相當(dāng)長的事件。

因此在某些情況下，如果需要頻繁的遍歷某個詞典，那么最好創(chuàng)建一個新的字典對象，而不是僅在舊字典中刪除元素。

字典的缺點和替代方案

使用字典的常見陷阱就是，它并不會按照鍵的添加順序來保存元素的順序。在某些情況下，字典的鍵是連續(xù)的，對應(yīng)的散列值也是連續(xù)值（例如整數(shù)），那么由于字典的內(nèi)部實現(xiàn)，元素的實現(xiàn)可能和添加的順序相同：

keys = {num: None for num in range(5)}.keys()
print(keys)

result：

dict_keys([0, 1, 2, 3, 4])

但是，如果散列方法不同的其它數(shù)據(jù)類型，那么字典就不會保存元素順序。

age = {str(i): i for i in range(100)}
keys = age.keys()
print(keys)

result：

dict_keys(['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '10', '11', '12', '13', '14', '15', '16', '17', '18', '19', '20', '21', '22', '23', '24', '25', '26', '27', '28', '29', '30', '31', '32', '33', '34', '35', '36', '37', '38', '39', '40', '41', '42', '43', '44', '45', '46', '47', '48', '49', '50', '51', '52', '53', '54', '55', '56', '57', '58', '59', '60', '61', '62', '63', '64', '65', '66', '67', '68', '69', '70', '71', '72', '73', '74', '75', '76', '77', '78', '79', '80', '81', '82', '83', '84', '85', '86', '87', '88', '89', '90', '91', '92', '93', '94', '95', '96', '97', '98', '99'])

理論上，鍵的順序不應(yīng)該是這樣的，應(yīng)該是亂序。。。具體為什么這樣，等以后明白了再補(bǔ)充

如果我們需要保存添加順序怎么辦？python 標(biāo)準(zhǔn)庫的collections模塊提供了名為OrderedDicr的有序字典。

集合

集合是一種魯棒性很好的數(shù)據(jù)結(jié)構(gòu)，當(dāng)元素順序的重要性不如元素的唯一性和測試元素是否包含在集合中的效率時，大部分情況下這種數(shù)據(jù)結(jié)構(gòu)極其有用。

python的內(nèi)置集合類型有兩種：

set(): 一種可變的、無序的、有限的集合，其元素是唯一的、不可變的（可哈希的）對象。

frozenset(): 一種不可變的、可哈希的、無序的集合，其元素是唯一的，不可變的哈希對象。

set([set([1, 2, 3]), set([2, 3, 4])])

result:

Traceback (most recent call last):
 File "/pycharm_project/LearnPython/Part1/demo.py", line 1, in <module>
 set([set([1, 2, 3]), set([2, 3, 4])])
TypeError: unhashable type: 'set'

set([frozenset([1, 2, 3]), frozenset([2, 3, 4])])

result:不會報錯

set里的元素必須是唯一的，不可變的。但是set是可變的，所以set作為set的元素會報錯。

實現(xiàn)細(xì)節(jié)

CPython中集合和字典非常相似。事實上，集合被實現(xiàn)為帶有空值的字典，只有鍵才是實際的集合元素。此外，集合還利用這種沒有值的映射做了其它的優(yōu)化。

由于這一點，可以快速的向集合中添加元素、刪除元素、檢查元素是否存在。平均時間復(fù)雜度為O(1),最壞的事件復(fù)雜度是O(n)。

以上為個人經(jīng)驗，希望能給大家一個參考，也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方，望不吝賜教。

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python 列表(List)的底層實現(xiàn)原理分析

Python 列表的數(shù)據(jù)結(jié)構(gòu)是怎么樣的？

實現(xiàn)細(xì)節(jié)

可參考《Python高級編程（第2版）》

列表的算法效率

列表和元組

列表和元組

實現(xiàn)細(xì)節(jié)

列表推導(dǎo)

其它習(xí)語

字典

實現(xiàn)細(xì)節(jié)

字典的缺點和替代方案

集合

實現(xiàn)細(xì)節(jié)

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python 列表(List)的底層實現(xiàn)原理分析

Python 列表的數(shù)據(jù)結(jié)構(gòu)是怎么樣的？

實現(xiàn)細(xì)節(jié)

可參考《Python高級編程（第2版）》

列表的算法效率

列表和元組

列表和元組

實現(xiàn)細(xì)節(jié)

列表推導(dǎo)

其它習(xí)語

字典

實現(xiàn)細(xì)節(jié)

字典的缺點和替代方案

集合

實現(xiàn)細(xì)節(jié)

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

Python 列表的數(shù)據(jù)結(jié)構(gòu)是怎么樣的？