Python數(shù)據(jù)結(jié)構(gòu)之鏈表詳解
0. 學(xué)習(xí)目標(biāo)
在順序存儲方式中,根據(jù)數(shù)據(jù)元素的序號就可隨機(jī)存取表中任何一個(gè)元素,但同時(shí)在插入和刪除運(yùn)算需要移動大量的元素,造成算法效率較低。解決此缺陷的一個(gè)辦法是:對線性表采用鏈?zhǔn)酱鎯Ψ绞?。在鏈表存儲方式中,在邏輯上相鄰的?shù)據(jù)元素在存儲空間中不一定相鄰,數(shù)據(jù)元素的邏輯次序是通過鏈表中指針鏈接實(shí)現(xiàn)的。本節(jié)將介紹鏈?zhǔn)酱鎯Y(jié)構(gòu)的特點(diǎn)以及各種基本操作的實(shí)現(xiàn)。
通過本節(jié)學(xué)習(xí),應(yīng)掌握以下內(nèi)容:
線性表的鏈?zhǔn)酱鎯皩?shí)現(xiàn)方法
鏈表基本操作的實(shí)現(xiàn)
利用鏈表的基本操作實(shí)現(xiàn)復(fù)雜算法
1. 線性表的鏈?zhǔn)酱鎯Y(jié)構(gòu)
鏈?zhǔn)酱鎯Y(jié)構(gòu)用于存放線性表中的元素的存儲單元在內(nèi)存中可以是連續(xù)的,也可以是零散分布的。由于線性表中各元素間存在著線性關(guān)系,為了表示元素間的這種線性關(guān)系,鏈?zhǔn)酱鎯Y(jié)構(gòu)中不僅要存儲線性表中的元素,還要存儲表示元素之間邏輯關(guān)系的信息。所以用鏈?zhǔn)酱鎯Y(jié)構(gòu)表示線性表中的一個(gè)元素時(shí)至少需要兩部分信息,除了存儲每一個(gè)數(shù)據(jù)元素值以外,還需存儲其后繼或前驅(qū)元素所在內(nèi)存的地址。采用鏈?zhǔn)酱鎯Y(jié)構(gòu)表示的線性表簡稱鏈表 (Linked List)。
1.1 指針相關(guān)概念
在繼續(xù)進(jìn)行講解前,我們首先來了解指針的相關(guān)概念,以便更好的理解鏈表。假設(shè)我們需要處理一個(gè)大型數(shù)據(jù)文件,這一文件已經(jīng)被讀取保持在內(nèi)存中,當(dāng)我們在函數(shù)間傳遞文件時(shí),并不會直接傳遞整個(gè)文件,我們需要創(chuàng)建變量來保存文件在內(nèi)存中的位置,這些變量很小,很容易在不同的函數(shù)之間傳遞。
使用指針的好處之一就是可以用一個(gè)簡單的內(nèi)存地址就可以指向一個(gè)更大的內(nèi)存地址段。計(jì)算機(jī)硬件中存在對指針的支持,稱為間接尋址。
與 C 語言等不同,在 Python 中,我們不需要直接操作指針,但這并不意味著 Python 中不使用指針。例如賦值語句 l = list([1, 2, 3]),我們通常會說 l 是列表類型的變量,或者直接說 l 是一個(gè)列表,但這并不準(zhǔn)確,變量 l 是對列表的引用(指針),list 構(gòu)造函數(shù)在內(nèi)存中的創(chuàng)建一個(gè) list 并返回該 list 起始的內(nèi)存位置,這就是存儲在 l 中的內(nèi)容,Python 隱藏了這種復(fù)雜性。
1.2 指針結(jié)構(gòu)
每個(gè)指針結(jié)構(gòu)都包含一個(gè)或多個(gè)指向結(jié)構(gòu)中其他元素的鏈接,這些鏈接的類型取決于我們創(chuàng)建的數(shù)據(jù)類型,例如在鏈表中, 我們將鏈接到結(jié)構(gòu)中的下一個(gè)或上一個(gè)元素。
指針結(jié)構(gòu)具有如下優(yōu)點(diǎn):
- 不需要連續(xù)的順序存儲空間
- 可以快速添加或刪除結(jié)點(diǎn),在常數(shù)時(shí)間內(nèi)擴(kuò)展結(jié)構(gòu)空間
但指針的這種靈活性是有代價(jià)的,即需要額外的空間來存儲地址。例如有一個(gè)整數(shù)線性表,我們在每個(gè)結(jié)點(diǎn)中不僅需要存儲一個(gè)整數(shù)數(shù)據(jù),同時(shí)還需要一個(gè)額外空間用于存儲指向下一個(gè)結(jié)點(diǎn)的指針。
1.3 結(jié)點(diǎn)
一個(gè)結(jié)點(diǎn)是一個(gè)數(shù)據(jù)容器,以及一個(gè)或多個(gè)指向其它結(jié)點(diǎn)的鏈接,鏈接就是一個(gè)指針。一種簡單的結(jié)點(diǎn)只有到下一個(gè)結(jié)點(diǎn)的鏈接。假如我們有一個(gè)包含水果清單的鏈表,我們知道字符串實(shí)際上并不存儲在結(jié)點(diǎn)中,而是有一個(gè)指向?qū)嶋H字符串的指針,如下圖所示,其中包含兩個(gè)結(jié)點(diǎn),第一個(gè)結(jié)點(diǎn)有一個(gè)指向存儲在內(nèi)存中的字符串 (apple) 的指針和一個(gè)存儲下一個(gè)結(jié)點(diǎn)地址的指針,因此,這個(gè)簡單結(jié)點(diǎn)的存儲要求是兩個(gè)內(nèi)存地址,包括數(shù)據(jù)域和指針域:
我們還需要考慮的一個(gè)問題是,最后一個(gè)結(jié)點(diǎn)的指針域,我們需要確保每個(gè)結(jié)點(diǎn)的指針域都指向一個(gè)明確的值。如果我們要明確讓最后一個(gè)結(jié)點(diǎn)的指針域不指向任何內(nèi)容,那么在 Python 中,我們需要使用特殊值 None 來表示什么都沒有。 如下圖所示,鏈表的最后一個(gè)結(jié)點(diǎn)的指針域指向 None:
1.4 結(jié)點(diǎn)類
接下來,我們將實(shí)現(xiàn)上述結(jié)點(diǎn)結(jié)構(gòu):
class Node: def __init__(self, data=None): self.data = data self.next = None
Next 指針初始化為 None,這意味著默認(rèn)結(jié)點(diǎn)為端點(diǎn),除非更改 Next 的值,這樣可以確保正確終止鏈表。我們也可以根據(jù)需要向結(jié)點(diǎn)類添加其他內(nèi)容,例如我們可以創(chuàng)建一個(gè) Fruit 類,用于存儲不同水果售價(jià)信息等數(shù)據(jù),并使用數(shù)據(jù)域鏈接到 Fruit 類的實(shí)例。
為了能夠打印節(jié)點(diǎn)信息,我們需要重載 __str__ 方法:
def __str__(self): return str(self.data)
2. 單鏈表的實(shí)現(xiàn)
通常,“鏈表”是指單鏈表,單鏈表由許多結(jié)點(diǎn)組成,其中每個(gè)結(jié)點(diǎn)都有只有一個(gè)指向直接后繼的 next 指針,鏈表中最后一個(gè)節(jié)點(diǎn)的鏈接為 None,表示鏈表結(jié)束。訪問數(shù)據(jù)元素只能由鏈表頭依次到鏈表尾,而不能做逆向訪問,這是一種最簡單的鏈表。而其它鏈表類型(包括雙向鏈表、循環(huán)鏈表等)將在之后小節(jié)中進(jìn)行講解。
單鏈表分為帶頭結(jié)點(diǎn)和不帶頭結(jié)點(diǎn)兩種類型。因?yàn)殒湵碇械牡谝粋€(gè)結(jié)點(diǎn)沒有直接前驅(qū),它的地址需要放在鏈表的頭指針變量中;而其它結(jié)點(diǎn)的地址放入直接前驅(qū)結(jié)點(diǎn)的指針域中。在鏈表中插入和刪除結(jié)點(diǎn)時(shí),對第一個(gè)結(jié)點(diǎn)和其它結(jié)點(diǎn)的處理是不同的。因此為了操作方便,就在鏈表的頭部加入一個(gè)“頭結(jié)點(diǎn)”,其指針域中存放第一個(gè)數(shù)據(jù)結(jié)點(diǎn)的地址,頭指針變量中存放頭結(jié)點(diǎn)的地址。下圖 (a) 中表示不帶頭結(jié)點(diǎn)的鏈表,其頭指針 linked_list 指向第一個(gè)數(shù)據(jù)結(jié)點(diǎn),而圖 (b) 中表示不帶頭結(jié)點(diǎn)的鏈表頭指針 linked_list 指向頭結(jié)點(diǎn),頭結(jié)點(diǎn)的指針域指向第一個(gè)數(shù)據(jù)結(jié)點(diǎn):
Note:在接下來的實(shí)現(xiàn)的單鏈表基本操作中,若不特別說明,采用帶有頭結(jié)點(diǎn)的鏈表。
2.1 單鏈表的初始化
單鏈表表的初始化建立一個(gè)空的帶頭結(jié)點(diǎn)的單鏈表,其表長 length 初始化為 0,此時(shí)鏈表中沒有元素結(jié)點(diǎn),只有一個(gè)頭結(jié)點(diǎn),其指針域?yàn)榭眨?/p>
class SinglyLinkedList: def __init__(self): self.length = 0 # 初始化頭結(jié)點(diǎn) head_node = Node() # 頭指針指向頭結(jié)點(diǎn) self.head = head_node
創(chuàng)建單鏈表 SinglyLinkedList 對象的時(shí)間復(fù)雜度為O(1)。
2.2 獲取單鏈表長度
由于我們在鏈表中使用 length 跟蹤鏈表中的項(xiàng)數(shù),因此求取單鏈表長度只需要重載 __len__ 從對象返回 length 的值,因此時(shí)間復(fù)雜度為O(1):
def __len__(self): return self.length
2.3 讀取指定位置元素
為了實(shí)現(xiàn)讀取鏈表指定位置元素的操作,我們將重載 __getitem__ 操作。我們已經(jīng)知道單鏈表中的結(jié)點(diǎn)只能順序存取,即訪問前一個(gè)結(jié)點(diǎn)后才能接著訪問后一個(gè)結(jié)點(diǎn)。因此要訪問單鏈表中第i個(gè)元素值,必須從頭指針開始遍歷鏈表,依次訪問每個(gè)結(jié)點(diǎn),直到訪問到第i個(gè)結(jié)點(diǎn)為止。因此操作的復(fù)雜度為O(n)。同時(shí),我們希望確保索引在可接受的索引范圍內(nèi),否則將引發(fā) IndexError 異常:
def __getitem__(self, index): if index > self.length - 1 or index < 0: raise IndexError("SinglyLinkedList assignment index out of range") else: count = -1 current = self.head while count < index: current = current.next count += 1 return current.data
我們也可以實(shí)現(xiàn)修改指定位置元素的操作,只需要重載 __setitem__ 操作,其復(fù)雜度同樣為O(n):
def __setitem__(self, index, value): if index > self.length - 1 or index < 0: raise IndexError("SinglyLinkedList assignment index out of range") else: count = -1 current = self.head while count < index: current = current.next count += 1 current.data = value
2.4 查找指定元素
當(dāng)查找指定元素時(shí),需要設(shè)置一個(gè)跟蹤鏈表結(jié)點(diǎn)的指針 current,初始時(shí) current 指向鏈表中的第一個(gè)數(shù)據(jù)結(jié)點(diǎn), 然后順著 next 域依次指向每個(gè)結(jié)點(diǎn),每指向一個(gè)結(jié)點(diǎn)就判斷其值是否等于指定值 value,若是則返回該結(jié)點(diǎn)索引;否則繼續(xù)往后搜索,如果鏈表中無此元素,則引發(fā) ValueError 異常,其時(shí)間復(fù)雜度為O(n):
def locate(self, value): count = -1 current = self.head while current != None and current.data != value: count += 1 current = current.next if current and current.data == value: return count else: raise ValueError("{} is not in sequential list".format(value))
2.5 在指定位置插入新元素
單鏈表結(jié)點(diǎn)的插入只需要修改結(jié)點(diǎn)指針域的值,使其指向新的鏈接位置,而無需移動任何元素。 例如我們要在鏈表中索引為 i ii 處插入一個(gè)新結(jié)點(diǎn),必須首先找到所插位置的前一個(gè)結(jié)點(diǎn) i − 1 i-1i−1,再進(jìn)行插入,設(shè)指針 previous 指向待插位置的前驅(qū)結(jié)點(diǎn),指針 current 指向插入前鏈表中索引為 i ii 的結(jié)點(diǎn),同時(shí)也是待插位置的后繼結(jié)點(diǎn),指針 new_node 指向待插新結(jié)點(diǎn),插入操作過程如下所示:
使用 Python 實(shí)現(xiàn)算法如下:
def insert(self, index, data): count = -1 current = self.head # 判斷插入位置的合法性 if index > self.length or index < 0: raise IndexError("SinglyLinkedList assignment index out of range") else: node = Node(data) while count < index: # 查找插入位置 previous = current current = current.next count += 1 # 插入新結(jié)點(diǎn) node.next = previous.next previous.next = node self.length += 1
也可以利用上述思想,直接在鏈表中插入結(jié)點(diǎn):
def insert_node(self, index, node): count = -1 current = self.head if index > self.length or index < 0: raise IndexError("SinglyLinkedList assignment index out of range") else: while count < index: previous = current current = current.next count += 1 node.next = previous.next ? ? ? ? ? ? previous.next = node ? ? ? ? ? ? self.length += 1
2.6 刪除指定位置元素
要刪除鏈表中第 i ii 個(gè)結(jié)點(diǎn),首先在單鏈表中找到刪除位置的前一個(gè)結(jié)點(diǎn) previous,指針 current 指向要刪除的結(jié)點(diǎn),將 previous 的指針域修改為待刪除結(jié)點(diǎn) current 的后繼結(jié)點(diǎn)的地址,刪除后的結(jié)點(diǎn)需動態(tài)的釋放。下圖 (b) 中的粉色虛線表示刪除結(jié)點(diǎn) current 后的指針指向:
使用 Python 實(shí)現(xiàn)算法如下:
def __delitem__(self, index): if index > self.length - 1 or index < 0: raise IndexError("SinglyLinkedList assignment index out of range") else: count = -1 previous = self.head while count < index - 1: previous = previous.next count += 1 current = previous.next previous.next = current.next self.length -= 1 del current
在插入和刪除操作中,都是先確定操作位置,然后再進(jìn)行插入和刪除操作,所以其時(shí)間復(fù)雜度均為O(n)。由于算法在進(jìn)行插入和刪除操作時(shí)沒有移動元素的位置,只是修改了指針鏈接,所以采用鏈表存儲方式進(jìn)行插入和刪除操作要比順序存儲方式的效率高。
2.7 其它一些有用的操作
2.7.1 鏈表元素輸出操作
將單鏈表轉(zhuǎn)換為字符串以便進(jìn)行打印,使用 str 函數(shù)調(diào)用對象上的 __str__ 方法可以創(chuàng)建適合打印的字符串表示:
def __str__(self): s = "[" current = self.head.next count = 0 while current != None: count += 1 s += str(current) current = current.next if count < self.length: s += '-->' s += "]" return s
2.7.2 刪除指定元素
與刪除指定位置元素略有不同,刪除指定元素需要在鏈表中刪除第一個(gè)具有與給定值相同數(shù)據(jù)元素的結(jié)點(diǎn),其時(shí)間復(fù)雜度同樣為O(n):
def del_value(self, value): current = self.head previous = self.head while current != None: if current.data == value: previous.next = current.next self.length -= 1 del current return else: previous = current current = current.next raise ValueError("The value provided is not present!")
2.7.3 在鏈表尾部追加新元素
為了方便的在鏈表尾部追加新元素,可以實(shí)現(xiàn)函數(shù) append:
def append(self, value): node = Node(value) current = self.head while current.next is not None: current = current.next current.next = node self.length += 1
此算法的時(shí)間復(fù)雜度為O(n),如果需要經(jīng)常在鏈表尾部追加新元素,可以使用增加尾指針 tail 用于追蹤鏈表的最后一個(gè)元素,利用尾指針在鏈表尾部追加新元素時(shí)間復(fù)雜度可以降至O(1)。
3. 單鏈表應(yīng)用
接下來,我們首先測試上述實(shí)現(xiàn)的鏈表,以驗(yàn)證操作的有效性,然后利用實(shí)現(xiàn)的基本操作來實(shí)現(xiàn)更復(fù)雜的算法。
3.1 單鏈表應(yīng)用示例
首先初始化一個(gè)鏈表 sllist,并在其中追加若干元素:
sllist = SinglyLinkedList() # 在鏈表末尾追加元素 sllist.append('apple') sllist.append('lemon') # 在指定位置插入元素 sllist.insert(0, 'banana') sllist.insert(2, 'orange')
我們可以直接打印鏈表中的數(shù)據(jù)元素、鏈表長度等信息:
print('鏈表為:', sllist) print('鏈表長度為:', len(sllist)) print('鏈表第0個(gè)元素為:', sllist[0]) # 修改數(shù)據(jù)元素 sllist[0] = 'pear' print('修改鏈表數(shù)據(jù)后:', sllist)
以上代碼輸出如下:
鏈表為: [banana-->apple-->orange-->lemon]
鏈表長度為: 4
鏈表第0個(gè)元素為: banana
修改鏈表數(shù)據(jù)后: [pear-->apple-->orange-->lemon]
接下來,我們將演示在指定位置添加/刪除元素、以及如何查找指定元素等:
# 在指定位置添加/刪除結(jié)點(diǎn) sllist.insert(1, 'grape') print('在位置1添加grape后鏈表數(shù)據(jù):', sllist) del(sllist[2]) print('修改鏈表數(shù)據(jù)后:', sllist) # 刪除指定元素 sllist.del_value('pear') print('刪除pear后鏈表數(shù)據(jù):', sllist) sllist.append('watermelon') print('添加watermelon后鏈表數(shù)據(jù):', sllist)
以上代碼輸出如下:
在位置1添加grape后鏈表數(shù)據(jù): [pear-->grape-->apple-->orange-->lemon]
修改鏈表數(shù)據(jù)后: [pear-->grape-->orange-->lemon]
刪除pear后鏈表數(shù)據(jù): [grape-->orange-->lemon]
添加watermelon后鏈表數(shù)據(jù): [grape-->orange-->lemon-->watermelon]
3.2 利用單鏈表基本操作實(shí)現(xiàn)復(fù)雜操作
[1] 利用基本運(yùn)算函數(shù),將一單鏈表逆置,如下圖 (a) 所示為逆置前鏈表,圖 (b) 為逆置后鏈表,并要求算法的空間復(fù)雜度為O(1):
為了保證算法的空間復(fù)雜度為O(1),只能修改原結(jié)點(diǎn)的指針,設(shè)置指針 current, 令其指向 head->next,并令head.next=None,然后使用 current 指針依次遍歷每個(gè)結(jié)點(diǎn)并插入到 head 之后。該算法只需要對鏈表順序掃描一遍即可完成倒置,因此時(shí)間復(fù)雜度為O(n),算法實(shí)現(xiàn)如下:
def reverse_linked_list(sllist): head_node = sllist.head if head_node.next: current = head_node.next head_node.next = None sllist.length = 0 while current: previous = current current = current.next sllist.insert_node(0, previous) return sllist # 算法測試 sllist = SinglyLinkedList() for i in range(5): sllist.append(i) print('逆置前:', sllist) print('逆置后:', reverse_linked_list(sllist))
算法輸出如下:
逆置前: [0-->1-->2-->3-->4]
逆置后: [4-->3-->2-->1-->0]
算法執(zhí)行流程如下所示:
[2] 刪除單鏈表中的重復(fù)結(jié)點(diǎn),如下圖操作所示,(a) 為刪除前的情況,(b) 為刪除后的狀態(tài)。
用指針 previous 指向第一個(gè)數(shù)據(jù)結(jié)點(diǎn),并使用另一個(gè)指針 curent 指向 previous 的直接后繼開始遍歷整個(gè)鏈表,當(dāng)遇到具有相同的數(shù)據(jù)元素的結(jié)點(diǎn)時(shí)將其刪除;然后 previous 指向下一個(gè)結(jié)點(diǎn),重復(fù)刪除過程;直到 previous 指向最后結(jié)點(diǎn)時(shí)算法結(jié)束:
def delete_same_node(sllist): previous = sllist.head.next if not previous: return while previous: current = previous while current.next: if current.next.data == previous.data: same = current.next current.next = current.next.next sllist.length -= 1 del same else: current = current.next previous = previous.next return sllist # 算法測試 sllist = SinglyLinkedList() print('刪除重復(fù)結(jié)點(diǎn)前:', sllist) sllist.append(10) sllist.append(11) sllist.append(10) sllist.append(10) sllist.append(11) print('刪除重復(fù)結(jié)點(diǎn)后', delete_same_node(sllist))
該算法的時(shí)間復(fù)雜度為O(n2),程序輸出如下:
刪除重復(fù)結(jié)點(diǎn)前: [10-->11-->10-->10-->11]
刪除重復(fù)結(jié)點(diǎn)后: [10-->11]
算法執(zhí)行流程如下所示:
以上就是Python數(shù)據(jù)結(jié)構(gòu)之鏈表詳解的詳細(xì)內(nèi)容,更多關(guān)于Python 鏈表的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
Python3.4 splinter(模擬填寫表單)使用方法
今天小編就為大家分享一篇Python3.4 splinter(模擬填寫表單)使用方法,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-10-10python調(diào)用excel_vba的兩種實(shí)現(xiàn)方式
本文主要介紹了python調(diào)用excel_vba的兩種實(shí)現(xiàn)方式,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-01-01pyqt5 從本地選擇圖片 并顯示在label上的實(shí)例
今天小編就為大家分享一篇pyqt5 從本地選擇圖片 并顯示在label上的實(shí)例,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-06-06Django正則URL匹配實(shí)現(xiàn)流程解析
這篇文章主要介紹了Django正則URL匹配實(shí)現(xiàn)流程解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-11-11python讀取大型csv文件的操作方法(降低內(nèi)存占用)
遇到大型的csv文件時(shí),pandas會把該文件全部加載進(jìn)內(nèi)存,從而導(dǎo)致程序運(yùn)行速度變慢,本文提供了批量讀取csv文件、讀取屬性列的方法,減輕內(nèi)存占用情況,文中有詳細(xì)的代碼示例,需要的朋友可以參考下2024-03-03Python turtle實(shí)現(xiàn)貪吃蛇游戲
這篇文章主要為大家詳細(xì)介紹了Python turtle實(shí)現(xiàn)貪吃蛇游戲,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-06-06