python?序列去重并保持原始順序操作
一、簡單的方法實現(xiàn)
def dedupe(items): ? ? seen = [] ? ? for item in items: ? ? ? ? if item not in seen: ? ? ? ? ? ? seen.append(item) ? ? return seen sequence = [1, 2, 3, 5, 2, 3, 4] print((dedupe(sequence))) ? ?# [1, 2, 3, 5, 4]
二、用 set 和 yield 實現(xiàn)
代碼:
def dedupe(items): ? ? seen = set() ? ?# 集合set是一個無序不重復(fù)元素集 ? ? for item in items: ? ? ? ? if item not in seen: ? ? ? ? ? ? yield item ? ? ? ? ? ? seen.add(item) ? ? ? ? ? sequence = [1, 2, 3, 5, 2, 3, 4] print(list(dedupe(sequence))) ? ?# [1, 2, 3, 5, 4] # list(dedupe(sequence))是將生成器中的結(jié)果呈現(xiàn)出來
這里對set
和yield進(jìn)行研究。如果不用yield可不可以呢,畢竟用生成器會很難理解,那么首先去掉yied
,返回seen:
def dedupe(items): ? ? seen = set() ? ? for item in items: ? ? ? ? if item not in seen: ? ? ? ? ? ? seen.add(item) ? ? return seen sequence = [1, 2, 3, 5, 2, 3, 4] print(list(dedupe(sequence))) ? ?# [1, 2, 3, 4, 5]
可以發(fā)現(xiàn)輸出的元素并沒有保持原有的順序,這是因為set的特性導(dǎo)致的。set是一個一個無序不重復(fù)元素集,使用 add()方法向set中添加元素時并不會將元素添加到末尾,而是按照順序插入到了中間位置。
我們可以逐步打印 seen 的內(nèi)容看一下:
def dedupe(items): ? ? seen = set() ? ? for item in items: ? ? ? ? if item not in seen: ? ? ? ? ? ? seen.add(item) ? ? ? ? ? ? print("seen: ",seen) ? ? return seen sequence = [1, 2, 3, 5, 2, 3, 4] print("sequence元素: ",dedupe(sequence)) # output: seen: ?{1} seen: ?{1, 2} seen: ?{1, 2, 3} seen: ?{1, 2, 3, 5} seen: ?{1, 2, 3, 4, 5} sequence元素: ?{1, 2, 3, 4, 5}
可以發(fā)現(xiàn)向集合 {1, 2, 3, 5} 中 add(4),得到的是 {1, 2, 3, 4, 5},而不是 {1, 2, 3, 5, 4},這就是 set 無序性的體現(xiàn)。
那么為什么用 yield 就可以實現(xiàn)保持順序的功能呢?因為 yield 生成器會逐個返回 1, 2, 3, 5, 4
那么為什么 print
(list(dedupe(sequence)) )會輸出 [1, 2, 3, 5, 4] 呢?因為 list(dedupe(sequence)) 是將生成器中的結(jié)果呈現(xiàn)出來,直接打印生成器 print(dedupe(sequence)) 只會輸出地址,不會輸出內(nèi)容,
三、Python列表去重并保持順序為什么使用yield?
list(dedupe(a))的作用是將生成器中的結(jié)果呈現(xiàn)出來,所以順序沒有改變。修改一下函數(shù)就能看到seen,
如圖:
在函數(shù)中打印seen:
可以看見在中間出現(xiàn)了一個集合,就是seen,如果去掉print中的list,則打?。?/strong>
此時出現(xiàn)了一個生成器(generator
),但沒有打印print
(seen)。為什么呢?因為不調(diào)用生成器的話,程序只執(zhí)行到y(tǒng)eild item,不繼續(xù)往下執(zhí)行了。
我們可以使用next()方法調(diào)用生成器:
輸出結(jié)果:
可以看出生成器調(diào)用了第一個數(shù)值5,此時停在第二個數(shù)值處,再用next方法調(diào)用時,將打印第二個數(shù)值2 ,再用next方法調(diào)用時,將打印第三個數(shù)值1 :
這里用next調(diào)用生成器時,必須將生成器實例化,即g = dedupe(a)
,如果仍然用next(dedupe(a))將一直打印5,因為Python會認(rèn)為你又重新調(diào)用了一次函數(shù)。
結(jié)果:
到此這篇關(guān)于python 序列去重并保持原始順序操作的文章就介紹到這了,更多相關(guān)python 序列去重內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
conda管理Python虛擬環(huán)境的實現(xiàn)
本文主要介紹了conda管理Python虛擬環(huán)境的實現(xiàn),主要包括使用conda工具創(chuàng)建、查看和刪除Python虛擬環(huán)境,具有一定的參考價值,感興趣的可以了解一下2024-01-01Python常用配置文件ini、json、yaml讀寫總結(jié)
用的配置文件格式有ini、json、yaml等,下面簡單給大家介紹下,Python如何讀寫這幾種格式的文件,對Python讀寫ini、json、yaml配置文件相關(guān)知識感興趣的朋友一起看看吧2021-07-07Matplotlib使用Cursor實現(xiàn)UI定位的示例代碼
這篇文章主要介紹了Matplotlib使用Cursor實現(xiàn)UI定位的示例代碼,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-03-03一文帶你掌握Python內(nèi)置reversed函數(shù)的使用
Python作為一門強(qiáng)大的編程語言,提供了許多內(nèi)置函數(shù)來處理各種數(shù)據(jù)結(jié)構(gòu)和對象,本文將詳細(xì)探討reversed函數(shù)的用法、示例代碼以及實際應(yīng)用場景,需要的可以參考下2024-01-01Pandas中DataFrame數(shù)據(jù)刪除詳情
這篇文章主要以介紹的是Pandas中DataFrame的數(shù)據(jù)刪除的相關(guān)資料,主要使用drop、del方式,需要的朋友可以參考下面文章的具體內(nèi)容2021-09-09