快捷導(dǎo)航

Python開發(fā)之迭代器&生成器的實(shí)戰(zhàn)案例分享

更新時間：2023年04月19日 09:30:31 作者：不背鍋運(yùn)維

在 Python 中，迭代器和生成器都是用來遍歷數(shù)據(jù)集合的工具，可以按需逐個生成或返回?cái)?shù)據(jù)，從而避免一次性加載整個數(shù)據(jù)集合所帶來的性能問題和內(nèi)存消耗問題。本文主要和大家分享幾個貼近實(shí)際運(yùn)維開發(fā)工作中的場景案例，希望對大家有所幫助

迭代器&生成器

在 Python 中，迭代器和生成器都是用來遍歷數(shù)據(jù)集合的工具，可以按需逐個生成或返回?cái)?shù)據(jù)，從而避免一次性加載整個數(shù)據(jù)集合所帶來的性能問題和內(nèi)存消耗問題。

具體來說，迭代器是一個包含 iter() 和 next() 方法的對象，它通過 next() 方法依次返回?cái)?shù)據(jù)集合中的每個元素，直到?jīng)]有元素時引發(fā) StopIteration 異常。迭代器可以自定義，也可以使用 Python 內(nèi)置的可迭代對象，如列表、元組、字典、集合等，以及內(nèi)置的迭代器函數(shù)，如 zip()、map()、filter() 等。

而生成器是一種特殊的迭代器，它使用 yield 關(guān)鍵字來定義，可以在需要時生成數(shù)據(jù)，從而實(shí)現(xiàn)按需生成、惰性計(jì)算的效果。生成器可以大大簡化代碼，提高性能和可讀性，也可以通過生成器表達(dá)式快速創(chuàng)建簡單的生成器。

下面分享幾個貼近實(shí)際運(yùn)維開發(fā)工作中的場景案例。

實(shí)戰(zhàn)案例

1.假設(shè)需要從一個非常大的數(shù)據(jù)集合中查找滿足特定條件的元素，并且只需要找到第一個符合條件的元素即可停止查找。如果直接遍歷整個數(shù)據(jù)集合，可能會導(dǎo)致性能問題。這時可以使用迭代器和生成器來解決這個問題。

def?find_first_match(data,?condition):
????for?item?in?data:
????????if?condition(item):
????????????return?item
????raise?ValueError('No?matching?item?found')

large_data?=?[i?for?i?in?range(10000000)]??#?構(gòu)造一個大數(shù)據(jù)集合
match?=?find_first_match(large_data,?lambda?x:?x?>?1000)??#?查找第一個大于?1000?的元素
print(match)

2.假設(shè)要實(shí)現(xiàn)一個函數(shù)，它接受一個字符串列表，然后返回這些字符串中所有字符的出現(xiàn)次數(shù)?？梢允褂玫骱蜕善鱽肀苊獗闅v整個列表，并減少內(nèi)存使用量。

def?char_count(words):
????counts?=?{}
????for?word?in?words:
????????for?char?in?word:
????????????counts[char]?=?counts.get(char,?0)?+?1
????return?counts

def?char_count_lazy(words):
????def?char_gen(words):
????????for?word?in?words:
????????????for?char?in?word:
????????????????yield?char
????counts?=?{}
????for?char?in?char_gen(words):
????????counts[char]?=?counts.get(char,?0)?+?1
????return?counts

3.需要遍歷一個多級嵌套的 JSON 對象，查找其中某個特定的值。假設(shè) JSON 對象很大，因此不能一次性加載到內(nèi)存中。這時可以使用生成器來逐級遍歷 JSON 對象。

def?find_value(json_obj,?target_key):
????if?isinstance(json_obj,?dict):
????????for?key,?value?in?json_obj.items():
????????????if?key?==?target_key:
????????????????yield?value
????????????else:
????????????????yield?from?find_value(value,?target_key)
????elif?isinstance(json_obj,?list):
????????for?item?in?json_obj:
????????????yield?from?find_value(item,?target_key)

json_data?=?{
????"name":?"tantianran",
????"age":?30,
????"cars":?[
????????{"model":?"BMW",?"year":?2000},
????????{"model":?"Tesla",?"year":?2020}
????],
????"location":?{
????????"address":?"123?Main?St",
????????"city":?"New?York",
????????"state":?"NY"
????}
}

for?value?in?find_value(json_data,?"year"):
????print(value)

4.如果需要讀取一個非常大的文件，并對其中的每一行進(jìn)行處理，但是由于文件太大，無法一次性將整個文件讀入內(nèi)存中。這時可以使用生成器來實(shí)現(xiàn)逐行讀取文件并逐行處理的操作。

def?process_lines(file_name):
????with?open(file_name)?as?f:
????????for?line?in?f:
????????????#?對每一行進(jìn)行處理，這里只是簡單地打印出來
????????????print(line.strip())

large_file?=?'data.txt'
process_lines(large_file)

5.假設(shè)有一個大型日志文件，其中包含了數(shù)千萬行日志記錄。需要對這個日志文件進(jìn)行分析，找出所有包含特定關(guān)鍵字的日志記錄，并進(jìn)行統(tǒng)計(jì)。如果直接讀取整個日志文件到內(nèi)存中，可能會導(dǎo)致內(nèi)存不足的問題。這時可以使用迭代器和生成器來解決這個問題。

def?log_file_reader(log_file_path):
????with?open(log_file_path)?as?f:
????????for?line?in?f:
????????????yield?line.strip()

def?log_analyzer(log_file_path,?keyword):
????log_reader?=?log_file_reader(log_file_path)
????count?=?0
????for?line?in?log_reader:
????????if?keyword?in?line:
????????????count?+=?1
????return?count

log_file_path?=?'logs.txt'
keyword?=?'error'
error_count?=?log_analyzer(log_file_path,?keyword)
print(f'The?number?of?error?logs?is:?{error_count}')

到此這篇關(guān)于Python開發(fā)之迭代器&生成器的實(shí)戰(zhàn)案例分享的文章就介紹到這了,更多相關(guān)Python迭代器生成器內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: