分享一下如何編寫高效且優(yōu)雅的 Python 代碼
本文部分提煉自書籍:《Effective Python》&《Python3 Cookbook》,但也做出了修改,并加上了作者自己的理解和運用中的最佳實踐。
全文約 9956 字,讀完可能需要 24 分鐘。
Pythonic列表切割
list[start:end:step]
如果從列表開頭開始切割,那么忽略 start 位的 0,例如list[:4]
如果一直切到列表尾部,則忽略 end 位的 0,例如list[3:]
切割列表時,即便 start 或者 end 索引跨界也不會有問題
列表切片不會改變原列表。索引都留空時,會生成一份原列表的拷貝
列表推導(dǎo)式
使用列表推導(dǎo)式來取代map
和filter
不要使用含有兩個以上表達(dá)式的列表推導(dǎo)式
數(shù)據(jù)多時,列表推導(dǎo)式可能會消耗大量內(nèi)存,此時建議使用生成器表達(dá)式
迭代
需要獲取 index 時使用enumerate
enumerate
可以接受第二個參數(shù),作為迭代時加在index
上的數(shù)值
用zip
同時遍歷兩個迭代器
zip
遍歷時返回一個元組
關(guān)于for
和while
循環(huán)后的else
塊
循環(huán)正常結(jié)束之后會調(diào)用else
內(nèi)的代碼
循環(huán)里通過break
跳出循環(huán),則不會執(zhí)行else
要遍歷的序列為空時,立即執(zhí)行else
反向迭代
對于普通的序列(列表),我們可以通過內(nèi)置的reversed()
函數(shù)進(jìn)行反向迭代:
除此以外,還可以通過實現(xiàn)類里的__reversed__
方法,將類進(jìn)行反向迭代:
try/except/else/finally
如果try
內(nèi)沒有發(fā)生異常,則調(diào)用else
內(nèi)的代碼
else
會在finally
之前運行
最終一定會執(zhí)行finally
,可以在其中進(jìn)行清理工作
函數(shù)使用裝飾器
裝飾器用于在不改變原函數(shù)代碼的情況下修改已存在的函數(shù)。常見場景是增加一句調(diào)試,或者為已有的函數(shù)增加log
監(jiān)控
舉個栗子:
除此以外,還可以編寫接收參數(shù)的裝飾器,其實就是在原本的裝飾器上的外層又嵌套了一個函數(shù):
但是像上面那樣使用裝飾器的話有一個問題:
也就是說原函數(shù)已經(jīng)被裝飾器里的new_fun
函數(shù)替代掉了。調(diào)用經(jīng)過裝飾的函數(shù),相當(dāng)于調(diào)用一個新函數(shù)。查看原函數(shù)的參數(shù)、注釋、甚至函數(shù)名的時候,只能看到裝飾器的相關(guān)信息。為了解決這個問題,我們可以使用
Python 自帶的functools.wraps
方法。
functools.wraps
是個很 hack 的方法,它本事作為一個裝飾器,做用在裝飾器內(nèi)部將要返回的函數(shù)上。也就是說,它是裝飾器的裝飾器,并且以原函數(shù)為參數(shù),作用是保留原函數(shù)的各種信息,使得我們之后查看被裝飾了的原函數(shù)的信息時,可以保持跟原函數(shù)一模一樣。
此外,有時候我們的裝飾器里可能會干不止一個事情,此時應(yīng)該把事件作為額外的函數(shù)分離出去。但是又因為它可能僅僅和該裝飾器有關(guān),所以此時可以構(gòu)造一個裝飾器類。原理很簡單,主要就是編寫類里的__call__
方法,使類能夠像函數(shù)一樣的調(diào)用。
使用生成器
考慮使用生成器來改寫直接返回列表的函數(shù)
用這種方法有幾個小問題:
每次獲取到符合條件的結(jié)果,都要調(diào)用append
方法。但實際上我們的關(guān)注點根本不在這個方法,它只是我們達(dá)成目的的手段,實際上只需要index
就好了
返回的result
可以繼續(xù)優(yōu)化
數(shù)據(jù)都存在result
里面,如果數(shù)據(jù)量很大的話,會比較占用內(nèi)存
因此,使用生成器generator
會更好。生成器是使用yield
表達(dá)式的函數(shù),調(diào)用生成器時,它不會真的執(zhí)行,而是返回一個迭代器,每次在迭代器上調(diào)用內(nèi)置的next
函數(shù)時,迭代器會把生成器推進(jìn)到下一個yield
表達(dá)式:
獲取到一個生成器以后,可以正常的遍歷它:
如果你還是需要一個列表,那么可以將函數(shù)的調(diào)用結(jié)果作為參數(shù),再調(diào)用list
方法
可迭代對象
需要注意的是,普通的迭代器只能迭代一輪,一輪之后重復(fù)調(diào)用是無效的。解決這種問題的方法是,你可以定義一個可迭代的容器類:
這樣的話,將類的實例迭代重復(fù)多少次都沒問題:
但要注意的是,僅僅是實現(xiàn)__iter__
方法的迭代器,只能通過for
循環(huán)來迭代;想要通過next
方法迭代的話則需要使用iter
方法:
使用位置參數(shù)
有時候,方法接收的參數(shù)數(shù)目可能不一定,比如定義一個求和的方法,至少要接收兩個參數(shù):
對于這種接收參數(shù)數(shù)目不一定,而且不在乎參數(shù)傳入順序的函數(shù),則應(yīng)該利用位置參數(shù)*args
:
但要注意的是,不定長度的參數(shù)args
在傳遞給函數(shù)時,需要先轉(zhuǎn)換成元組tuple
。這意味著,如果你將一個生成器作為參數(shù)帶入到函數(shù)中,生成器將會先遍歷一遍,轉(zhuǎn)換為元組。這可能會消耗大量內(nèi)存:
使用關(guān)鍵字參數(shù)
關(guān)鍵字參數(shù)可提高代碼可讀性
可以通過關(guān)鍵字參數(shù)給函數(shù)提供默認(rèn)值
便于擴(kuò)充函數(shù)參數(shù)
定義只能使用關(guān)鍵字參數(shù)的函數(shù)
普通的方式,在調(diào)用時不會強(qiáng)制要求使用關(guān)鍵字參數(shù)
使用 Python3 中強(qiáng)制關(guān)鍵字參數(shù)的方式
使用 Python2 中強(qiáng)制關(guān)鍵字參數(shù)的方式
關(guān)于參數(shù)的默認(rèn)值
算是老生常談了:函數(shù)的默認(rèn)值只會在程序加載模塊并讀取到該函數(shù)的定義時設(shè)置一次
也就是說,如果給某參數(shù)賦予動態(tài)的值(
比如[]
或者{}
),則如果之后在調(diào)用函數(shù)的時候給參數(shù)賦予了其他參數(shù),則以后再調(diào)用這個函數(shù)的時候,之前定義的默認(rèn)值將會改變,成為上一次調(diào)用時賦予的值:
因此,更推薦使用None
作為默認(rèn)參數(shù),在函數(shù)內(nèi)進(jìn)行判斷之后賦值:
類__slots__
默認(rèn)情況下,Python 用一個字典來保存一個對象的實例屬性。這使得我們可以在運行的時候動態(tài)的給類的實例添加新的屬性:
然而這個字典浪費了多余的空間 -— 很多時候我們不會創(chuàng)建那么多的屬性。因此通過__slots__
可以告訴 Python
不要使用字典而是固定集合來分配空間。
__call__
通過定義類中的__call__
方法,可以使該類的實例能夠像普通函數(shù)一樣調(diào)用。
通過這種方式實現(xiàn)的好處是,可以通過類的屬性來保存狀態(tài),而不必創(chuàng)建一個閉包或者全局變量。
@classmethod
& @staticmethod
@classmethod
和@staticmethod
很像,但他們的使用場景并不一樣。
類內(nèi)部普通的方法,都是以self
作為第一個參數(shù),代表著通過實例調(diào)用時,將實例的作用域傳入方法內(nèi);
@classmethod
以cls
作為第一個參數(shù),代表將類本身的作用域傳入。無論通過類來調(diào)用,還是通過類的實例調(diào)用,默認(rèn)傳入的第一個參數(shù)都將是類本身
@staticmethod
不需要傳入默認(rèn)參數(shù),類似于一個普通的函數(shù)
來通過實例了解它們的使用場景:
假設(shè)我們需要創(chuàng)建一個名為Date
的類,用于儲存 年/月/日 三個數(shù)據(jù)
上述代碼創(chuàng)建了Date
類,該類會在初始化時設(shè)置day/month/year
屬性,并且通過property
設(shè)置了一個getter
,可以在實例化之后,通過time
獲取存儲的時間:
但如果我們想改變屬性傳入的方式呢?畢竟,在初始化時就要傳入年/月/日三個屬性還是很煩人的。能否找到一個方法,在不改變現(xiàn)有接口和方法的情況下,可以通過傳入2016-11-09
這樣的字符串來創(chuàng)建一個Date
實例?
你可能會想到這樣的方法:
但不夠好:
在類外額外多寫了一個方法,每次還得格式化以后獲取參數(shù)
這個方法也只跟Date
類有關(guān)
沒有解決傳入?yún)?shù)過多的問題
此時就可以利用@classmethod
,在類的內(nèi)部新建一個格式化字符串,并返回類的實例的方法:
這樣,我們就可以通過Date
類來調(diào)用from_string
方法創(chuàng)建實例,并且不侵略、修改舊的實例化方式:
好處:
在@classmethod
內(nèi),可以通過cls
參數(shù),獲取到跟外部調(diào)用類時一樣的便利
可以在其中進(jìn)一步封裝該方法,提高復(fù)用性
更加符合面向?qū)ο蟮木幊谭绞?/p>
而@staticmethod
,因為其本身類似于普通的函數(shù),所以可以把和這個類相關(guān)的 helper
方法作為@staticmethod
,放在類里,然后直接通過類來調(diào)用這個方法。
將與日期相關(guān)的輔助類函數(shù)作為@staticmethod
方法放在Date
類內(nèi)后,可以通過類來調(diào)用這些方法:
創(chuàng)建上下文管理器
上下文管理器,通俗的介紹就是:在代碼塊執(zhí)行前,先進(jìn)行準(zhǔn)備工作;在代碼塊執(zhí)行完成后,做收尾的處理工作。with
語句常伴隨上下文管理器一起出現(xiàn),經(jīng)典場景有:
通過with
語句,代碼完成了文件打開操作,并在調(diào)用結(jié)束,或者讀取發(fā)生異常時自動關(guān)閉文件,即完成了文件讀寫之后的處理工作。如果不通過上下文管理器的話,則會是這樣的代碼:
比較繁瑣吧?所以說使用上下文管理器的好處就是,通過調(diào)用我們預(yù)先設(shè)置好的回調(diào),自動幫我們處理代碼塊開始執(zhí)行和執(zhí)行完畢時的工作。而通過自定義類的__enter__
和__exit__
方法,我們可以自定義一個上下文管理器。
然后可以以這樣的方式進(jìn)行調(diào)用:
在調(diào)用的時候:
with
語句先暫存了ReadFile
類的__exit__
方法
然后調(diào)用ReadFile
類的__enter__
方法
__enter__
方法打開文件,并將結(jié)果返回給with
語句
上一步的結(jié)果被傳遞給file_read
參數(shù)
在with
語句內(nèi)對file_read
參數(shù)進(jìn)行操作,讀取每一行
讀取完成之后,with
語句調(diào)用之前暫存的__exit__
方法
__exit__
方法關(guān)閉了文件
要注意的是,在__exit__
方法內(nèi),我們關(guān)閉了文件,但最后返回True
,所以錯誤不會被with
語句拋出。否則with
語句會拋出一個對應(yīng)的錯誤。
相關(guān)文章
教你如何使用Python快速爬取需要的數(shù)據(jù)
學(xué)點數(shù)據(jù)爬蟲基礎(chǔ)能讓繁瑣的數(shù)據(jù)CV工作(Ctrl+C,Ctrl+V)成為自動化就足夠了.作為一名數(shù)據(jù)分析師而并非開發(fā)工程師,需要掌握的爬蟲必備的知識內(nèi)容,能獲取需要的數(shù)據(jù)即可 ,需要的朋友可以參考下2021-06-06