分享一下如何編寫高效且優(yōu)雅的 Python 代碼
本文部分提煉自書籍:《Effective Python》&《Python3 Cookbook》,但也做出了修改,并加上了作者自己的理解和運用中的最佳實踐。
全文約 9956 字,讀完可能需要 24 分鐘。
Pythonic列表切割
list[start:end:step]
如果從列表開頭開始切割,那么忽略 start 位的 0,例如list[:4]
如果一直切到列表尾部,則忽略 end 位的 0,例如list[3:]
切割列表時,即便 start 或者 end 索引跨界也不會有問題
列表切片不會改變原列表。索引都留空時,會生成一份原列表的拷貝

列表推導式
使用列表推導式來取代map和filter

不要使用含有兩個以上表達式的列表推導式

數(shù)據(jù)多時,列表推導式可能會消耗大量內(nèi)存,此時建議使用生成器表達式

迭代
需要獲取 index 時使用enumerate
enumerate可以接受第二個參數(shù),作為迭代時加在index上的數(shù)值

用zip同時遍歷兩個迭代器

zip遍歷時返回一個元組

關于for和while循環(huán)后的else塊
循環(huán)正常結(jié)束之后會調(diào)用else內(nèi)的代碼
循環(huán)里通過break跳出循環(huán),則不會執(zhí)行else
要遍歷的序列為空時,立即執(zhí)行else

反向迭代
對于普通的序列(列表),我們可以通過內(nèi)置的reversed()函數(shù)進行反向迭代:

除此以外,還可以通過實現(xiàn)類里的__reversed__方法,將類進行反向迭代:

try/except/else/finally
如果try內(nèi)沒有發(fā)生異常,則調(diào)用else內(nèi)的代碼
else會在finally之前運行
最終一定會執(zhí)行finally,可以在其中進行清理工作
函數(shù)使用裝飾器
裝飾器用于在不改變原函數(shù)代碼的情況下修改已存在的函數(shù)。常見場景是增加一句調(diào)試,或者為已有的函數(shù)增加log監(jiān)控
舉個栗子:

除此以外,還可以編寫接收參數(shù)的裝飾器,其實就是在原本的裝飾器上的外層又嵌套了一個函數(shù):

但是像上面那樣使用裝飾器的話有一個問題:

也就是說原函數(shù)已經(jīng)被裝飾器里的new_fun函數(shù)替代掉了。調(diào)用經(jīng)過裝飾的函數(shù),相當于調(diào)用一個新函數(shù)。查看原函數(shù)的參數(shù)、注釋、甚至函數(shù)名的時候,只能看到裝飾器的相關信息。為了解決這個問題,我們可以使用
Python 自帶的functools.wraps方法。
functools.wraps是個很 hack 的方法,它本事作為一個裝飾器,做用在裝飾器內(nèi)部將要返回的函數(shù)上。也就是說,它是裝飾器的裝飾器,并且以原函數(shù)為參數(shù),作用是保留原函數(shù)的各種信息,使得我們之后查看被裝飾了的原函數(shù)的信息時,可以保持跟原函數(shù)一模一樣。

此外,有時候我們的裝飾器里可能會干不止一個事情,此時應該把事件作為額外的函數(shù)分離出去。但是又因為它可能僅僅和該裝飾器有關,所以此時可以構(gòu)造一個裝飾器類。原理很簡單,主要就是編寫類里的__call__方法,使類能夠像函數(shù)一樣的調(diào)用。

使用生成器
考慮使用生成器來改寫直接返回列表的函數(shù)

用這種方法有幾個小問題:
每次獲取到符合條件的結(jié)果,都要調(diào)用append方法。但實際上我們的關注點根本不在這個方法,它只是我們達成目的的手段,實際上只需要index就好了
返回的result可以繼續(xù)優(yōu)化
數(shù)據(jù)都存在result里面,如果數(shù)據(jù)量很大的話,會比較占用內(nèi)存
因此,使用生成器generator會更好。生成器是使用yield表達式的函數(shù),調(diào)用生成器時,它不會真的執(zhí)行,而是返回一個迭代器,每次在迭代器上調(diào)用內(nèi)置的next函數(shù)時,迭代器會把生成器推進到下一個yield表達式:

獲取到一個生成器以后,可以正常的遍歷它:

如果你還是需要一個列表,那么可以將函數(shù)的調(diào)用結(jié)果作為參數(shù),再調(diào)用list方法

可迭代對象
需要注意的是,普通的迭代器只能迭代一輪,一輪之后重復調(diào)用是無效的。解決這種問題的方法是,你可以定義一個可迭代的容器類:

這樣的話,將類的實例迭代重復多少次都沒問題:

但要注意的是,僅僅是實現(xiàn)__iter__方法的迭代器,只能通過for循環(huán)來迭代;想要通過next方法迭代的話則需要使用iter方法:

使用位置參數(shù)
有時候,方法接收的參數(shù)數(shù)目可能不一定,比如定義一個求和的方法,至少要接收兩個參數(shù):

對于這種接收參數(shù)數(shù)目不一定,而且不在乎參數(shù)傳入順序的函數(shù),則應該利用位置參數(shù)*args:

但要注意的是,不定長度的參數(shù)args在傳遞給函數(shù)時,需要先轉(zhuǎn)換成元組tuple。這意味著,如果你將一個生成器作為參數(shù)帶入到函數(shù)中,生成器將會先遍歷一遍,轉(zhuǎn)換為元組。這可能會消耗大量內(nèi)存:

使用關鍵字參數(shù)
關鍵字參數(shù)可提高代碼可讀性
可以通過關鍵字參數(shù)給函數(shù)提供默認值
便于擴充函數(shù)參數(shù)
定義只能使用關鍵字參數(shù)的函數(shù)
普通的方式,在調(diào)用時不會強制要求使用關鍵字參數(shù)

使用 Python3 中強制關鍵字參數(shù)的方式

使用 Python2 中強制關鍵字參數(shù)的方式

關于參數(shù)的默認值
算是老生常談了:函數(shù)的默認值只會在程序加載模塊并讀取到該函數(shù)的定義時設置一次
也就是說,如果給某參數(shù)賦予動態(tài)的值(
比如[]或者{}),則如果之后在調(diào)用函數(shù)的時候給參數(shù)賦予了其他參數(shù),則以后再調(diào)用這個函數(shù)的時候,之前定義的默認值將會改變,成為上一次調(diào)用時賦予的值:

因此,更推薦使用None作為默認參數(shù),在函數(shù)內(nèi)進行判斷之后賦值:

類__slots__
默認情況下,Python 用一個字典來保存一個對象的實例屬性。這使得我們可以在運行的時候動態(tài)的給類的實例添加新的屬性:

然而這個字典浪費了多余的空間 -— 很多時候我們不會創(chuàng)建那么多的屬性。因此通過__slots__可以告訴 Python
不要使用字典而是固定集合來分配空間。

__call__
通過定義類中的__call__方法,可以使該類的實例能夠像普通函數(shù)一樣調(diào)用。

通過這種方式實現(xiàn)的好處是,可以通過類的屬性來保存狀態(tài),而不必創(chuàng)建一個閉包或者全局變量。
@classmethod & @staticmethod
@classmethod和@staticmethod很像,但他們的使用場景并不一樣。
類內(nèi)部普通的方法,都是以self作為第一個參數(shù),代表著通過實例調(diào)用時,將實例的作用域傳入方法內(nèi);
@classmethod以cls作為第一個參數(shù),代表將類本身的作用域傳入。無論通過類來調(diào)用,還是通過類的實例調(diào)用,默認傳入的第一個參數(shù)都將是類本身
@staticmethod不需要傳入默認參數(shù),類似于一個普通的函數(shù)
來通過實例了解它們的使用場景:
假設我們需要創(chuàng)建一個名為Date的類,用于儲存 年/月/日 三個數(shù)據(jù)

上述代碼創(chuàng)建了Date類,該類會在初始化時設置day/month/year屬性,并且通過property設置了一個getter,可以在實例化之后,通過time獲取存儲的時間:

但如果我們想改變屬性傳入的方式呢?畢竟,在初始化時就要傳入年/月/日三個屬性還是很煩人的。能否找到一個方法,在不改變現(xiàn)有接口和方法的情況下,可以通過傳入2016-11-09這樣的字符串來創(chuàng)建一個Date實例?
你可能會想到這樣的方法:

但不夠好:
在類外額外多寫了一個方法,每次還得格式化以后獲取參數(shù)
這個方法也只跟Date類有關
沒有解決傳入?yún)?shù)過多的問題
此時就可以利用@classmethod,在類的內(nèi)部新建一個格式化字符串,并返回類的實例的方法:

這樣,我們就可以通過Date類來調(diào)用from_string方法創(chuàng)建實例,并且不侵略、修改舊的實例化方式:

好處:
在@classmethod內(nèi),可以通過cls參數(shù),獲取到跟外部調(diào)用類時一樣的便利
可以在其中進一步封裝該方法,提高復用性
更加符合面向?qū)ο蟮木幊谭绞?/p>
而@staticmethod,因為其本身類似于普通的函數(shù),所以可以把和這個類相關的 helper
方法作為@staticmethod,放在類里,然后直接通過類來調(diào)用這個方法。

將與日期相關的輔助類函數(shù)作為@staticmethod方法放在Date類內(nèi)后,可以通過類來調(diào)用這些方法:

創(chuàng)建上下文管理器
上下文管理器,通俗的介紹就是:在代碼塊執(zhí)行前,先進行準備工作;在代碼塊執(zhí)行完成后,做收尾的處理工作。with語句常伴隨上下文管理器一起出現(xiàn),經(jīng)典場景有:

通過with語句,代碼完成了文件打開操作,并在調(diào)用結(jié)束,或者讀取發(fā)生異常時自動關閉文件,即完成了文件讀寫之后的處理工作。如果不通過上下文管理器的話,則會是這樣的代碼:

比較繁瑣吧?所以說使用上下文管理器的好處就是,通過調(diào)用我們預先設置好的回調(diào),自動幫我們處理代碼塊開始執(zhí)行和執(zhí)行完畢時的工作。而通過自定義類的__enter__和__exit__方法,我們可以自定義一個上下文管理器。

然后可以以這樣的方式進行調(diào)用:

在調(diào)用的時候:
with語句先暫存了ReadFile類的__exit__方法
然后調(diào)用ReadFile類的__enter__方法
__enter__方法打開文件,并將結(jié)果返回給with語句
上一步的結(jié)果被傳遞給file_read參數(shù)
在with語句內(nèi)對file_read參數(shù)進行操作,讀取每一行
讀取完成之后,with語句調(diào)用之前暫存的__exit__方法
__exit__方法關閉了文件
要注意的是,在__exit__方法內(nèi),我們關閉了文件,但最后返回True,所以錯誤不會被with語句拋出。否則with語句會拋出一個對應的錯誤。
相關文章
教你如何使用Python快速爬取需要的數(shù)據(jù)
學點數(shù)據(jù)爬蟲基礎能讓繁瑣的數(shù)據(jù)CV工作(Ctrl+C,Ctrl+V)成為自動化就足夠了.作為一名數(shù)據(jù)分析師而并非開發(fā)工程師,需要掌握的爬蟲必備的知識內(nèi)容,能獲取需要的數(shù)據(jù)即可 ,需要的朋友可以參考下2021-06-06

