書寫Python代碼的一種更優(yōu)雅方式(推薦!)
1 簡介
一些比較熟悉pandas的讀者朋友應(yīng)該經(jīng)常會使用query()、eval()、pipe()、assign()等pandas的常用方法,書寫可讀性很高的「鏈式」數(shù)據(jù)分析處理代碼,從而更加絲滑流暢地組織代碼邏輯。
但在原生Python中并沒有提供類似shell中的管道操作符|、R中的管道操作符%>%等語法,也沒有針對列表等數(shù)組結(jié)構(gòu)的可進行鏈式書寫的快捷方法,譬如javascript中數(shù)組的map()、filter()、some()、every()等。
正所謂“標準庫不夠,三方庫來湊”,Python原生對鏈式寫法支持不到位沒關(guān)系,我們可以使用一些簡單方便且輕量的第三方庫來協(xié)助我們在Python代碼中大面積實現(xiàn)鏈式寫法,今天的文章中我就將帶大家一起學(xué)習(xí)相關(guān)的知識技巧~
2 在Python中配合pipe靈活使用鏈式寫法
我們將使用到pipe這個第三方庫,它不僅內(nèi)置了很多實用的「管道操作函數(shù)」,還提供了將常規(guī)函數(shù)快捷「轉(zhuǎn)換」為管道操作函數(shù)的方法,使用pip install pipe對其進行安裝即可。
pipe的用法非常方便,類似shell中的管道操作:以你的數(shù)組變量為起點,使用操作符|銜接pipe內(nèi)置的各個常見管道操作函數(shù),組裝起自己所需的計算步驟即可,譬如,我們篩選輸入數(shù)組中為偶數(shù)的,再求平方,就可以寫作:
import pipe
list(
range(10) |
pipe.filter(lambda x: x % 2 == 0) |
pipe.select(lambda x: x ** 2)
)
因為pipe搭建的管道默認都是惰性運算的,直接產(chǎn)生的結(jié)果是生成器類型,所以上面的例子中我們最外層套上了list()來取得實際計算結(jié)果,更優(yōu)雅的方式是配合pipe.Pipe(),將list()也改造為管道操作函數(shù):
from pipe import Pipe
(
range(10) |
pipe.filter(lambda x: x % 2 == 0) |
pipe.select(lambda x: x ** 2) |
Pipe(list)
)
在上面的簡單例子中我們使用到的filter()、select()等就是pipe中常見的管道操作函數(shù),事實上pipe中的管道操作函數(shù)相當?shù)呢S富,下面我們來展示其中一些常用的:
2.1 pipe中常用的管道操作函數(shù)
2.1.1 使用traverse()展平嵌套數(shù)組
如果你想要將任意嵌套數(shù)組結(jié)構(gòu)展平,可以使用traverse():
(
[1, [2, 3, [4, 5]], 6, [7, 8, [9, [10, 11]]]] |
pipe.traverse |
Pipe(list)
)
2.1.2 使用dedup()進行順序去重
如果我們需要對包含若干重復(fù)值的數(shù)組進行去重,且希望保留原始數(shù)據(jù)的順序,則可以使用dedup(),其還支持key參數(shù),類似sorted()中的同名參數(shù),實現(xiàn)自定義去重規(guī)則:
(
[-1, 0, 0, 0, 1, 2, 3] |
pipe.dedup |
Pipe(list)
)
(
[-1, 0, 0, 0, 1, 2, 3] |
# 基于每個元素的絕對值進行去重
pipe.dedup(key=abs) |
Pipe(list)
)
2.1.3 使用filter()進行值過濾
我們最開始的例子中使用過它,用法就是基于傳入的lambda函數(shù)對每個元素進行條件判斷,并保留結(jié)果為True的,與javascript中的filter()方法非常相似:
(
[1, 4, 3, 2, 5, 6, 8] |
# 保留大于5的元素
pipe.filter(lambda x: x > 5) |
Pipe(list)
)
2.1.4 使用groupby()進行分組運算
這個函數(shù)非常實用,其功能相當于管道操作版本的itertools.groupby(),可以幫助我們基于lambda函數(shù)運算結(jié)果對原始輸入數(shù)組進行分組,通過groupby()操作后直接得到的結(jié)果是分組結(jié)果的二元組列表,每個元組的第一個元素是分組標簽,第二個元素是分到該組內(nèi)的各個元素:

基于此,我們可以銜接很多其他管道操作函數(shù),譬如銜接select()對分組結(jié)果進行自定義運算:

2.1.5 使用select()對上一步結(jié)果進行自定義遍歷運算
這個函數(shù)是pipe()中核心的管道操作函數(shù),通過前面的若干例子也能弄明白,它的功能是基于我們自定義的函數(shù),對上一步的運算結(jié)果進行遍歷運算。

2.1.6 使用sort()進行排序
相當于內(nèi)置函數(shù)sorted()的管道操作版本,同樣支持key、reverse參數(shù):

上述內(nèi)容足以支撐大部分日常操作需求,你也可以在https://github.com/JulienPalard/Pipe中查看pipe的更多功能介紹。
總結(jié)
到此這篇關(guān)于書寫Python代碼的一種更優(yōu)雅方式的文章就介紹到這了,更多相關(guān)Python代碼書寫內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
詳解Python實現(xiàn)多進程異步事件驅(qū)動引擎
本篇文章主要介紹了詳解Python實現(xiàn)多進程異步事件驅(qū)動引擎,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2017-08-08
詳解Python中Pytest和Unittest的區(qū)別
Pytest?和?Unittest是Python中屬于最常用的兩個測試框架。那么他們有些什么區(qū)別呢??Playwright?為什么只給了Pytest的深度支持,而不是Unittest呢?本文就來和大家詳細聊聊2023-03-03
在Python函數(shù)中輸入任意數(shù)量參數(shù)的實例
今天小編就為大家分享一篇在Python函數(shù)中輸入任意數(shù)量參數(shù)的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-07-07
python利用xpath爬取網(wǎng)上數(shù)據(jù)并存儲到django模型中
這篇文章主要介紹了python利用xpath爬取網(wǎng)上數(shù)據(jù)并存儲到django模型中,本文給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-02-02

