進一步理解Python中的函數(shù)編程
我們最好從最難的問題開始:“到底什么是函數(shù)編程 (FP)?”一個答案可能會說 FP 就是您在使用例如 Lisp、Scheme、Haskell、ML、OCAML、Clean、Mercury、Erlang(或其它一些)語言進行編程時所做的。這是一個穩(wěn)妥的答案,但不能很確切地闡明問題。不幸的是,即使是函數(shù)程序員他們自己也很難對 FP 究竟是什么有個一致的認識?!懊と嗣蟆钡墓适掠脕硇稳葸@一情況似乎很合適。還可以放心地將 FP 與“命令編程”(使用例如 C、Pascal、C++、Java、Perl、Awk、TCL 以及其它大多數(shù)語言所執(zhí)行的操作,至少是在很大程度上)進行對比。
從個人角度來說,我會將函數(shù)編程粗略地描繪為至少具有以下幾個特征。稱得上函數(shù)性的語言使這些事情變得簡單,而使其它事情變得困難或不可能:
- 函數(shù)是第一類(對象)。即,可以對“數(shù)據(jù)”進行的每樣操作都可以使用函數(shù)本身做到(例如將一個函數(shù)傳遞給另一個函數(shù))。
- 將遞歸用作主要的控制結構。在某些語言中,不存在其它“循環(huán)”構造。
- 重點集中在列表 LISt 處理(例如,名稱 Lisp )。列表經(jīng)常和子列表的遞歸一起使用以替代循環(huán)。
- “純”函數(shù)語言能夠避免副作用。這不包括在命令語言中最普遍的模式,即指定第一個,然后將另一個值指定給同一個變量來跟蹤程序狀態(tài)。
- FP 不鼓勵或根本不允許出現(xiàn) 語句,取而代之是使用表達式求值(換句話說,即函數(shù)加上自變量)。在很純粹的情況下,一個程序就是一個表達式(加上支持的定義)。
- FP 關心的是計算 什么而不是 如何計算。
- 許多 FP 利用了“更高等級”函數(shù)(換句話說,就是函數(shù)對一些函數(shù)操作,而這些函數(shù)又對其它函數(shù)操作)。
函數(shù)編程的提倡者認為所有這些特征都導致更快速的開發(fā)更短以及錯誤更少的代碼。而且,計算機科學、邏輯和數(shù)學領域的高級理論學家發(fā)現(xiàn)證明函數(shù)語言和程序的正式性能比命令語言和程序容易得多。
固有的 Python 函數(shù)能力
自從 Python 1.0 以來,Python 具有上面列出的大多數(shù) FP 特征。但對于大多數(shù) Python 特性,它們以一種非?;旌系恼Z言呈現(xiàn)。很大程度上是因為 Python 的 OOP 特性,您可以使用希望使用的部分而忽略其余部分(直到在稍后需要它為止)。使用 Python 2.0, 列表內涵添加了一些 非常棒的“句法上的粉飾”。雖然列表內涵沒有添加什么新的能力,但它們使許多舊的能力看起來好了 許多。
Python 中 FP 的基本元素是函數(shù) map() 、 reduce() 和 filter() ,以及運算符 lambda 。在 Python 1.x 中, apply() 函數(shù)對于將一個函數(shù)的列表返回值直接應用于另一個函數(shù)也很方便。Python 2.0 為這一目的提供了改進的語法。可能讓人吃驚,但很少的這幾個函數(shù)(以及基本運算符)幾乎足以編寫任何 Python程序;特別是,所有的流控制語句( if 、 elif 、 else 、 assert 、 try 、 except 、 finally 、 for 、 break 、 continue 、 while 、 def )可以只使用 FP 函數(shù)和運算符以函數(shù)風格處理。雖然實際上消除程序中的所有流控制命令可能只對加入“混亂的 Python”競爭(與看上去非常象 Lisp 的代碼)有用,但是理解 FP 是如何使用函數(shù)和遞歸來表示流控制是值得的。
消除流控制語句
在我們執(zhí)行消除聯(lián)系時要考慮的第一件事是 Python “短路”了布爾表達式的求值這一事實。這樣就提供了表達式版本的 if / elif / else 塊(假設每塊都調用一個函數(shù),通常總有可能這樣安排)。下面是具體方法:
清單 1. Python 中的“短路”條件調用
# Normal statement-based flow control if <cond1>: func1() elif <cond2>: func2() else : func3() # Equivalent "short circuit" expression (<cond1> and func1()) or (<cond2> and func2()) or (func3()) # Example "short circuit" expression >>> x = 3 >>> defpr (s): return s >>> (x==1 and pr( 'one')) or (x==2 and pr( 'two')) or (pr( 'other')) 'other' >>> x = 2 >>> (x==1 and pr( 'one')) or (x==2 and pr( 'two')) or (pr( 'other')) 'two'
表達式版本的條件性調用似乎不過是個位置訣竅;不過,如果我們注意到 lambda 運算符必須返回表達式時,就更有趣了。因為 -- 如前所示 -- 表達式可以通過短路來包含條件塊,所以 lambda 表達式在表達條件返回值中非常普通。在我們的示例上構建:
清單 2. Python 中 Lambda 短路
>>> pr = lambda s:s >>> namenum = lambda x: (x==1 and pr( "one")) \ .... or (x==2 and pr( "two")) \ .... or (pr( "other")) >>> namenum(1) 'one' >>> namenum(2) 'two' >>> namenum(3) 'other'
函數(shù)作為第一類對象
上面的示例已經(jīng)顯示出函數(shù)在 Python 中所處的第一類的地位,但以很微妙的方式。在使用 lambda 操作創(chuàng)建 函數(shù)對象 時,我們有一些完全常規(guī)的事物。正是因為這樣,我們可以將對象與名稱 "pr" 和 "namenum" 綁定,使用的方法和將數(shù)字 23 或字符串 "spam" 與這些名稱綁定的方法完全相同。但正如我們可以使用數(shù)字 23 而無需將它與任何名稱綁定一樣(換句話說,象函數(shù)自變量一樣),我們可以使用用 lambda 創(chuàng)建的函數(shù)對象而不用將它與任何名稱綁定。一個函數(shù)只是我們在 Python 中對其執(zhí)行某些操作的另一個值。
我們對第一類對象所執(zhí)行的主要操作是將它們傳遞給 FP 內置函數(shù) map() 、 reduce() 和 filter() 。這些函數(shù)中的每一個都接受函數(shù)對象作為其第一個自變量。
map() 對指定列表中每個對應的項執(zhí)行傳遞的函數(shù),并返回結果列表。
reduce() 對每個后續(xù)項執(zhí)行傳遞的函數(shù),返回的是最終結果的內部累加;例如 reduce(lambda n,m:n*m, range(1,10)) 意味著“10 的階乘”(換句話說,用每一項乘上前一次相乘的乘積)。
filter() 使用傳遞的函數(shù)對列表中的每一項“求值”,然后返回經(jīng)過甄別的,通過了傳遞函數(shù)測試的項的列表。
我們還經(jīng)常將函數(shù)對象傳遞給自己的定制函數(shù),但它們通常等同于上述內置函數(shù)的組合。
通過將這三種 FP 內置函數(shù)進行組合,可以執(zhí)行驚人的一系列“流”操作(都不使用語句,而只使用表達式)。
Python 中的函數(shù)循環(huán)
替換循環(huán)與替換條件塊一樣簡單。 for 可以直接轉換成 map() 。對于我們的條件執(zhí)行,我們需要將語句塊簡化成單一函數(shù)調用(我們正逐步接近通常的做法):
清單 3. Python 中的函數(shù) 'for' 循環(huán)
for e in lst: func(e) # statement-based loop map(func,lst) # map()-based loop
另外,對于連續(xù)程序流的函數(shù)方法有類似的技術。即,命令編程通常包含接近于“做這樣,然后做那樣,然后做其它事。”這樣的語句。 map() 讓我們正好做到這一點:
清單 4. Python 中的函數(shù)連續(xù)操作
# let's create an execution utility function do_it = lambda f: f() # let f1, f2, f3 (etc) be functions that perform actions map(do_it, [f1,f2,f3]) # map()-based action sequence
通常,我們的整個 main 程序可以是 map() 表達式和一系列完成程序所需要執(zhí)行的函數(shù)。第一類函數(shù)的另一個方便的特性就是可以將它們放在一個列表中。
while 的轉換稍微復雜了一些,但仍然可以直接進行:
清單 5. Python 中的函數(shù) 'while' 循環(huán)
# statement-based while loop while <cond>: <pre-suite> if <break_condition>: break else : <suite> # FP-style recursive while loopp defwhile_block (): <pre-suite> if <break_condition>: return 1 else : <suite> return 0 while_FP = lambda : (<cond> and while_block()) or while_FP() while_FP()
while 的轉換仍需要 while_block() 函數(shù),它本身包含語句而不僅僅是表達式。但我們需要對該函數(shù)做進一步的消除(例如對模板中的 if/else 進行短路)。另外,因為循環(huán)主體(按設計)無法更改任何變量值,所以 <cond> 很難用在一般的測試中,例如 while myvar==7 (那么,將在 while_block() 中修改全部內容)。添加更有用條件的一個方法是讓 while_block() 返回一個更有趣的值,然后將這個返回值與終止條件進行比較。有必要看一下這些消除語句的具體示例:
清單 6. Python 中的函數(shù) 'echo' 循環(huán)
# imperative version of "echo()" defecho_IMP (): while 1: x = raw_input( "IMP -- ") if x == 'quit': break else print x echo_IMP() # utility function for "identity with side-effect" defmonadic_print (x): print x return x # FP version of "echo()" echo_FP = lambda : monadic_print(raw_input( "FP -- "))== 'quit' or echo_FP() echo_FP()
我們所完成的是設法將涉及 I/O、循環(huán)和條件語句的小程序表示成一個帶有遞歸的純表達式(實際上,如果需要,可以表示成能傳遞到任何其它地方的函數(shù)對象)。我們 的確 仍然利用了實用程序函數(shù) monadic_print() ,但這個函數(shù)是完全一般性的,可以在我們以后創(chuàng)建的每個函數(shù)程序表達式中重用(它是一次性成本)。請注意,任何包含 monadic_print(x) 的表達式所 求值 的結果都是相同的,就象它只包含 x 一樣。FP(特別是 Haskell)對于“不執(zhí)行任何操作,在進程中有副作用”的函數(shù)具有“單一體”意思。
消除副作用
在除去完美的、有意義的語句不用而代之以晦澀的、嵌套的表達式的工作后,一個很自然的問題是:“為什么?!”我對 FP 的所有描述都是使用 Python 做到的。但最重要的特性 -- 可能也是具體情況中最有用的特性 -- 是它消除了副作用(或者至少對一些特殊領域,例如單一體,有一些牽制作用)。絕大部分程序錯誤 -- 和促使程序員求助于調試來解決的問題 -- 之所以會發(fā)生,是因為在程序執(zhí)行過程期間,變量包含了意外的值。函數(shù)程序只不過根本就不為變量分配值,從而避免了這一特殊問題。
讓我們看一段相當普通的命令代碼。它的目的是打印出乘積大于 25 的幾對數(shù)字的列表。組成各對的數(shù)字本身是從另外兩個列表中挑選出的。這種操作與程序員在他們程序段中實際執(zhí)行的操作差不多。實現(xiàn)這一目的的命令方法如下:
清單 7. “打印大乘積”的命令 Python 代碼
# Nested loop procedural style for finding big products xs = (1,2,3,4) ys = (10,15,3,22) bigmuls = [] # ...more stuff... for x in xs: for y in ys: # ...more stuff... if x*y > 25: bigmuls.append((x,y)) # ...more stuff... # ...more stuff... print bigmuls
這個項目太小,以至于沒有什么可能出錯。但我們的目的可能嵌在要同時實現(xiàn)許多其它目的的代碼中。用 "more stuff" 注釋的那些部分是副作用可能導致錯誤發(fā)生的地方。在這些地方中的任何一處,變量 xs 、 ys 、 bigmuls 、 x 、 y 有可能獲得假設節(jié)略代碼中的意外值。而且,在執(zhí)行完這一段代碼后,所有變量都可能具有稍后代碼可能需要也可能不需要的一些值。很明顯,可以使用函數(shù)/實例形式的封裝和有關作用域的考慮來防止出現(xiàn)這種類型的錯誤。而且,您總是可以在執(zhí)行完變量后 del 它們。但在實際中,這些指出類型的錯誤非常普遍。
目標的函數(shù)方法完全消除了這些副作用錯誤。以下是可能的一段代碼:
清單 8. “打印大乘積”的函數(shù) Python 代碼
bigmuls = lambda xs,ys: filter( lambda (x,y):x*y > 25, combine(xs,ys)) combine = lambda xs,ys: map(None, xs*len(ys), dupelms(ys,len(xs))) dupelms = lambda lst,n: reduce( lambda s,t:s+t, map( lambda l,n=n: [l]*n, lst)) print bigmuls((1,2,3,4),(10,15,3,22))
在示例中,我們將匿名 ( lambda ) 函數(shù)對象與名稱進行綁定,但這不是一定必要的。我們可以只嵌套定義。這樣做是出于可讀性目的;但也是因為 combine() 是一種隨處可得的很好實用程序函數(shù)(從兩個輸入列表中產(chǎn)生所有元素對的列表)。隨后的 dupelms() 主要只是幫助 combine() 發(fā)揮作用的一種方法。即使這一函數(shù)示例比命令示例更冗長,但一旦考慮到實用程序函數(shù)可以重用,那么 bigmuls() 中的新代碼本身可能比命令版本中的代碼數(shù)量還要少一些。
這種函數(shù)示例真正的優(yōu)勢在于絕對不會有變量更改其中的任何值。稍后的代碼中沒有 可能的不曾預料到的副作用(較早的代碼中也不會有)。很明顯,它本身沒有副作用并不能保證代碼 正確,但即使這樣,這也是個優(yōu)點。不過請注意,Python(與許多函數(shù)語言不同) 不能 防止名稱 bigmuls 、 combine 和 dupelms 的重新綁定。如果 combine() 在程序的稍后部分中開始有其它意義,則所有努力都前功盡棄。您可以逐步建立一個 Singleton 類來包含這種類型的不可變綁定(例如 s.bigmuls 等);但本專欄并不涉及這一內容。
特別值得注意的一個問題是我們的特定目的是對 Python 2 中的新特性進行定制。最好的(也是函數(shù)的)技術既不是上面提供的命令示例,也不是函數(shù)實例,而是:
清單 9. "bigmuls" 的列表內涵 Python 代碼
print [(x,y) for x in (1,2,3,4) for y in (10,15,3,22) if x*y > 25]
結束語
我已介紹了使用函數(shù)等價物替換每個 Python 流控制構造所使用的方法(在過程中消除了副作用)。對特定程序進行有效轉換將帶來一些額外的考慮,但我們已經(jīng)知道內置函數(shù)是常規(guī)而完整的。在稍后的專欄中,我們將考慮一些更高級的函數(shù)編程技術;希望能夠探索函數(shù)風格的更多利弊。
相關文章
python生成器,可迭代對象,迭代器區(qū)別和聯(lián)系
這篇文章主要介紹了python生成器,可迭代對象,迭代器區(qū)別和聯(lián)系,通過對比用法讓大家更加深入理解相關知識,需要的朋友參考學習下吧。2018-02-02Pytorch數(shù)據(jù)類型與轉換(torch.tensor,torch.FloatTensor)
這篇文章主要介紹了Pytorch數(shù)據(jù)類型轉換(torch.tensor,torch.FloatTensor),之前遇到轉為tensor轉化為浮點型的問題,今天整理下,我只講幾個我常用的,對Pytorch數(shù)據(jù)類型轉換相關知識感興趣的朋友一起看看吧2023-02-02