詳解Python 最短匹配模式
問題
你正在試著用正則表達式匹配某個文本模式,但是它找到的是模式的最長可能匹配。 而你想修改它變成查找最短的可能匹配。
解決方案
這個問題一般出現(xiàn)在需要匹配一對分隔符之間的文本的時候(比如引號包含的字符串)。 為了說明清楚,考慮如下的例子:
>>> str_pat = re.compile(r'"(.*)"') >>> text1 = 'Computer says "no."' >>> str_pat.findall(text1) ['no.'] >>> text2 = 'Computer says "no." Phone says "yes."' >>> str_pat.findall(text2) ['no." Phone says "yes.'] >>>
在這個例子中,模式 r'\"(.*)\"' 的意圖是匹配被雙引號包含的文本。 但是在正則表達式中*操作符是貪婪的,因此匹配操作會查找最長的可能匹配。 于是在第二個例子中搜索 text2 的時候返回結(jié)果并不是我們想要的。
為了修正這個問題,可以在模式中的*操作符后面加上?修飾符,就像這樣:
>>> str_pat = re.compile(r'"(.*?)"') >>> str_pat.findall(text2) ['no.', 'yes.'] >>>
這樣就使得匹配變成非貪婪模式,從而得到最短的匹配,也就是我們想要的結(jié)果。
討論
這一節(jié)展示了在寫包含點(.)字符的正則表達式的時候遇到的一些常見問題。 在一個模式字符串中,點(.)匹配除了換行外的任何字符。 然而,如果你將點(.)號放在開始與結(jié)束符(比如引號)之間的時候,那么匹配操作會查找符合模式的最長可能匹配。 這樣通常會導(dǎo)致很多中間的被開始與結(jié)束符包含的文本被忽略掉,并最終被包含在匹配結(jié)果字符串中返回。 通過在 * 或者 + 這樣的操作符后面添加一個 ? 可以強制匹配算法改成尋找最短的可能匹配。
以上就是詳解Python 最短匹配模式的詳細內(nèi)容,更多關(guān)于Python 最短匹配模式的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
Python中Tkinter的面向?qū)ο缶幊虇栴}與解決方案
在Python的GUI開發(fā)中,Tkinter是一個廣泛使用的標準庫,結(jié)合面向?qū)ο缶幊痰乃枷?可以使Tkinter的代碼更加模塊化和易于維護,然而,在實際應(yīng)用中,OOP與Tkinter的結(jié)合也會帶來一些常見的問題,本文將通過具體的代碼案例,分析這些問題,并提供相應(yīng)的解決方案2024-12-12學(xué)習(xí)python 的while循環(huán)嵌套
這篇文章主要為大家介紹了python 的while循環(huán)嵌套,具有一定的參考價值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來幫助2021-12-12