Python 正則 re.compile 真的必需嗎
背景:我在爬蟲處理某個(gè)文本時(shí),用到了re.findall(),而不是re.compile。遠(yuǎn)在新加坡的同事提出了質(zhì)疑,認(rèn)為以我的水平,不應(yīng)該寫出這樣影響性能的代碼,讓我優(yōu)化一下。我提出了反駁:既然使用了Python,就不應(yīng)該太過考慮性能的問題,如果要考慮性能就使用C語言,而不是Python.他接著說:正是因?yàn)閜ython性能不夠,所以更應(yīng)該考慮代碼的優(yōu)化,能做好就應(yīng)該做到最好.最后,我沒有回話,當(dāng)然我也沒有進(jìn)行所謂的優(yōu)化,以下我會(huì)給出我自己的觀點(diǎn).
re.compile()、re.findall()、re.search() 的作用與區(qū)別
1、re.compile()
Python里的re是支持正則表達(dá)式的模塊,所謂的正則表達(dá)式就是匹配文本里符合條件的語句. re.compile()是根據(jù)包含正則表達(dá)式的字符串創(chuàng)建模式對(duì)象,以提高匹配效率.例如:
def test(): regex = r'(\d+) years old' content = 'Alex is a 7 years old boy.' reg = re.compile(regex) result = re.search(reg, content).group() print(result) result = 7
2、re.search()
re.search()是在字符串開啟查找模式,如其名:search.例如:
def test(): content = 'Alex is a 7 years old boy.' result = re.search(r'(\d+) years old', content).group() print(result) result = 7
3、re.findall()
re.findall()是返回一個(gè)列表,列表里包含了所有符合條件的結(jié)果,例如:
def test(): content = 'Alex is a 7 years old boy.Bob is a 12 years old boy...' result = re.findall(r'(\d+) years old', content) print(result) result = ['7', '12']
我們分歧在他認(rèn)為我應(yīng)該先用 re.complile 編譯好正則之后,再匹配,正如我在re.compile舉得例子. 你會(huì)說他說的沒錯(cuò)啊,作者不應(yīng)該順從同事這個(gè)合理的要求,不改就算了還要在這里發(fā)文BB.我想說的是 拋開劑量談毒性,都是耍流氓。對(duì)于數(shù)據(jù)來說拋開量級(jí)談性能差異,都是耍流氓. 如果要處理的 文本是百萬、千萬、億這個(gè)級(jí)別,我會(huì)做優(yōu)化,但是對(duì)于個(gè)別剛上萬的數(shù)據(jù)來說,我覺得沒必要,業(yè)務(wù)流程真的不缺那0.0X秒,多寫一行re.compile的時(shí)間遠(yuǎn)大于提示的時(shí)間了. 做好代碼的優(yōu)化很重要,特別是面對(duì)大量數(shù)據(jù)的時(shí)候,但是我們要想清楚,有時(shí)候并不是靠那幾行re.compile就能提高多大的性能,精簡(jiǎn)流程,合理的設(shè)計(jì)模式才是重點(diǎn). 工作中還是要做好和同事的溝通,不要和我一樣,不然遲早會(huì)被別人唾棄.
根據(jù)下面評(píng)論的提示re.compile()那一行應(yīng)該放在迭代外面的代碼塊里,相比圖中的時(shí)間速度會(huì)有所提升.????.但是我們的業(yè)務(wù)邏輯是和上圖一樣的,而不是在迭代之外.
到此這篇關(guān)于Python 正則 re.compile 真的必需嗎的文章就介紹到這了,更多相關(guān)Python 正則 re.compile內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- 10分鐘教你用Python實(shí)現(xiàn)微信自動(dòng)回復(fù)功能
- python實(shí)現(xiàn)微信自動(dòng)回復(fù)功能
- python itchat實(shí)現(xiàn)微信自動(dòng)回復(fù)的示例代碼
- 利用python微信庫itchat實(shí)現(xiàn)微信自動(dòng)回復(fù)功能
- python實(shí)現(xiàn)微信小程序自動(dòng)回復(fù)
- python微信公眾號(hào)之關(guān)鍵詞自動(dòng)回復(fù)
- python實(shí)現(xiàn)微信機(jī)器人: 登錄微信、消息接收、自動(dòng)回復(fù)功能
- Python中re.compile函數(shù)的使用方法
- 關(guān)于Python中compile() 函數(shù)簡(jiǎn)單實(shí)用示例詳解
- Python正則表達(dá)式re.compile()和re.findall()詳解
- Python中請(qǐng)不要再用re.compile了
- python內(nèi)置函數(shù)compile(),complex()的使用
相關(guān)文章
深入了解Python中字符串格式化工具f-strings的使用
從Python?3.6版本開始,引入了一種新的字符串格式化機(jī)制,即f-strings,它強(qiáng)大且易于使用的字符串格式化方式,本文就來聊聊他的具體使用,希望對(duì)大家有所幫助2023-05-05python監(jiān)控nginx端口和進(jìn)程狀態(tài)
這篇文章主要為大家詳細(xì)介紹了python監(jiān)控nginx端口和進(jìn)程狀態(tài),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-09-09python 篩選數(shù)據(jù)集中列中value長度大于20的數(shù)據(jù)集方法
今天小編就為大家分享一篇python 篩選數(shù)據(jù)集中列中value長度大于20的數(shù)據(jù)集方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-06-06解決pytorch中的kl divergence計(jì)算問題
這篇文章主要介紹了解決pytorch中的kl divergence計(jì)算問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-05-05如何在Django項(xiàng)目中引入靜態(tài)文件
這篇文章主要介紹了如何在Django項(xiàng)目中引入靜態(tài)文件,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-07-07Matplotlib直方圖繪制中的參數(shù)bins和rwidth的實(shí)現(xiàn)
本文主要介紹了Matplotlib直方圖繪制中的參數(shù)bins和rwidth的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2022-02-02Python3 shelve對(duì)象持久存儲(chǔ)原理詳解
這篇文章主要介紹了Python3 shelve對(duì)象持久存儲(chǔ)原理詳解,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-03-03python使用threading.Condition交替打印兩個(gè)字符
這篇文章主要為大家詳細(xì)介紹了python使用threading.Condition交替打印兩個(gè)字符,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-05-05