欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

正則表達(dá)式性能優(yōu)化方法(高效正則表達(dá)式書寫)

 更新時(shí)間:2016年06月05日 01:08:59   投稿:mdxy-dxy  
這里說的正則表達(dá)式優(yōu)化,主要是針對(duì)目前常用的NFA模式正則表達(dá)式

這里說的正則表達(dá)式優(yōu)化,主要是針對(duì)目前常用的NFA模式正則表達(dá)式,詳細(xì)可以參考:正則表達(dá)式匹配解析過程探討分析(正則表達(dá)式匹配原理)。從上面例子,我們可以推斷出,影響NFA類正則表達(dá)式(常見語言:GNU Emacs,Java,ergp,less,more,.NET語言,
PCRE library,Perl,PHP,Python,Ruby,sed,vi )其實(shí)主要是它的“回溯”,減少“回溯”次數(shù)(減少循環(huán)查找同一個(gè)字符次數(shù)),是提高性能的主要方法。 我們來看個(gè)例子:

源字符串:<script type="text/javascript">adsfadfsdasfsdafdsfsadfsa</script>

匹配要求,匹配<script….>….</script>標(biāo)簽里面所有內(nèi)容,包括改標(biāo)簽

常見寫法(1),因?yàn)?lt;script后面可能出現(xiàn)字符、空白、特殊符號(hào)等,還有標(biāo)簽里面也可能出現(xiàn)各種js代碼。我們簡(jiǎn)單方法是:

正則表達(dá)式:<script.*?>.*?</script> (測(cè)試工具使用了:regexBuddy)

總共花費(fèi)115步,回溯了:48次。 因?yàn)槲覀兪褂谩?”字符,匹配默認(rèn)情況下除了\n之外所有字符。
方法(2),我們分析特點(diǎn)發(fā)現(xiàn),<script…>后面,應(yīng)該是除了”>”之外都可以字符,然后一對(duì)<script>標(biāo)簽里面js內(nèi)容??梢远x為除了”<”之外。(這里面我只是舉例說明優(yōu)化方法,實(shí)際網(wǎng)頁中script標(biāo)簽里面,常見都會(huì)出現(xiàn)有”<”字符了)

正則表達(dá)式:<script[^?>]+>[^<]+</script>

19步,0次回溯! ,步驟只有原先的15%左右,性能幾倍的提升了!
從上面我們看到,不同正則表達(dá)式,對(duì)通用字符配平,性能相差會(huì)很大。減少“回溯”是最好的方法,減少回溯其中最主要的方法是:”用最小范圍的元字符,盡量避免用過大的元字符!”。一般規(guī)律如下:

1、使用正確的邊界匹配器(^、$、\b、\B等),限定搜索字符串位置
2、使用具體的元字符、字符類(\d、\w、\s等) ,少用”.”字符
3、使用正確的量詞(+、*、?、{n,m}),如果能夠限定長(zhǎng)度,匹配最佳
4、使用非捕獲組、原子組,減少?zèng)]有必要的字匹配捕獲用(?:)

如:我想匹配一些英文字母,它后面接的是數(shù)字。如:abc1234,我可以寫 “\w+\d+”,也可以寫”[a-zA-Z]+\d+” ,其中第一個(gè)\w+會(huì)先匹配所有abc1234,然后回溯,匹配滿足\d+格式。一共4步,而后面這個(gè)只需要2步,步驟減少一半了!好了,今天就先到這里,歡迎大家討論、交流!

相關(guān)文章

  • PHP中的遞歸正則表達(dá)式用法分享

    PHP中的遞歸正則表達(dá)式用法分享

    其實(shí)很多語言中的正則表達(dá)式都是支持遞歸的, 本文主要介紹PHP的正則遞歸. 雖然, 工作中最常用的正則表達(dá)式都很普通, 只用最基本的語法就能解決85%以上的問題, 而且合理有效地使用普通正則來解決復(fù)雜問題也是一門技巧與學(xué)問,但是更高級(jí)一點(diǎn)的語法的確有它存在的價(jià)值,看下面具體介紹
    2012-09-09
  • 論壇UBB代碼 推薦

    論壇UBB代碼 推薦

    論壇UBB代碼 推薦...
    2006-07-07
  • Regex正則表達(dá)式判斷密碼強(qiáng)度

    Regex正則表達(dá)式判斷密碼強(qiáng)度

    這里用到Regex表達(dá)式,雖然還是經(jīng)常使用,但是對(duì)其語法還是一知半解。主要一般用到都比較簡(jiǎn)單,不需要多重判斷,這篇文章主要介紹了Regex正則表達(dá)式判斷密碼強(qiáng)度,需要的朋友可以參考下
    2023-02-02
  • PHP正則表達(dá)式完全教程之提高篇

    PHP正則表達(dá)式完全教程之提高篇

    正則表達(dá)式,大家在開發(fā)中應(yīng)該是經(jīng)常用到,現(xiàn)在很多開發(fā)語言都有正則表達(dá)式的應(yīng)用,比如javascript,java,.net,php等等,我今天就把我對(duì)正則表達(dá)式的理解跟大家嘮嘮,不當(dāng)之處,請(qǐng)多多指教!
    2015-09-09
  • 利用正則表達(dá)對(duì)IP進(jìn)行排序的實(shí)現(xiàn)代碼

    利用正則表達(dá)對(duì)IP進(jìn)行排序的實(shí)現(xiàn)代碼

    這篇文章主要介紹了利用正則表達(dá)對(duì)IP進(jìn)行排序的實(shí)現(xiàn)代碼,需要的朋友可以參考下
    2017-07-07
  • 正則表達(dá)式如何在PHP里靈活的應(yīng)用

    正則表達(dá)式如何在PHP里靈活的應(yīng)用

    正則表達(dá)式也稱為模式表達(dá)式,自身具有一套非常完整的、可以編寫模式的語法體系,提供了一種靈活且直觀的字符串處理方法,本文給大家介紹正則表達(dá)式如何在PHP里巧妙的應(yīng)用,需要的朋友參考下吧
    2016-03-03
  • linux shell 正則表達(dá)式(BREs,EREs,PREs)差異比較

    linux shell 正則表達(dá)式(BREs,EREs,PREs)差異比較

    在計(jì)算機(jī)科學(xué)中,是指一個(gè)用來描述或者匹配一系列符合某個(gè)句法規(guī)則的字符串的單個(gè)字符串。在很多文本編輯器或其他工具里,正則表達(dá)式通常被用來檢索和/或替換那些符合某個(gè)模式的文本內(nèi)容
    2013-11-11
  • Python正則表達(dá)式匹配字符串中的數(shù)字

    Python正則表達(dá)式匹配字符串中的數(shù)字

    這篇文章主要介紹了Python正則表達(dá)式匹配字符串中的數(shù)字,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-01-01
  • php正則替換變量指定字符的方法

    php正則替換變量指定字符的方法

    這篇文章主要介紹了php正則替換變量指定字符的方法,涉及php使用正則表達(dá)式進(jìn)行字符串替換的技巧,非常具有實(shí)用價(jià)值,需要的朋友可以參考下
    2015-03-03
  • JS正則表達(dá)式的驗(yàn)證

    JS正則表達(dá)式的驗(yàn)證

    這篇文章主要介紹了JS正則表達(dá)式的驗(yàn)證的相關(guān)資料,非常不錯(cuò),具有參考借鑒價(jià)值,需要的朋友可以參考下
    2016-11-11

最新評(píng)論