解決preg_match匹配過(guò)多字符長(zhǎng)度的限制的思路分析
更新時(shí)間:2012年09月14日 23:34:21 作者:
今天在寫采集程序的時(shí)候,使用到了preg_match,但是有幾個(gè)頁(yè)面始終采集不下來(lái)。反復(fù)看了N遍的正則,沒(méi)有發(fā)現(xiàn)有問(wèn)題。于是開始懷疑preg_match是否對(duì)匹配的字符串有長(zhǎng)度限制
但是官方的文檔里面沒(méi)有說(shuō)明這一點(diǎn)。
于是開始測(cè)試:將要匹配的字串不斷縮短,直到縮為原來(lái)1/5的時(shí)候可以正常匹配了,所以更加確定了。
到google里一搜,終于找到了解決方案:在php.ini中加入(隨便放到哪里,我是直接放第一行的)
pcre.backtrack_limit=-1
再次使用preg_match函數(shù)測(cè)試一下,大概1300多行上萬(wàn)個(gè)字符的字符串也能夠匹配了。
項(xiàng)目中,用preg_match正則提取目標(biāo)內(nèi)容,死活有問(wèn)題,代碼測(cè)得死去活來(lái)。
后來(lái)發(fā)現(xiàn)“pcre.backtrack_limit ”的值默認(rèn)只設(shè)了100000。
解決辦法:ini_set(‘pcre.backtrack_limit', 999999999);
注:這個(gè)參數(shù)在php 5.2.0版本之后可用。
另外說(shuō)說(shuō)關(guān)于:pcre.recursion_limit
pcre.recursion_limit是PCRE的遞歸限制,這個(gè)項(xiàng)如果設(shè)很大的值,會(huì)消耗所有進(jìn)程的可用堆棧,最后導(dǎo)致PHP崩潰。
也可以通過(guò)修改配置來(lái)限制:ini_set(‘pcre.recursion_limit', 99999);
實(shí)際項(xiàng)目應(yīng)用中,最好也對(duì)內(nèi)存進(jìn)行限定設(shè)置:ini_set(‘memory_limit', '64M'); , 這樣就比較穩(wěn)妥妥嘎。
于是開始測(cè)試:將要匹配的字串不斷縮短,直到縮為原來(lái)1/5的時(shí)候可以正常匹配了,所以更加確定了。
到google里一搜,終于找到了解決方案:在php.ini中加入(隨便放到哪里,我是直接放第一行的)
pcre.backtrack_limit=-1
再次使用preg_match函數(shù)測(cè)試一下,大概1300多行上萬(wàn)個(gè)字符的字符串也能夠匹配了。
項(xiàng)目中,用preg_match正則提取目標(biāo)內(nèi)容,死活有問(wèn)題,代碼測(cè)得死去活來(lái)。
后來(lái)發(fā)現(xiàn)“pcre.backtrack_limit ”的值默認(rèn)只設(shè)了100000。
解決辦法:ini_set(‘pcre.backtrack_limit', 999999999);
注:這個(gè)參數(shù)在php 5.2.0版本之后可用。
另外說(shuō)說(shuō)關(guān)于:pcre.recursion_limit
pcre.recursion_limit是PCRE的遞歸限制,這個(gè)項(xiàng)如果設(shè)很大的值,會(huì)消耗所有進(jìn)程的可用堆棧,最后導(dǎo)致PHP崩潰。
也可以通過(guò)修改配置來(lái)限制:ini_set(‘pcre.recursion_limit', 99999);
實(shí)際項(xiàng)目應(yīng)用中,最好也對(duì)內(nèi)存進(jìn)行限定設(shè)置:ini_set(‘memory_limit', '64M'); , 這樣就比較穩(wěn)妥妥嘎。
相關(guān)文章
javascript RegExp multiline多行匹配影響的^$
javascript RegExp multiline多行匹配影響的^$,代碼中有詳細(xì)的注釋,方法大家學(xué)習(xí)。2010-03-03正則表達(dá)式匹配(URL、電話、手機(jī)、郵箱)的實(shí)例代碼
本文通過(guò)實(shí)例代碼給大家介紹了正則表達(dá)式匹配(URL、電話、手機(jī)、郵箱)的方法,非常不錯(cuò),具有參考借鑒價(jià)值,需要的的朋友參考下吧2017-08-08