解決preg_match匹配過多字符長度的限制的思路分析
更新時間:2012年09月14日 23:34:21 作者:
今天在寫采集程序的時候,使用到了preg_match,但是有幾個頁面始終采集不下來。反復(fù)看了N遍的正則,沒有發(fā)現(xiàn)有問題。于是開始懷疑preg_match是否對匹配的字符串有長度限制
但是官方的文檔里面沒有說明這一點。
于是開始測試:將要匹配的字串不斷縮短,直到縮為原來1/5的時候可以正常匹配了,所以更加確定了。
到google里一搜,終于找到了解決方案:在php.ini中加入(隨便放到哪里,我是直接放第一行的)
pcre.backtrack_limit=-1
再次使用preg_match函數(shù)測試一下,大概1300多行上萬個字符的字符串也能夠匹配了。
項目中,用preg_match正則提取目標(biāo)內(nèi)容,死活有問題,代碼測得死去活來。
后來發(fā)現(xiàn)“pcre.backtrack_limit ”的值默認(rèn)只設(shè)了100000。
解決辦法:ini_set(‘pcre.backtrack_limit', 999999999);
注:這個參數(shù)在php 5.2.0版本之后可用。
另外說說關(guān)于:pcre.recursion_limit
pcre.recursion_limit是PCRE的遞歸限制,這個項如果設(shè)很大的值,會消耗所有進程的可用堆棧,最后導(dǎo)致PHP崩潰。
也可以通過修改配置來限制:ini_set(‘pcre.recursion_limit', 99999);
實際項目應(yīng)用中,最好也對內(nèi)存進行限定設(shè)置:ini_set(‘memory_limit', '64M'); , 這樣就比較穩(wěn)妥妥嘎。
于是開始測試:將要匹配的字串不斷縮短,直到縮為原來1/5的時候可以正常匹配了,所以更加確定了。
到google里一搜,終于找到了解決方案:在php.ini中加入(隨便放到哪里,我是直接放第一行的)
pcre.backtrack_limit=-1
再次使用preg_match函數(shù)測試一下,大概1300多行上萬個字符的字符串也能夠匹配了。
項目中,用preg_match正則提取目標(biāo)內(nèi)容,死活有問題,代碼測得死去活來。
后來發(fā)現(xiàn)“pcre.backtrack_limit ”的值默認(rèn)只設(shè)了100000。
解決辦法:ini_set(‘pcre.backtrack_limit', 999999999);
注:這個參數(shù)在php 5.2.0版本之后可用。
另外說說關(guān)于:pcre.recursion_limit
pcre.recursion_limit是PCRE的遞歸限制,這個項如果設(shè)很大的值,會消耗所有進程的可用堆棧,最后導(dǎo)致PHP崩潰。
也可以通過修改配置來限制:ini_set(‘pcre.recursion_limit', 99999);
實際項目應(yīng)用中,最好也對內(nèi)存進行限定設(shè)置:ini_set(‘memory_limit', '64M'); , 這樣就比較穩(wěn)妥妥嘎。
相關(guān)文章
javascript RegExp multiline多行匹配影響的^$
javascript RegExp multiline多行匹配影響的^$,代碼中有詳細(xì)的注釋,方法大家學(xué)習(xí)。2010-03-03正則表達(dá)式匹配(URL、電話、手機、郵箱)的實例代碼
本文通過實例代碼給大家介紹了正則表達(dá)式匹配(URL、電話、手機、郵箱)的方法,非常不錯,具有參考借鑒價值,需要的的朋友參考下吧2017-08-08