php正則表達(dá)式中貪婪與非貪婪介紹
一、貪婪與非貪婪
什么叫貪婪,比如說(shuō)要從字符串中<td>面包一</td><td>面包二</td>吃面包,本來(lái)你只可以吃面包一,可是你貪心,于是就把第一個(gè)<td>到最后一個(gè)</td>里面的兩個(gè)面包取出來(lái)了,你想多吃點(diǎn),非貪婪也就是你不貪吃了,就只吃面包一。
我們來(lái)看看正則里面是怎么貪婪的
<?php $str = '<td>面包一</td><td>面包二</td>'; preg_match('/<td>(.*)<\/td>/',$str,$res); print_r($res);
結(jié)果:
Array
(
[0] => <td>面包一</td><td>面包二</td>
[1] => 面包一</td><td>面包二
)
0記錄的是整個(gè)字符,1表示的是第一次匹配。
怎么來(lái)限制貪婪?
<?php $str = '<td>面包一</td><td>面包二</td>'; preg_match('/<td>(.*?)<\/td>/',$str,$res); print_r($res); Array ( [0] => <td>面包一</td> [1] => 面包一 )
在修飾匹配次數(shù)的特殊符號(hào)后再加上一個(gè) "?" 號(hào),則可以使匹配次數(shù)不定的表達(dá)式盡可能少的匹配。
在PHP中還可以通過(guò)修飾符來(lái)實(shí)現(xiàn),
<?php $str = '<td>面包一</td><td>面包二</td>'; preg_match('/<td>(.*)<\/td>/U',$str,$res); print_r($res);
結(jié)果和上面一樣。這就是修飾符U的作用
二、預(yù)搜索
預(yù)搜索是一個(gè)非獲取匹配,不進(jìn)行存儲(chǔ)供以后使用。
1、正向預(yù)搜索 "(?=xxxxx)","(?!xxxxx)"
"(?=xxxxx)”:所在縫隙的右側(cè),必須能夠匹配上 xxxxx 這部分的表達(dá)式,
<?php $str = 'windows NT windows 2003 windows xp'; preg_match('/windows (?=xp)/',$str,$res); print_r($res);
結(jié)果:
Array
(
[0] => windows
)
這個(gè)是xp前面的windows,不會(huì)取NT和2003前面的。
格式:"(?!xxxxx)",所在縫隙的右側(cè),必須不能匹配 xxxxx 這部分表達(dá)式
<?php $str = 'windows NT windows 2003 windows xp'; preg_match_all('/windows (?!xp)/',$str,$res); print_r($res);
結(jié)果:
Array
(
[0] => Array
(
[0] => windows 這個(gè)是nt前面的
[1] => windows 這個(gè)是2003前面的
)
)
從這里可以看出,預(yù)搜索不進(jìn)行存儲(chǔ)供以后使用。
與會(huì)存儲(chǔ)的對(duì)比下。
<?php $str = 'windows NT windows 2003 windows xp'; preg_match_all('/windows ([^xp])/',$str,$res); print_r($res);
結(jié)果:
Array
(
[0] => Array 全部模式匹配的數(shù)組
(
[0] => windows N
[1] => windows 2
)
[1] => Array 子模式所匹配的字符串組成的數(shù)組,通過(guò)存儲(chǔ)取得。
(
[0] => N
[1] => 2
)
)
2、反向預(yù)搜索 "(?<=xxxxx)","(?<!xxxxx)"
"(?<=xxxxx)" :所在縫隙的 "左側(cè)”能夠匹配xxxxx部分。
<?php $str = '1234567890123456'; preg_match('/(?<=\d{4})\d+(?=\d{4})/',$str,$res); print_r($res);
結(jié)果:
Array
(
[0] => 56789012
)
匹配除了前4個(gè)數(shù)字和后4個(gè)數(shù)字之外的中間8個(gè)數(shù)字
"(?<!xxxxx)":所在縫隙的“左側(cè)”不能匹配xxxx部分。
<?php $str = '我1234567890123456'; preg_match('/(?<!我)\d+/',$str,$res); print_r($res);
結(jié)果:
Array
(
[0] => 234567890123456
)
三、preg和ereg的區(qū)別
PHP同時(shí)使用兩套正則表達(dá)式規(guī)則,一套是由電氣和電子工程師協(xié)會(huì)(IEEE)制定的POSIX Extended 1003.2兼容正則(事實(shí)上PHP對(duì)此標(biāo)準(zhǔn)的支持并不完善),另一套來(lái)自PCRE(Perl Compatible Regular Expression)庫(kù)提供PERL兼容正則。 PHP5.3開始POSIX被刪除了。
preg_match 比 ereg效率高。
- php使用正則表達(dá)式獲取字符串中的URL
- Ajax和PHP正則表達(dá)式驗(yàn)證表單及驗(yàn)證碼
- PHP正則表達(dá)式抓取某個(gè)標(biāo)簽的特定屬性值的方法
- PHP正則表達(dá)式入門教程(推薦)
- PHP正則表達(dá)式過(guò)濾html標(biāo)簽屬性(DEMO)
- php正則表達(dá)式驗(yàn)證(郵件地址、Url地址、電話號(hào)碼、郵政編碼)
- 非常重要的php正則表達(dá)式詳解
- php獲取超鏈接文本內(nèi)容的正則表達(dá)式(五種方法)
- php正則表達(dá)式完全教程之精華篇
- 史上最全的PHP正則表達(dá)式(手機(jī)號(hào)需要加上177-***)
相關(guān)文章
EditPlus中的正則表達(dá)式實(shí)戰(zhàn)(5)
這篇文章主要介紹了EditPlus中的正則表達(dá)式實(shí)戰(zhàn)(5)的相關(guān)資料,非常不錯(cuò),具有參考借鑒價(jià)值,需要的朋友可以參考下2016-12-12Python 實(shí)用技巧之正則表達(dá)式查找和替換文本的操作方法
這篇文章主要介紹了Python 實(shí)用技巧之正則表達(dá)式查找和替換文本的操作方法,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-08-08php中正則替換函數(shù)ereg_replace用法實(shí)例
這篇文章主要介紹了php中正則替換函數(shù)ereg_replace用法,以實(shí)例形式分析了ereg_replace函數(shù)進(jìn)行正則替換時(shí)的用法,非常具有實(shí)用價(jià)值,需要的朋友可以參考下2014-12-12正則表達(dá)式學(xué)習(xí)經(jīng)驗(yàn)分析
正則表達(dá)式用來(lái)指定字符串模式。當(dāng)你需要定位匹配某種模式的字符串時(shí)就可以使用正則表達(dá)式。例如,我們下面的一個(gè)例程就是在一個(gè)HTML文件中通過(guò)查找字符串模式<a href="...">來(lái)定位所有的超鏈接。2008-05-05Java/Js下使用正則表達(dá)式匹配嵌套Html標(biāo)簽
以前寫過(guò)一篇文章講解如何使用正則表達(dá)式完美解決Html嵌套標(biāo)簽的匹配問題(使用正則表達(dá)式匹配嵌套Html標(biāo)簽),但是里頭用到了平衡組這樣的高級(jí)特性,貌似只有DotNet還有Perl正則引擎支持,因此通用性不高。2010-08-08