PHP正則表達(dá)式之捕獲組與非捕獲組
今天遇到一個正則匹配的問題,忽然翻到有捕獲組的概念,手冊上也是一略而過,百度時無意翻到C#和Java中有對正則捕獲組的特殊用法,搜索關(guān)鍵詞有PHP時竟然沒有相關(guān)內(nèi)容,自己試了一下,發(fā)現(xiàn)在PHP中也是可行的,于是總結(jié)一下,分享的同時也希望有大神和細(xì)心的學(xué)習(xí)者找到我理解中出現(xiàn)的問題。
什么是捕獲組
捕獲組語法:
字符 |
描述 |
示例 |
(pattern) |
匹配pattern并捕獲結(jié)果,自動設(shè)置組號。 |
(abc)+d 匹配abcd或者abcabcd |
(?<name>pattern) 或 (?'name'pattern) |
匹配pattern并捕獲結(jié)果,設(shè)置name為組名。 |
|
\num |
對捕獲組的反向引用。其中 num 是一個正整數(shù)。 |
(\w)(\w)\2\1 匹配abba |
\k< name > 或 \k' name ' |
對命名捕獲組的反向引用。其中 name 是捕獲組名。 |
(?<group>\w)abc\k<group> 匹配xabcx |
我們先看一下PHP的正則匹配函數(shù)
int preg_match ( string $pattern , string $subject [, array &$matches [, int $flags = 0 [, int $offset = 0 ]]] )
前面兩項(xiàng)是我們常用的,$pattern是正則匹配模式,$string是要匹配的字符串。
array &$match,它是一個數(shù)組,&表示匹配出來的結(jié)果會被寫入$match中。
int $flags 如果傳遞了這個標(biāo)記, 對于每一個出現(xiàn)的匹配返回時會附加字符串偏移量(相對于目標(biāo)字符串的)。
int $offset 用于指定從目標(biāo)字符串的某個未知開始搜索(單位是字節(jié))。
我們主要看一下$match的值里會有什么:
$mode = '/a=(\d+)b=(\d+)c=(\d+)/'; $str='**a=4b=98c=56**'; $res=preg_match($mode,$str,$match); var_dump($match);
結(jié)果如下:
array (size=4)
0 => string 'a=4b=98c=56' (length=11)
1 => string '4' (length=1)
2 => string '98' (length=2)
3 => string '56' (length=2)
現(xiàn)在我們知道了什么是捕獲組,捕獲組是正則表達(dá)示中以()括起來的部分,每一對()是一個捕獲組。
PHP會為它編號,從1開始。至于為什么會從1開始,那是因?yàn)镻HP把匹配到的完整字符串編號為0。
如果有多個括號或嵌套括號,按左邊括號出現(xiàn)的順序來進(jìn)行編號,如圖:
按圖中的匹配模式匹配時,捕獲組的123號分別是紅綠藍(lán)。
捕獲組的忽略與命名
我們還可以阻止PHP為匹配組的編號:在匹配組中模式前加 ?:
$mode = '/a=(\d+)b=(?:\d+)c=(\d+)/';
這樣,匹配結(jié)果就會變成:
array (size=3) 0 => string 'a=4b=98c=56' (length=11) 1 => string '4' (length=1) 2 => string '56' (length=2)
當(dāng)然,我們也可以在括號的內(nèi)部為它給它獨(dú)特的名字。
命名子組可以接受(?<name>), (?'name') 以及(?P<name>)語法. 之前版本僅接受(?P<name>)語法.
例如:$mode = '/a=(\d+)b=(?P<sec>\d+)c=(\d+)/';
使用時結(jié)果為:
array (size=5) 0 => string 'a=4b=98c=56' (length=11) 1 => string '4' (length=1) 'sec' => string '98' (length=2) 2 => string '98' (length=2) 3 => string '56' (length=2)
在保留索引數(shù)組的同時,加上一個關(guān)聯(lián)項(xiàng),key值為捕獲組名。
捕獲組的反向引用
我們在用preg_replace()函數(shù)進(jìn)行正則替換時,我們還可以使用 \n 或 $n 來引用第n個捕獲組.
$mode = '/a=(\d+)b=(\d+)c=(\d+)/'; $str='**a=4b=98c=56**'; $rp='\1/$2/\3/'; echo preg_replace($mode,$rp,$str);//**4/98/56/**
\1表示捕獲組1(4),$2為捕獲組2(98),\3為捕獲組3(56)。
非捕獲組的用法:
非捕獲組語法:
字符 |
描述 |
示例 |
(?:pattern) |
匹配pattern,但不捕獲匹配結(jié)果。 |
'industr(?:y|ies) 匹配'industry'或'industries'。 |
(?=pattern) |
零寬度正向預(yù)查,不捕獲匹配結(jié)果。 |
'Windows (?=95|98|NT|2000)' 匹配 "Windows2000" 中的 "Windows" 不匹配 "Windows3.1" 中的 "Windows"。 |
(?!pattern) |
零寬度負(fù)向預(yù)查,不捕獲匹配結(jié)果。 |
'Windows (?!95|98|NT|2000)' 匹配 "Windows3.1" 中的 "Windows" 不匹配 "Windows2000" 中的 "Windows"。 |
(?<=pattern) |
零寬度正向回查,不捕獲匹配結(jié)果。 |
'2000 (?<=Office|Word|Excel)' 匹配 " Office2000" 中的 "2000" 不匹配 "Windows2000" 中的 "2000"。 |
(?<!pattern) |
零寬度負(fù)向回查,不捕獲匹配結(jié)果。 |
'2000 (?<!Office|Word|Excel)' 匹配 " Windows2000" 中的 "2000" 不匹配 " Office2000" 中的 "2000"。 |
為什么稱為非捕獲組呢?那是因?yàn)樗鼈冇胁东@組的特性,在匹配模式的()中,但是匹配時,PHP不會為它們編組,它們只會影響匹配結(jié)果,并不作為結(jié)果輸出。
/d(?=xxx) 匹配"后面是xxx的一個數(shù)字"。
注意格式:只能放在匹配模式字符串之后!
例如:
$pattern='/\d(?=abc)/'; $str="ab36abc8eg"; $res=preg_match($pattern,$str,$match); var_dump($match);//6
匹配的6,因?yàn)橹挥兴鳛橐粋€數(shù)字,后面還有abc。
(?<=xxx) /d 匹配"前面是xxx的一個數(shù)字"
注意格式:只能放在匹配模式字符串之前!
例如:
$pattern='/(?<=abc)\d/'; $str="ab36abc8eg"; $res=preg_match($pattern,$str,$match); var_dump($match);//8
匹配的8,因?yàn)橹挥兴鳛橐粋€數(shù)字,后面還有abc。
與(?=xxx) (?<=xxx)相對的是(?!=xxx) (?<!=xxx) 它們在=前加了非運(yùn)算符 “!”
它表示前面/后面不是xxx的字符串,這里就不再舉例了。
如果您覺得本博文對您有幫助,您可以推薦或關(guān)注我,如果您有什么問題,可以在下方留言討論,謝謝。
相關(guān)文章
TP5.0框架實(shí)現(xiàn)無限極回復(fù)功能的方法分析
這篇文章主要介紹了TP5.0框架實(shí)現(xiàn)無限極回復(fù)功能的方法,結(jié)合實(shí)例形式分析了thinkPHP5.0框架下無限極回復(fù)功能相關(guān)的數(shù)據(jù)庫、評論功能及界面布局實(shí)現(xiàn)方法,需要的朋友可以參考下2019-05-05詳解laravel passport OAuth2.0的4種模式
這篇文章主要介紹了laravel passport OAuth2.0的4種模式,本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價值,需要的朋友可以參考下2019-11-11PHP jQuery表單,帶驗(yàn)證具體實(shí)現(xiàn)方法
這篇文章主要介紹了PHP jQuery表單,帶驗(yàn)證具體實(shí)現(xiàn)方法,需要的朋友可以參考下2014-02-02PHP統(tǒng)計二維數(shù)組元素個數(shù)的方法
數(shù)據(jù)表里面的字段 content 存儲了一個以逗號分割的字符串,最大有20個數(shù),最大數(shù)字為40。比如3,24,33,40類似字樣的數(shù)字序列。其實(shí)就是一個保存了多項(xiàng)投票結(jié)果的字段啦。現(xiàn)在需要統(tǒng)計每個數(shù)字的個數(shù),也就是每個投票項(xiàng)有多少人投了,并排序2013-11-11Yii框架視圖、視圖布局、視圖數(shù)據(jù)塊操作示例
這篇文章主要介紹了Yii框架視圖、視圖布局、視圖數(shù)據(jù)塊操作,結(jié)合實(shí)例形式分析了Yii框架相關(guān)的視圖、布局、控制器及數(shù)據(jù)相關(guān)操作技巧,需要的朋友可以參考下2019-10-10