淺談PHP正則中的捕獲組與非捕獲組
今天遇到一個正則匹配的問題,忽然翻到有捕獲組的概念,手冊上也是一略而過,百度時無意翻到C#和Java中有對正則捕獲組的特殊用法,搜索關(guān)鍵詞有PHP時竟然沒有相關(guān)內(nèi)容,自己試了一下,發(fā)現(xiàn)在PHP中也是可行的,于是總結(jié)一下,分享的同時也希望有大神和細心的學(xué)習(xí)者找到我理解中出現(xiàn)的問題。
什么是捕獲組
我們先看一下PHP的正則匹配函數(shù)
int preg_match ( string $pattern , string $subject [, array &$matches [, int $flags = 0 [, int $offset = 0 ]]] )
前面兩項是我們常用的,$pattern是正則匹配模式,$string是要匹配的字符串。
array &$match,它是一個數(shù)組,&表示匹配出來的結(jié)果會被寫入$match中。
int $flags 如果傳遞了這個標記, 對于每一個出現(xiàn)的匹配返回時會附加字符串偏移量(相對于目標字符串的)。
int $offset 用于指定從目標字符串的某個未知開始搜索(單位是字節(jié))。
我們主要看一下$match的值里會有什么:
$mode = '/a=(\d+)b=(\d+)c=(\d+)/'; $str='**a=4b=98c=56**'; $res=preg_match($mode,$str,$match); var_dump($match);
結(jié)果如下:
array (size=4) => string 'a=4b=98c=56' (length=11) => string '4' (length=1) => string '98' (length=2) => string '56' (length=2)
現(xiàn)在我們知道了什么是捕獲組,捕獲組是正則表達示中以()括起來的部分,每一對()是一個捕獲組。
PHP會為它編號,從1開始。至于為什么會從1開始,那是因為PHP把匹配到的完整字符串編號為0。
如果有多個括號或嵌套括號,按左邊括號出現(xiàn)的順序來進行編號,如圖:
按圖中的匹配模式匹配時,捕獲組的123號分別是紅綠藍。
捕獲組的忽略與命名
我們還可以阻止PHP為匹配組的編號:在匹配組中模式前加 ?:
$mode = '/a=(\d+)b=(?:\d+)c=(\d+)/';
這樣,匹配結(jié)果就會變成:
array (size=3) => string 'a=4b=98c=56' (length=11) => string '4' (length=1) => string '56' (length=2)
當(dāng)然,我們也可以在括號的內(nèi)部為它給它獨特的名字。
命名子組可以接受(?<name>), (?'name') 以及(?P<name>)語法. 之前版本僅接受(?P<name>)語法.
例如:$mode = '/a=(\d+)b=(?P<sec>\d+)c=(\d+)/';
使用時結(jié)果為:
array (size=5) => string 'a=4b=98c=56' (length=11) => string '4' (length=1) 'sec' => string '98' (length=2) => string '98' (length=2) => string '56' (length=2)
在保留索引數(shù)組的同時,加上一個關(guān)聯(lián)項,key值為捕獲組名。
捕獲組的反向引用
我們在用preg_replace()函數(shù)進行正則替換時,我們還可以使用 \n 或 $n 來引用第n個捕獲組.
$mode = '/a=(\d+)b=(\d+)c=(\d+)/'; $str='**a=4b=98c=56**'; $rp='\1/$2/\3/'; echo preg_replace($mode,$rp,$str);//**4/98/56/**
\1表示捕獲組1(4),$2為捕獲組2(98),\3為捕獲組3(56)。
非捕獲組的用法:
為什么稱為非捕獲組呢?那是因為它們有捕獲組的特性,在匹配模式的()中,但是匹配時,PHP不會為它們編組,它們只會影響匹配結(jié)果,并不作為結(jié)果輸出。
/d(?=xxx) 匹配"后面是xxx的一個數(shù)字"。
注意格式:只能放在匹配模式字符串之后!
例如:
$pattern='/\d(?=abc)/'; $str="ab36abc8eg"; $res=preg_match($pattern,$str,$match); var_dump($match);//6
匹配的6,因為只有它作為一個數(shù)字,后面還有abc。
(?<=xxx) /d 匹配"前面是xxx的一個數(shù)字"
注意格式:只能放在匹配模式字符串之前!
例如:
$pattern='/(?<=abc)\d/'; $str="ab36abc8eg"; $res=preg_match($pattern,$str,$match); var_dump($match);//8
匹配的8,因為只有它作為一個數(shù)字,后面還有abc。
與(?=xxx) (?<=xxx)相對的是(?!=xxx) (?<!=xxx) 它們在=前加了非運算符 “!”
它表示前面/后面不是xxx的字符串,這里就不再舉例了。
以上這篇淺談PHP正則中的捕獲組與非捕獲組就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
ThinkPHP 框架實現(xiàn)的讀取excel導(dǎo)入數(shù)據(jù)庫操作示例
這篇文章主要介紹了ThinkPHP 框架實現(xiàn)的讀取excel導(dǎo)入數(shù)據(jù)庫操作,結(jié)合實例形式分析了thinkPHP針對Excel文件的讀取、解析以及數(shù)據(jù)庫的寫入相關(guān)操作技巧,需要的朋友可以參考下2020-04-04PHP通過微信跳轉(zhuǎn)的Code參數(shù)獲取用戶的openid(關(guān)鍵代碼)
這篇文章主要介紹了PHP通過微信跳轉(zhuǎn)的Code參數(shù)獲取用戶的openid(關(guān)鍵代碼)的相關(guān)資料,非常不錯,具有參考借鑒價值,需要的朋友可以參考下2016-07-07php筆記之:php數(shù)組相關(guān)函數(shù)的使用
本篇文章介紹了,php中數(shù)組相關(guān)函數(shù)的使用。需要的朋友參考下2013-04-04發(fā)布一個用PHP fsockopen寫的HTTP下載的類
發(fā)布一個用PHP fsockopen寫的HTTP下載的類...2007-02-02Laravel6.18.19如何優(yōu)雅的切換發(fā)件賬戶
這篇文章主要給大家介紹了關(guān)于Laravel6.18.19如何優(yōu)雅的切換發(fā)件賬戶的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家學(xué)習(xí)或者使用Laravel6.18.19具有一定的參考學(xué)習(xí)價值,需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧2020-06-06