正則 捕獲組(capture group)
捕獲組有兩種形式
一種是普通的捕獲組,不產(chǎn)生歧義的情況下,后面簡稱捕獲組,語法規(guī)則:(expression);
另一種是命名捕獲組,語法規(guī)則:(?<name>expression)或者(?'name'expression),這兩種寫法是等價的。
1、編號規(guī)則
如果沒有顯式為捕獲組命名,即沒有使用命名捕獲組,那么需要按數(shù)字順序來訪問所有捕獲組
在只有普通捕獲組的情況下,捕獲組的編號是按照“(”出現(xiàn)的順序,從左到右編號的
(\d{4})-(\d{2}-(\d\d))
1 1 2 3 3 2
上面的正則表達(dá)式可以用來匹配格式為yyyy-MM-dd的日期,為了在下表中得以區(qū)分,采用了\d{2}和\d\d兩種寫法
還有一個默認(rèn)編號為0的組,表示的是正則表達(dá)式的整體
用以上正則表達(dá)式匹配字符串:2008-12-31
匹配結(jié)果為:
編號 | 命名 | 捕獲組 | 匹配內(nèi)容 |
0 | (\d{4})-(\d{2}-(\d\d)) | 2008-12-31 | |
1 | (\d{4}) | 2008 | |
2 | (\d{2}-(\d\d)) | 12-31 | |
3 | (\d\d) | 31 |
如果對組進(jìn)行了顯式命名,即命名捕獲組,那么捕獲的內(nèi)容可以通過組名稱來引用
但是如果正則表達(dá)式中既使用了普通捕獲組,也使用了命名捕獲組,那么捕獲組的編號就要特別注意,編號的規(guī)則是先對普通捕獲組進(jìn)行編號,再對命名捕獲組進(jìn)行編號
(\d{4})-(?<date>\d{2}-(\d\d))
1 1 3 2 23
用以上正則表達(dá)式匹配字符串:2008-12-31
匹配結(jié)果為:
編號 | 命名 | 捕獲組 | 匹配內(nèi)容 |
0 | (\d{4})-(\d{2}-(\d\d)) | 2008-12-31 | |
1 | (\d{4}) | 2008 | |
2 | (\d\d) | 31 | |
3 | date | (?<date>\d{2}-(\d\d)) | 12-31 |
2、捕獲組的引用
對捕獲組的引用一般有以下幾種
a) 正則表達(dá)式中,對前面捕獲組捕獲的內(nèi)容進(jìn)行引用,稱為反向引用
b) 正則表達(dá)式中,(?(表達(dá)式)true|false)的條件表達(dá)式
c) 在程序中,對捕獲組捕獲內(nèi)容的引用
反向引用
對于普通捕獲組的引用,語法規(guī)則為:\k<num>,通常簡寫為\num,其中num是十進(jìn)制的數(shù)字,即捕獲組的編號
對于命名捕獲組的引用,語法規(guī)則為:\k<name>或者\k'name'
相關(guān)文章
一文搞懂正則表達(dá)式基礎(chǔ)語法以及如何應(yīng)用
正則表達(dá)式是一種描述字符串結(jié)構(gòu)的語法規(guī)則,是用于匹配字符串中字符組合的模式,同時正則表達(dá)式也是對象,下面這篇文章主要給大家介紹了關(guān)于如何通過一文搞懂正則表達(dá)式基礎(chǔ)語法以及如何應(yīng)用的相關(guān)資料,需要的朋友可以參考下2022-09-09