php正則表達(dá)式的模式修正符和逆向引用使用介紹
更新時(shí)間:2011年07月25日 21:55:03 作者:
php正則表達(dá)式的模式修正符和逆向引用使用介紹,需要的朋友可以參考下。
正則表達(dá)式的匹配先后順序:
1.模式單元
2.重復(fù)匹配 ? * + {}
3.邊界限定 ^ $ b B
4.模式選擇 |
模式修正符:
模式修正符是標(biāo)記在整個(gè)模式之外的.
i :模式中的字符將同時(shí)匹配大小寫字母.
m :字符串視為多行.
s :將字符串視為單行,換行符作為普通字符.
x :將模式中的空白忽略.
A :強(qiáng)制僅從目標(biāo)字符串的開頭開始匹配.
D :模式中的美元元字符僅匹配目標(biāo)字符串的結(jié)尾.
U :匹配最近的字符串.
PHP與正則表達(dá)式中的模式修正符
下面列出了當(dāng)前在 PCRE 中可能使用的修正符。括號中是這些修正符的內(nèi)部 PCRE 名。
i (PCRE_CASELESS)
如果設(shè)定此修正符,模式中的字符將同時(shí)匹配大小寫字母。
m (PCRE_MULTILINE)
默認(rèn)情況下,PCRE 將目標(biāo)字符串作為單一的一“行”字符所組成的(甚至其中包含有換行符也是如此)?!靶衅鹗肌痹址╚)僅僅匹配字符串的 起始,“行結(jié)束”元字符($)僅僅匹配字符串的結(jié)束,或者最后一個(gè)字符是換行符時(shí)其前面(除非設(shè)定了 D 修正符)。這和 Perl 是一樣的。
當(dāng)設(shè)定了此修正符,“行起始”和“行結(jié)束”除了匹配整個(gè)字符串開頭和結(jié)束外,還分別匹配其中的換行符的之后和之前。這和 Perl 的 /m 修正符是等效的。如果目標(biāo)字符串中沒有“\n”字符或者模式中沒有 ^ 或 $,則設(shè)定此修正符沒有任何效果。
s (PCRE_DOTALL)
如果設(shè)定了此修正符,模式中的圓點(diǎn)元字符(.)匹配所有的字符,包括換行符。沒有此設(shè)定的話,則不包括換行符。這和 Perl 的 /s 修正符是等效的。排除字符類例如 [^a] 總是匹配換行符的,無論是否設(shè)定了此修正符。
x (PCRE_EXTENDED)
如果設(shè)定了此修正符,模式中的空白字符除了被轉(zhuǎn)義的或在字符類中的以外完全被忽略,在未轉(zhuǎn)義的字符類之外的 # 以及下一個(gè)換行符之間的所有字符,包括兩頭,也都被忽略。這和 Perl 的 /x 修正符是等效的,使得可以在復(fù)雜的模式中加入注釋。然而注意,這僅適用于數(shù)據(jù)字符??瞻鬃址赡苡肋h(yuǎn)不會(huì)出現(xiàn)于模式中的特殊字符序列,例如引入條件子模式的序列 (?( 中間。
e
如果設(shè)定了此修正符,preg_replace() 在替換字符串中對逆向引用作正常的替換,將其作為 PHP 代碼求值,并用其結(jié)果來替換所搜索的字符串。
只有 preg_replace() 使用此修正符,其它 PCRE 函數(shù)將忽略之。
注: 本修正符在 PHP3 中不可用。
A (PCRE_ANCHORED)
如果設(shè)定了此修正符,模式被強(qiáng)制為“anchored”,即強(qiáng)制僅從目標(biāo)字符串的開頭開始匹配。此效果也可以通過適當(dāng)?shù)哪J奖旧韥韺?shí)現(xiàn)(在 Perl 中實(shí)現(xiàn)的唯一方法)。
D (PCRE_DOLLAR_ENDONLY)
如果設(shè)定了此修正符,模式中的美元元字符僅匹配目標(biāo)字符串的結(jié)尾。沒有此選項(xiàng)時(shí),如果最后一個(gè)字符是換行符的話,美元符號也會(huì)匹配此字符之前(但不會(huì)匹配任何其它換行符之前)。如果設(shè)定了 m 修正符則忽略此選項(xiàng)。Perl 中沒有與其等價(jià)的修正符。
S
當(dāng)一個(gè)模式將被使用若干次時(shí),為加速匹配起見值得先對其進(jìn)行分析。如果設(shè)定了此修正符則會(huì)進(jìn)行額外的分析。目前,分析一個(gè)模式僅對沒有單一固定起始字符的 non-anchored 模式有用。
U (PCRE_UNGREEDY)
本修正符反轉(zhuǎn)了匹配數(shù)量的值使其不是默認(rèn)的重復(fù),而變成在后面跟上“?”才變得重復(fù)。這和 Perl 不兼容。也可以通過在模式之中設(shè)定 (?U) 修正符來啟用此選項(xiàng)。
X (PCRE_EXTRA)
此修正符啟用了一個(gè) PCRE 中與 Perl 不兼容的額外功能。模式中的任何反斜線后面跟上一個(gè)沒有特殊意義的字母導(dǎo)致一個(gè)錯(cuò)誤,從而保留此組合以備將來擴(kuò)充。默認(rèn)情況下,和 Perl 一樣,一個(gè)反斜線后面跟一個(gè)沒有特殊意義的字母被當(dāng)成該字母本身。當(dāng)前沒有其它特性受此修正符控制。
u (PCRE_UTF8)
此修正符啟用了一個(gè) PCRE 中與 Perl 不兼容的額外功能。模式字符串被當(dāng)成 UTF-8。本修正符在 Unix 下自 PHP 4.1.0 起可用,在 win32 下自 PHP 4.2.3 起可用。
關(guān)于逆向引用
逆向引用和子模式是相關(guān)的。
/()/是用于子模式的定界符,匹配的子模式自動(dòng)分配編號1~9,這么說的因?yàn)閈\99會(huì)讓解釋器感到混亂。不過可以用/(?)/(另一種寫法/(?'word')/)來為子模式命名,用\\k(一定記得有個(gè)k)來進(jìn)行逆向引用,這樣一來就不會(huì)有編號數(shù)目的限制了(準(zhǔn)確的說最大限度是99,再大也似乎隱約沒有必要了)。
/(?:t1|t2|)/這個(gè)“?:”用于告訴解釋器不要為這個(gè)子模式分配自動(dòng)編號,因此就是“跳到”t2開始編號了。
/\b(?=ing\b)/這個(gè)的引用意思是匹配表達(dá)式前面的內(nèi)容 如果例子用于匹配I'm singing while you dancing 那得到的結(jié)果是 sing 和 danc,因?yàn)橛昧薥b這個(gè)單詞界定符。
/(?<=ing)/匹配ing后面的內(nèi)容。
1.模式單元
2.重復(fù)匹配 ? * + {}
3.邊界限定 ^ $ b B
4.模式選擇 |
模式修正符:
模式修正符是標(biāo)記在整個(gè)模式之外的.
i :模式中的字符將同時(shí)匹配大小寫字母.
m :字符串視為多行.
s :將字符串視為單行,換行符作為普通字符.
x :將模式中的空白忽略.
A :強(qiáng)制僅從目標(biāo)字符串的開頭開始匹配.
D :模式中的美元元字符僅匹配目標(biāo)字符串的結(jié)尾.
U :匹配最近的字符串.
PHP與正則表達(dá)式中的模式修正符
下面列出了當(dāng)前在 PCRE 中可能使用的修正符。括號中是這些修正符的內(nèi)部 PCRE 名。
i (PCRE_CASELESS)
如果設(shè)定此修正符,模式中的字符將同時(shí)匹配大小寫字母。
m (PCRE_MULTILINE)
默認(rèn)情況下,PCRE 將目標(biāo)字符串作為單一的一“行”字符所組成的(甚至其中包含有換行符也是如此)?!靶衅鹗肌痹址╚)僅僅匹配字符串的 起始,“行結(jié)束”元字符($)僅僅匹配字符串的結(jié)束,或者最后一個(gè)字符是換行符時(shí)其前面(除非設(shè)定了 D 修正符)。這和 Perl 是一樣的。
當(dāng)設(shè)定了此修正符,“行起始”和“行結(jié)束”除了匹配整個(gè)字符串開頭和結(jié)束外,還分別匹配其中的換行符的之后和之前。這和 Perl 的 /m 修正符是等效的。如果目標(biāo)字符串中沒有“\n”字符或者模式中沒有 ^ 或 $,則設(shè)定此修正符沒有任何效果。
s (PCRE_DOTALL)
如果設(shè)定了此修正符,模式中的圓點(diǎn)元字符(.)匹配所有的字符,包括換行符。沒有此設(shè)定的話,則不包括換行符。這和 Perl 的 /s 修正符是等效的。排除字符類例如 [^a] 總是匹配換行符的,無論是否設(shè)定了此修正符。
x (PCRE_EXTENDED)
如果設(shè)定了此修正符,模式中的空白字符除了被轉(zhuǎn)義的或在字符類中的以外完全被忽略,在未轉(zhuǎn)義的字符類之外的 # 以及下一個(gè)換行符之間的所有字符,包括兩頭,也都被忽略。這和 Perl 的 /x 修正符是等效的,使得可以在復(fù)雜的模式中加入注釋。然而注意,這僅適用于數(shù)據(jù)字符??瞻鬃址赡苡肋h(yuǎn)不會(huì)出現(xiàn)于模式中的特殊字符序列,例如引入條件子模式的序列 (?( 中間。
e
如果設(shè)定了此修正符,preg_replace() 在替換字符串中對逆向引用作正常的替換,將其作為 PHP 代碼求值,并用其結(jié)果來替換所搜索的字符串。
只有 preg_replace() 使用此修正符,其它 PCRE 函數(shù)將忽略之。
注: 本修正符在 PHP3 中不可用。
A (PCRE_ANCHORED)
如果設(shè)定了此修正符,模式被強(qiáng)制為“anchored”,即強(qiáng)制僅從目標(biāo)字符串的開頭開始匹配。此效果也可以通過適當(dāng)?shù)哪J奖旧韥韺?shí)現(xiàn)(在 Perl 中實(shí)現(xiàn)的唯一方法)。
D (PCRE_DOLLAR_ENDONLY)
如果設(shè)定了此修正符,模式中的美元元字符僅匹配目標(biāo)字符串的結(jié)尾。沒有此選項(xiàng)時(shí),如果最后一個(gè)字符是換行符的話,美元符號也會(huì)匹配此字符之前(但不會(huì)匹配任何其它換行符之前)。如果設(shè)定了 m 修正符則忽略此選項(xiàng)。Perl 中沒有與其等價(jià)的修正符。
S
當(dāng)一個(gè)模式將被使用若干次時(shí),為加速匹配起見值得先對其進(jìn)行分析。如果設(shè)定了此修正符則會(huì)進(jìn)行額外的分析。目前,分析一個(gè)模式僅對沒有單一固定起始字符的 non-anchored 模式有用。
U (PCRE_UNGREEDY)
本修正符反轉(zhuǎn)了匹配數(shù)量的值使其不是默認(rèn)的重復(fù),而變成在后面跟上“?”才變得重復(fù)。這和 Perl 不兼容。也可以通過在模式之中設(shè)定 (?U) 修正符來啟用此選項(xiàng)。
X (PCRE_EXTRA)
此修正符啟用了一個(gè) PCRE 中與 Perl 不兼容的額外功能。模式中的任何反斜線后面跟上一個(gè)沒有特殊意義的字母導(dǎo)致一個(gè)錯(cuò)誤,從而保留此組合以備將來擴(kuò)充。默認(rèn)情況下,和 Perl 一樣,一個(gè)反斜線后面跟一個(gè)沒有特殊意義的字母被當(dāng)成該字母本身。當(dāng)前沒有其它特性受此修正符控制。
u (PCRE_UTF8)
此修正符啟用了一個(gè) PCRE 中與 Perl 不兼容的額外功能。模式字符串被當(dāng)成 UTF-8。本修正符在 Unix 下自 PHP 4.1.0 起可用,在 win32 下自 PHP 4.2.3 起可用。
關(guān)于逆向引用
逆向引用和子模式是相關(guān)的。
/()/是用于子模式的定界符,匹配的子模式自動(dòng)分配編號1~9,這么說的因?yàn)閈\99會(huì)讓解釋器感到混亂。不過可以用/(?)/(另一種寫法/(?'word')/)來為子模式命名,用\\k(一定記得有個(gè)k)來進(jìn)行逆向引用,這樣一來就不會(huì)有編號數(shù)目的限制了(準(zhǔn)確的說最大限度是99,再大也似乎隱約沒有必要了)。
/(?:t1|t2|)/這個(gè)“?:”用于告訴解釋器不要為這個(gè)子模式分配自動(dòng)編號,因此就是“跳到”t2開始編號了。
/\b(?=ing\b)/這個(gè)的引用意思是匹配表達(dá)式前面的內(nèi)容 如果例子用于匹配I'm singing while you dancing 那得到的結(jié)果是 sing 和 danc,因?yàn)橛昧薥b這個(gè)單詞界定符。
/(?<=ing)/匹配ing后面的內(nèi)容。
您可能感興趣的文章:
- PHP 正則表達(dá)式效率 貪婪、非貪婪與回溯分析(推薦)
- 正則中的回溯定義與用法分析【JS與java實(shí)現(xiàn)】
- 編寫高質(zhì)量的js之正確理解正則表達(dá)式回溯
- 深度分析正則(pcre)最大回溯/遞歸限制
- 小議正則表達(dá)式效率 貪婪、非貪婪與回溯
- PHP正則表達(dá)式的效率 回溯與固化分組
- 正則表達(dá)式之回溯
- AS3 js正則表達(dá)式 反向引用(backreference)
- 詳解JavaScript正則表達(dá)式之分組匹配及反向引用
- PHP正則表達(dá)式的逆向引用與子模式分析
- JavaScript正則表達(dá)式之后向引用實(shí)例代碼
- VBS教程:正則表達(dá)式簡介 -后向引用
- 正則表達(dá)式學(xué)習(xí)教程之回溯引用backreference詳解
相關(guān)文章
正則表達(dá)式從原理到實(shí)戰(zhàn)全面學(xué)習(xí)小結(jié)
這篇文章主要介紹了全面學(xué)習(xí)正則表達(dá)式?-?從原理到實(shí)戰(zhàn),本文全面介紹正則表達(dá)式的語法知識,全面介紹JavaScript中正則表達(dá)式的API,通過實(shí)戰(zhàn),希望能夠幫助大家全面學(xué)習(xí),并啃下前端的難題,需要的朋友可以參考下2022-07-07正則表達(dá)式 \D 元字符(等價(jià)于"[^0-9]")
\D元字符可以匹配非數(shù)字字符,等價(jià)于"[^0-9]"。這篇文章主要介紹了正則表達(dá)式 \D 元字符的相關(guān)資料,需要的朋友可以參考下2018-01-01正則表達(dá)式實(shí)現(xiàn)字符串每4位后自動(dòng)加空格效果(兩種方法)
本文通過兩種方法給大家介紹了正則表達(dá)式實(shí)現(xiàn)字符串每4位后自動(dòng)加空格效果,需要的朋友可以參考下2018-09-09正則表達(dá)式創(chuàng)建方式的區(qū)別及編寫簡單的正則方式(js學(xué)習(xí)總結(jié))
這篇文章主要介紹了正則表達(dá)式創(chuàng)建方式的區(qū)別及編寫簡單的正則方式(js學(xué)習(xí)總結(jié)),需要的朋友可以參考下2017-07-07javascript正則表達(dá)式和字符串RegExp and String(二)
這篇文章主要介紹了javascript正則表達(dá)式和字符串RegExp and String的相關(guān)資料,需要的朋友可以參考下2015-10-10JavaScript+Regex 身份證號碼的正則表達(dá)式及驗(yàn)證詳解
在做用戶實(shí)名驗(yàn)證時(shí),常會(huì)用到身份證號碼的正則表達(dá)式及校驗(yàn)方案。本文列舉了兩種驗(yàn)證方案,大家可以根據(jù)自己的項(xiàng)目實(shí)際情況,選擇適合的方案2018-03-03