php 正則表達式的子模式詳解
更新時間:2012年06月24日 23:13:09 作者:
php 正則表達式的子模式詳解,學習php的朋友可以參考下
首先,我們先看一段PHP代碼:
<?php
$time = date ("Y-m-d H:i:s");
$pattern = "/\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2}/i";
if(preg_match($pattern,$time,$arr)){
echo "<pre>";
print_r($arr);
echo "</pre>";
}
?>
顯示結果:
Array
(
[0] => 2012-06-23 03:08:45
)
有沒有注意到,顯示的結果只有一條數(shù)據,即符合匹配模式的時間格式,那如果只有一條記錄的話,為什么還要用數(shù)組保存呢?直接使用字符串保存不是更好?
帶著這個問題,我們來看下正則表達式中的子模式。
在正則表達式中,可以使用“(”和“)”將模式中的子字符串括起來,以形成一個子模式。將子模式視為一個整體時,那么它就相當于一個單個字符。
比如,我們將以上的代碼稍微修改下,改成如下:
<?php
$time = date ("Y-m-d H:i:s");
$pattern = "/(\d{4})-(\d{2})-(\d{2}) (\d{2}):(\d{2}):(\d{2})/i";
if(preg_match($pattern,$time,$arr)){
echo "<pre>";
print_r($arr);
echo "</pre>";
}
?>
注意:我只修改了$pattern,在匹配模式中,使用了括號()
執(zhí)行結果:
Array
(
[0] => 2012-06-23 03:19:23
[1] => 2012
[2] => 06
[3] => 23
[4] => 03
[5] => 19
[6] => 23
)
總結:我們可以使用小括號給整個匹配模式進行分組,默認情況下,每個分組會自動擁有一個組號,規(guī)則是,從左到右,以分組的左括號為標志,第一個出現(xiàn)的分組為組號1,第二個為組號2,以此類推。其中,分組0對應整個正則表達式。對整個正則匹配模式進行了分組以后,就可以進一步使用“向后引用”來重復搜索前面的某個分組匹配的文本。例如:\1代表分組1匹配的文本,\2代表分組2匹配的文本等等我們可以進一步修改下代碼,如下所示:
<?php
$time = date ("Y-m-d H:i:s");
$pattern = "/(\d{4})-(\d{2})-(\d{2}) (\d{2}):(\d{2}):(\d{2})/i";
$replacement = "\$time格式為:$0<BR>替換后的格式為:\\1年\\2月\\3日 \\4時\\5分\\6秒";
print preg_replace($pattern, $replacement, $time);
if(preg_match($pattern,$time,$arr)){
echo "<pre>";
print_r($arr);
echo "</pre>";
}
?>
注意:
因為是在雙引號中,所以使用分組的時候應該使用兩個反斜杠,如:\\1,而如果在單引號中,則使用一個反斜杠就可以了,如:\1
\\1用于捕獲分組一種的內容:2012,\\6用于捕獲分組6中的內容
執(zhí)行結果:
$time格式為:2012-06-23 03:30:31
替換后的格式為:2012年06月23日 03時30分31秒
Array
(
[0] => 2012-06-23 03:30:31
[1] => 2012
[2] => 06
[3] => 23
[4] => 03
[5] => 30
[6] => 31
)
復制代碼 代碼如下:
<?php
$time = date ("Y-m-d H:i:s");
$pattern = "/\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2}/i";
if(preg_match($pattern,$time,$arr)){
echo "<pre>";
print_r($arr);
echo "</pre>";
}
?>
顯示結果:
復制代碼 代碼如下:
Array
(
[0] => 2012-06-23 03:08:45
)
有沒有注意到,顯示的結果只有一條數(shù)據,即符合匹配模式的時間格式,那如果只有一條記錄的話,為什么還要用數(shù)組保存呢?直接使用字符串保存不是更好?
帶著這個問題,我們來看下正則表達式中的子模式。
在正則表達式中,可以使用“(”和“)”將模式中的子字符串括起來,以形成一個子模式。將子模式視為一個整體時,那么它就相當于一個單個字符。
比如,我們將以上的代碼稍微修改下,改成如下:
復制代碼 代碼如下:
<?php
$time = date ("Y-m-d H:i:s");
$pattern = "/(\d{4})-(\d{2})-(\d{2}) (\d{2}):(\d{2}):(\d{2})/i";
if(preg_match($pattern,$time,$arr)){
echo "<pre>";
print_r($arr);
echo "</pre>";
}
?>
注意:我只修改了$pattern,在匹配模式中,使用了括號()
執(zhí)行結果:
復制代碼 代碼如下:
Array
(
[0] => 2012-06-23 03:19:23
[1] => 2012
[2] => 06
[3] => 23
[4] => 03
[5] => 19
[6] => 23
)
總結:我們可以使用小括號給整個匹配模式進行分組,默認情況下,每個分組會自動擁有一個組號,規(guī)則是,從左到右,以分組的左括號為標志,第一個出現(xiàn)的分組為組號1,第二個為組號2,以此類推。其中,分組0對應整個正則表達式。對整個正則匹配模式進行了分組以后,就可以進一步使用“向后引用”來重復搜索前面的某個分組匹配的文本。例如:\1代表分組1匹配的文本,\2代表分組2匹配的文本等等我們可以進一步修改下代碼,如下所示:
復制代碼 代碼如下:
<?php
$time = date ("Y-m-d H:i:s");
$pattern = "/(\d{4})-(\d{2})-(\d{2}) (\d{2}):(\d{2}):(\d{2})/i";
$replacement = "\$time格式為:$0<BR>替換后的格式為:\\1年\\2月\\3日 \\4時\\5分\\6秒";
print preg_replace($pattern, $replacement, $time);
if(preg_match($pattern,$time,$arr)){
echo "<pre>";
print_r($arr);
echo "</pre>";
}
?>
注意:
因為是在雙引號中,所以使用分組的時候應該使用兩個反斜杠,如:\\1,而如果在單引號中,則使用一個反斜杠就可以了,如:\1
\\1用于捕獲分組一種的內容:2012,\\6用于捕獲分組6中的內容
執(zhí)行結果:
$time格式為:2012-06-23 03:30:31
替換后的格式為:2012年06月23日 03時30分31秒
復制代碼 代碼如下:
Array
(
[0] => 2012-06-23 03:30:31
[1] => 2012
[2] => 06
[3] => 23
[4] => 03
[5] => 30
[6] => 31
)
相關文章
最嚴謹?shù)男r瀍mail地址的正則表達式及各種語言對應版
這篇文章主要介紹了最嚴謹?shù)男r瀍mail地址的正則表達式及各種語言對應版,本文給出通用、Python、Javascript、PHP、Perl / Ruby、Perl等版本的最嚴謹?shù)谋磉_式寫法,需要的朋友可以參考下2015-07-07javascript正則表達式標記中/g /i /m的用法,以及實例
正則的思想都是一樣的,但是具體的寫法會有所不同,在這里提到的/g,/i,/m在其他的地方也許就不能用了,需要的朋友可以參考下2020-02-02