php小經驗:解析preg_match與preg_match_all 函數
更新時間:2013年06月29日 10:28:23 作者:
本篇文章是對php中的preg_match函數與preg_match_all函數進行了詳細的分析介紹,需要的朋友參考下
正則表達式在 PHP 中的應用
在 PHP 應用中,正則表達式主要用于:
•正則匹配:根據正則表達式匹配相應的內容
•正則替換:根據正則表達式匹配內容并替換
•正則分割:根據正則表達式分割字符串
在 PHP 中有兩類正則表達式函數,一類是 Perl 兼容正則表達式函數,一類是 POSIX 擴展正則表達式函數。二者差別不大,而且推薦使用Perl 兼容正則表達式函數,因此下文都是以 Perl 兼容正則表達式函數為例子說明。
定界符
Perl 兼容模式的正則表達式函數,其正則表達式需要寫在定界符中。任何不是字母、數字或反斜線()的字符都可以作為定界符,通常我們使用 / 作為定界符。具體使用見下面的例子。
提示
盡管正則表達式功能非常強大,但如果用普通字符串處理函數能完成的,就盡量不要用正則表達式函數,因為正則表達式效率會低得多。關于普通字符串處理函數。
preg_match()
preg_match() 函數用于進行正則表達式匹配,成功返回 1 ,否則返回 0 。
語法:
int preg_match( string pattern, string subject [, array matches ] )
參數說明:
例子 1 :
<?php
if(preg_match("/php/i", "PHP is the web scripting language of choice.", $matches)){
print "A match was found:". $matches[0];
} else {
print "A match was not found.";
}
?>
瀏覽器輸出:
A match was found: PHP
在該例子中,由于使用了 i 修正符,因此會不區(qū)分大小寫去文本中匹配 php 。
提示
preg_match() 第一次匹配成功后就會停止匹配,如果要實現全部結果的匹配,即搜索到subject結尾處,則需使用 preg_match_all() 函數。
例子 2 ,從一個 URL 中取得主機域名 :
<?php
// 從 URL 中取得主機名
preg_match("/^(http://)?([^/]+)/i","http://www.dbjr.com.cn/index.html", $matches);
$host = $matches[2];
// 從主機名中取得后面兩段
preg_match("/[^./]+.[^./]+$/", $host, $matches);
echo "域名為:{$matches[0]}";
?>
瀏覽器輸出:
域名為:jb51.net
preg_match_all()
preg_match_all() 函數用于進行正則表達式全局匹配,成功返回整個模式匹配的次數(可能為零),如果出錯返回 FALSE 。
語法:
int preg_match_all( string pattern, string subject, array matches [, int flags ] )
參數說明:
下面的例子演示了將文本中所有 <pre></pre> 標簽內的關鍵字(php)顯示為紅色。
<?php
$str = "<pre>學習php是一件快樂的事。</pre><pre>所有的phper需要共同努力!</pre>";
$kw = "php";
preg_match_all('/<pre>([sS]*?)</pre>/',$str,$mat);
for($i=0;$i<count($mat[0]);$i++){
$mat[0][$i] = $mat[1][$i];
$mat[0][$i] = str_replace($kw, '<span style="color:#ff0000">'.$kw.'</span>', $mat[0][$i]);
$str = str_replace($mat[1][$i], $mat[0][$i], $str);
}
echo $str;
?>
正則匹配中文漢字
正則匹配中文漢字根據頁面編碼不同而略有區(qū)別:
•GBK/GB2312編碼:[x80-xff>]+ 或 [xa1-xff]+
•UTF-8編碼:[x{4e00}-x{9fa5}]+/u
例子:
<?php
$str = "學習php是一件快樂的事。";
preg_match_all("/[x80-xff]+/", $str, $match);
//UTF-8 使用:
//preg_match_all("/[x{4e00}-x{9fa5}]+/u", $str, $match);
print_r($match);
?>
輸出:
Array
(
[0] => Array
(
[0] => 學習
[1] => 是一件快樂的事。
)
)
在 PHP 應用中,正則表達式主要用于:
•正則匹配:根據正則表達式匹配相應的內容
•正則替換:根據正則表達式匹配內容并替換
•正則分割:根據正則表達式分割字符串
在 PHP 中有兩類正則表達式函數,一類是 Perl 兼容正則表達式函數,一類是 POSIX 擴展正則表達式函數。二者差別不大,而且推薦使用Perl 兼容正則表達式函數,因此下文都是以 Perl 兼容正則表達式函數為例子說明。
定界符
Perl 兼容模式的正則表達式函數,其正則表達式需要寫在定界符中。任何不是字母、數字或反斜線()的字符都可以作為定界符,通常我們使用 / 作為定界符。具體使用見下面的例子。
提示
盡管正則表達式功能非常強大,但如果用普通字符串處理函數能完成的,就盡量不要用正則表達式函數,因為正則表達式效率會低得多。關于普通字符串處理函數。
preg_match()
preg_match() 函數用于進行正則表達式匹配,成功返回 1 ,否則返回 0 。
語法:
int preg_match( string pattern, string subject [, array matches ] )
參數說明:
參數 | 說明 |
---|---|
pattern | 正則表達式 |
subject | 需要匹配檢索的對象 |
matches | 可選,存儲匹配結果的數組, $matches[0] 將包含與整個模式匹配的文本,$matches[1] 將包含與第一個捕獲的括號中的子模式所匹配的文本,以此類推 |
復制代碼 代碼如下:
<?php
if(preg_match("/php/i", "PHP is the web scripting language of choice.", $matches)){
print "A match was found:". $matches[0];
} else {
print "A match was not found.";
}
?>
瀏覽器輸出:
復制代碼 代碼如下:
A match was found: PHP
在該例子中,由于使用了 i 修正符,因此會不區(qū)分大小寫去文本中匹配 php 。
提示
preg_match() 第一次匹配成功后就會停止匹配,如果要實現全部結果的匹配,即搜索到subject結尾處,則需使用 preg_match_all() 函數。
例子 2 ,從一個 URL 中取得主機域名 :
復制代碼 代碼如下:
<?php
// 從 URL 中取得主機名
preg_match("/^(http://)?([^/]+)/i","http://www.dbjr.com.cn/index.html", $matches);
$host = $matches[2];
// 從主機名中取得后面兩段
preg_match("/[^./]+.[^./]+$/", $host, $matches);
echo "域名為:{$matches[0]}";
?>
瀏覽器輸出:
復制代碼 代碼如下:
域名為:jb51.net
preg_match_all()
preg_match_all() 函數用于進行正則表達式全局匹配,成功返回整個模式匹配的次數(可能為零),如果出錯返回 FALSE 。
語法:
int preg_match_all( string pattern, string subject, array matches [, int flags ] )
參數說明:
參數 | 說明 |
---|---|
pattern | 正則表達式 |
subject | 需要匹配檢索的對象 |
matches | 存儲匹配結果的數組 |
flags |
可選,指定匹配結果放入 matches 中的順序,可供選擇的標記有:
|
復制代碼 代碼如下:
<?php
$str = "<pre>學習php是一件快樂的事。</pre><pre>所有的phper需要共同努力!</pre>";
$kw = "php";
preg_match_all('/<pre>([sS]*?)</pre>/',$str,$mat);
for($i=0;$i<count($mat[0]);$i++){
$mat[0][$i] = $mat[1][$i];
$mat[0][$i] = str_replace($kw, '<span style="color:#ff0000">'.$kw.'</span>', $mat[0][$i]);
$str = str_replace($mat[1][$i], $mat[0][$i], $str);
}
echo $str;
?>
正則匹配中文漢字
正則匹配中文漢字根據頁面編碼不同而略有區(qū)別:
•GBK/GB2312編碼:[x80-xff>]+ 或 [xa1-xff]+
•UTF-8編碼:[x{4e00}-x{9fa5}]+/u
例子:
復制代碼 代碼如下:
<?php
$str = "學習php是一件快樂的事。";
preg_match_all("/[x80-xff]+/", $str, $match);
//UTF-8 使用:
//preg_match_all("/[x{4e00}-x{9fa5}]+/u", $str, $match);
print_r($match);
?>
輸出:
復制代碼 代碼如下:
Array
(
[0] => Array
(
[0] => 學習
[1] => 是一件快樂的事。
)
)
您可能感興趣的文章:
- PHP preg match正則表達式函數的操作實例
- PHP函數preg_match_all正則表達式的基本使用詳細解析
- PHP 正則表達式之正則處理函數小結(preg_match,preg_match_all,preg_replace,preg_split)
- php中使用preg_match_all匹配文章中的圖片
- PHP的preg_match匹配字符串長度問題解決方法
- PHP中preg_match函數正則匹配的字符串長度問題
- php preg_match的匹配不同國家語言實例
- PHP正則匹配操作簡單示例【preg_match_all應用】
- PHP 正則表達式常用函數使用小結
- PHP提取字符串中的圖片地址[正則表達式]
- php正則表達式使用的詳細介紹
- PHP preg_match實現正則表達式匹配功能【輸出是否匹配及匹配值】
相關文章
ubuntu 編譯安裝php 5.3.3+memcache的方法
ubuntu 編譯安裝php 5.3.3+memcache的方法,需要的朋友可以參考下。2010-08-08