preg_match_all使用心得分享
preg_match_all — 進行全局正則表達式匹配
說明
int preg_match_all ( string pattern, string subject, array matches [, int flags] )
在 subject 中搜索所有與 pattern 給出的正則表達式匹配的內容并將結果以 flags 指定的順序放到 matches 中。
搜索到第一個匹配項之后,接下來的搜索從上一個匹配項末尾開始。
特別注意PREG_PATTERN_ORDER 和PREG_SET_ORDER
flags 可以是下列標記的組合(注意把 PREG_PATTERN_ORDER 和 PREG_SET_ORDER 合起來用沒有意義):
如果使用PREG_PATTERN_ORDER
對結果排序使 $matches[0] 為全部模式匹配的數(shù)組,$matches[1] 為第一個括號中的子模式所匹配的字符串組成的數(shù)組,以此類推。(即$matches[0] [0]為全部模式匹配中的每一項,$matches[0] [1]為全部模式匹配中的第二項,$matches[1] [0]為匹配每一個括號中的第一項,$matches[1] [0]為匹配每一個括號中的第二項)
<?php
preg_match_all ("|<[^>]+>(.*)</[^>]+>|U","<b>example: </b><div align=left>this is a test</div>",$out, PREG_PATTERN_ORDER);
print $out[0][0].", ".$out[0][1]."\n";
print $out[1][0].", ".$out[1][1]."\n";
?>
本例將輸出:
<b>example: </b>, <div align=left>this is a test</div>
example: , this is a test
因此,$out[0] 包含匹配整個模式的字符串,$out[1] 包含一對 HTML 標記之間的字符串。
如果使用PREG_SET_ORDER
對結果排序使 $matches[0] 為第一組匹配項的數(shù)組,$matches[1] 為第二組匹配項的數(shù)組,以此類推。(即$matches[0] [0]為第一組匹配項中完整匹配的字符串,$matches[0] [1]為第一組匹配中完整匹配第一個括號中的字符串)
<?php
preg_match_all ("|<[^>]+>(.*)</[^>]+>|U","<b>example: </b><div align=left>this is a test</div>",$out, PREG_SET_ORDER);
print $out[0][0].", ".$out[0][1]."\n";
print $out[1][0].", ".$out[1][1]."\n";
?>
本例將輸出:
<b>example: </b>, example:
<div align=left>this is a test</div>, this is a test
本例中,$matches[0] 是第一組匹配結果,$matches[0][0] 包含匹配整個模式的文本,$matches[0][1] 包含匹配第一個子模式的文本,以此類推。同樣,$matches[1] 是第二組匹配結果,等等。
PREG_OFFSET_CAPTURE
如果設定本標記,對每個出現(xiàn)的匹配結果也同時返回其附屬的字符串偏移量。注意這改變了返回的數(shù)組的值,使其中的每個單元也是一個數(shù)組,其中第一項為匹配字符串,第二項為其在 subject 中的偏移量。本標記自 PHP 4.3.0 起可用。
如果沒有給出標記,則假定為 PREG_PATTERN_ORDER。
返回整個模式匹配的次數(shù)(可能為零),如果出錯返回 FALSE。
例子 1. 從某文本中取得所有的電話號碼
<?php
preg_match_all ("/\(? (\d)? \)? (?(1) [\-\s] ) \d-\d/x","Call 555-1212 or 1-800-555-1212", $phones);
?>
例子 2. 搜索匹配的 HTML 標記(greedy)
<?php
// \\2 是一個逆向引用的例子,其在 PCRE 中的含義是
// 必須匹配正則表達式本身中第二組括號內的內容,本例中
// 就是 ([\w]+)。因為字符串在雙引號中,所以需要
// 多加一個反斜線。
$html = "<b>bold text</b><a href=howdy.html>click me</a>";
preg_match_all ("/(<([\w]+)[^>]*>)(.*)(<\/\\2>)/", $html, $matches);
for ($i=0; $i< count($matches[0]); $i++) {
echo "matched: ".$matches[0][$i]."\n";
echo "part 1: ".$matches[1][$i]."\n";
echo "part 2: ".$matches[3][$i]."\n";
echo "part 3: ".$matches[4][$i]."\n\n";
}
?>
本例將輸出:
matched: <b>bold text</b>
part 1: <b>
part 2: bold text
part 3: </b>
matched: <a href=howdy.html>click me</a>
part 1: <a href=howdy.html>
part 2: click me
part 3: </a>
相關文章
PHP入門教程之數(shù)組用法匯總(創(chuàng)建,刪除,遍歷,排序等)
這篇文章主要介紹了PHP入門教程之數(shù)組用法,結合大量實例總結分析了php關于數(shù)組的創(chuàng)建、打印、遍歷、獲取、排序、插入、刪除等常見操作技巧,需要的朋友可以參考下2016-09-09
php源碼分析之DZX1.5隨機數(shù)函數(shù)random用法
這篇文章主要介紹了php源碼分析之DZX1.5隨機數(shù)函數(shù)random用法,實例分析了DZX1.5中random函數(shù)生成隨機字符串的使用技巧,需要的朋友可以參考下2015-06-06
PHP函數(shù)extension_loaded()用法實例
這篇文章主要介紹了PHP函數(shù)extension_loaded()用法,實例分析了函數(shù)extension_loaded()檢查一個擴展是否已經(jīng)加載的具體用法,并補充說明了查看本機已加載php擴展的方法,需要的朋友可以參考下2015-01-01
屏蔽機器人從你的網(wǎng)站搜取email地址的php代碼
屏蔽機器人從你的網(wǎng)站搜取email地址然后發(fā)垃圾郵件的處理方法,需要的朋友可以參考下2012-11-11
PHP和Selenium搭建高效網(wǎng)絡爬蟲實現(xiàn)技術探索
隨著信息時代的到來,網(wǎng)站被認為是獲取信息的主要途徑之一,但是,手動獲取網(wǎng)站上的信息是非常繁瑣的,因此出現(xiàn)了自動抓取網(wǎng)頁的方式——網(wǎng)絡爬蟲,這篇文章將介紹如何使用PHP和Selenium搭建一個高效的網(wǎng)絡爬蟲來自動收集信息2024-01-01
ThinkPHP6使用最新版本Endroid/QrCode生成二維碼的方法實例
這篇文章主要介紹了ThinkPHP6使用最新版本Endroid/QrCode生成二維碼的方法,結合實例形式詳細分析了ThinkPHP6使用最新版本Endroid/QrCode生成二維碼具體步驟、原理、實現(xiàn)方法與相關注意事項,需要的朋友可以參考下2023-07-07
php在apache環(huán)境下實現(xiàn)gzip配置方法
這篇文章主要介紹了php在apache環(huán)境下實現(xiàn)gzip配置方法,較為詳細的分析了相關配置文件的修改技巧,非常具有實用價值,需要的朋友可以參考下2015-04-04

