PHP函數(shù)preg_match_all正則表達(dá)式的基本使用詳細(xì)解析
了解正則表達(dá)式之前,須要掌握一些常用的正則表達(dá)式的基礎(chǔ)知識,這些如果能記得最好記得,記不住須要用的時(shí)候能查到就行,就多個(gè)特殊字符,所以說正則表達(dá)式玩的就是特殊,具體大家可以查看更加細(xì)致的說明。
preg_match_all函數(shù)具體說明大家可以查看PHP手冊,本文運(yùn)用 preg_match_all用于測試正則表達(dá)的效果。
實(shí)例代碼:
$html = '<div id="biuuu">jb51.net</div><div id="biuuu_2">jb51.net2</div><div id="biuuu_3">jb51.net3</div>';
實(shí)例要求:分別將每一個(gè)DIV元素的ID和內(nèi)容取出,如biuuu,biuuu_2,biuuu_3,jb51.net,jb51.net2和jb51.net3(一些常用的抓站要領(lǐng)就是這樣匹配的)
分析:字符串是一個(gè)基本的HTML元素,每一個(gè)DIV元素對應(yīng)該一個(gè)ID和內(nèi)容,并且是獨(dú)立的,首先考慮如何 取出一個(gè)DIV內(nèi)的ID值和內(nèi)容,如:jb51.net,然后匹配其它類似的元素。一個(gè)DIV中須要取出兩個(gè)值,也就是兩個(gè)匹配的表達(dá)式,第一個(gè)表達(dá)式用于匹配ID值(biuuu),第二個(gè)表達(dá)式用于匹配ID的內(nèi)容(jb51.net),正則表達(dá)式常用的表達(dá)式運(yùn)用小括號,那么前面的元素將會(huì)變成如下形式:
<div id="(biuuu)">(jb51.net)</div>
<div id="(表達(dá)式1)">(表達(dá)式2)</div>
好,運(yùn)用如上小括號把須要匹配的區(qū)域執(zhí)行 了劃分,接下來就是如何 匹配各個(gè)表達(dá)式內(nèi)的內(nèi)容,我們猜想一個(gè)ID可能是字母,數(shù)字或下劃線,那這就變得基本了,運(yùn)用中括號就可以實(shí)現(xiàn),如下:
表達(dá)式1:[a-zA-Z0-9_]+ (表示匹配大小寫字母,數(shù)字和下劃線)
那如何 匹配表達(dá)式2,因?yàn)镮D的內(nèi)容可以是任意的字符,但是要留心,不能匹配<或>字符,因?yàn)槿绻ヅ溥@兩個(gè)字符將會(huì)把后面運(yùn)用的DIV都匹配出來,因此須要排除這兩個(gè)字符開始的元素,也就是不匹配以<或>字符,如下:
表達(dá)式2:[^<>]+ (表示不匹配<和>字符)
這樣,須要匹配的子表達(dá)式就實(shí)現(xiàn)了,但是還要須要匹配一個(gè) 的表達(dá)式,要領(lǐng)如下:
表達(dá)式:/ '\"(表達(dá)式1)\"'>(表達(dá)式2)<\/div>/
留心其中的雙引號"和/須要運(yùn)用 \轉(zhuǎn)義字符轉(zhuǎn)義,然后把前面兩個(gè)表達(dá)式放進(jìn)去,
如下: '\"([a-z0-9_]+)\"'>/<div id=\"([a-z0-9_]+)\">([^<>]+)<\/div>/
這樣就實(shí)現(xiàn)一個(gè)匹配每一個(gè)DIV元素ID值和內(nèi)容的正則表達(dá)式,然后運(yùn)用 preg_match_all函數(shù)測試如下:
$html = '<div id="biuuu">jb51.net</div><div id="biuuu_2">jb51.net2</div><div id="biuuu_3">jb51.net3</div>';
preg_match_all('/<div\sid=\"([a-z0-9_]+)\">([^<>]+)<\/div>/',$html,$result);
var_dump($result);
結(jié)果:
array(3) { [0]=> array(3)
{ [0]=> string(30) "<div id="biuuu">jb51.net</div>" [1]=> string(33) "<div id="biuuu_2">jb51.net2</div>" [2]=> string(33) "<div id="biuuu_3">jb51.net3</div>" } [1]=> array(3) { [0]=> string(5) "biuuu" [1]=> string(7) "biuuu_2" [2]=> string(7) "biuuu_3" } [2]=> array(3) { [0]=> string(8) "jb51.net" [1]=> string(9) "jb51.net2" [2]=> string(9) "jb51.net3" } }
共有三個(gè)表達(dá)式,分別顯示每一個(gè)表達(dá)式匹配的值,并以數(shù)組的形式存儲,這樣就把每一個(gè)DIV元素的ID和內(nèi)容取出。運(yùn)用正則表達(dá)式最主要還是要知道須要什么,然后跟椐須要執(zhí)行 匹配,并且思路清晰,并適當(dāng)?shù)慕柚鷓reg_match_all函數(shù)執(zhí)行 輸出調(diào)試,非常方便。
- PHP中PCRE正則解析代碼詳解
- PHP 正則表達(dá)式常用函數(shù)使用小結(jié)
- PHP正則表達(dá)式基本函數(shù) 修飾符 元字符和需轉(zhuǎn)義字符說明
- PHP 正則表達(dá)式常用函數(shù)
- PHP 正則表達(dá)式之正則處理函數(shù)小結(jié)(preg_match,preg_match_all,preg_replace,preg_split)
- PHP中的正則表達(dá)式函數(shù)介紹
- PHP中一些可以替代正則表達(dá)式函數(shù)的字符串操作函數(shù)
- PHP preg match正則表達(dá)式函數(shù)的操作實(shí)例
- PHP中基于perl的正則表達(dá)式處理函數(shù)
- PHP正則表達(dá)式處理函數(shù)(PCRE 函數(shù))實(shí)例小結(jié)
相關(guān)文章
淺析PHP程序防止ddos,dns,集群服務(wù)器攻擊的解決辦法
本篇文章是對PHP程序防止ddos,dns,集群服務(wù)器攻擊的解決辦法進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下2013-06-06靜態(tài)html文件執(zhí)行php語句的方法(推薦)
下面小編就為大家?guī)硪黄o態(tài)html文件執(zhí)行php語句的方法(推薦)。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2016-11-11PHP簡單實(shí)現(xiàn)數(shù)字分頁功能示例
這篇文章主要介紹了PHP簡單實(shí)現(xiàn)數(shù)字分頁功能,結(jié)合實(shí)例形式分析了php數(shù)字分頁相關(guān)的數(shù)學(xué)運(yùn)算與字符串操作相關(guān)技巧,需要的朋友可以參考下2016-08-08PHP利用遞歸函數(shù)實(shí)現(xiàn)無限級分類的方法
今天小編就為大家分享一篇關(guān)于PHP利用遞歸函數(shù)實(shí)現(xiàn)無限級分類的方法,小編覺得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來看看吧2019-03-03