正則表達(dá)式學(xué)習(xí)教程之回溯引用backreference詳解
本文實(shí)例講述了正則表達(dá)式回溯引用backreference。分享給大家供大家參考,具體如下:
在所有例子中正則表達(dá)式匹配結(jié)果包含在源文本中的【和】之間,有的例子會(huì)使用Java來(lái)實(shí)現(xiàn),如果是java本身正則表達(dá)式的用法,會(huì)在相應(yīng)的地方說(shuō)明。所有java例子都在JDK1.6.0_13下測(cè)試通過(guò)。
一、問(wèn)題引入
一個(gè)在HTML頁(yè)面中匹配標(biāo)題標(biāo)簽(H1—H6)的問(wèn)題:
文本:
<body> <h1>Welcome to my page</H1> Content is divided into twosections:<br> <h2>Introduction</h2> Information about me. <H2>Hobby</H2> Information about my hobby. <h2>This is invalid HTML</h3> </body>
正則表達(dá)式:<[hH][1-6]>.*?</[hH][1-6]>
結(jié)果:
<body>
【<h1>Welcome to my page</H1>】
Content is divided into twosections:<br>
【<h2>Introduction</h2>】
Information about me.
【<H2>Hobby</H2>】
Information about my hobby.
【<h2>This is invalid HTML</h3>】
</body>
分析:模式<[hH][1-6]>匹配任何一級(jí)標(biāo)題的開(kāi)始標(biāo)簽,而且不區(qū)分大小寫(xiě),在這個(gè)例子中它匹配到了<h1>、<h2>,</[hH][1-6]>匹配到了</h1>、</h2>、</h3>;這里使用了懶惰型元字符來(lái)匹配標(biāo)簽中的文本,否則會(huì)匹配到從第一個(gè)開(kāi)始標(biāo)簽到最后一下結(jié)束標(biāo)簽之間的內(nèi)容。但是從結(jié)果可以看出,有一個(gè)無(wú)效的標(biāo)簽也匹配上了,即<h2></h3>,它們根本不能配對(duì)。要解決這個(gè)問(wèn)題,就需要使用到回溯引用(backreference)。
二、回溯引用匹配
回溯引用是指模式的后半部分引用在前半部分中定義的子表達(dá)式。至于子表達(dá)式的使用、劃分和引用,在前面已經(jīng)介紹過(guò)了?,F(xiàn)在來(lái)解決前面的例子:
文本:
<body> <h1>Welcome to my page</H1> Content is divided into twosections:<br> <h2>Introduction</h2> Information about me. <H2>Hobby</H2> Information about my hobby. <h2>This is invalid HTML</h3> </body>
正則表達(dá)式:<[hH]([1-6])>.*?</[hH]\1>
結(jié)果:
<body>
【<h1>Welcome to my page</H1>】
Content is divided into twosections:<br>
【<h2>Introduction</h2>】
Information about me.
【<H2>Hobby</H2>】
Information about my hobby.
<h2>This is invalid HTML</h3>
分析:首先匹配開(kāi)始標(biāo)題標(biāo)簽的模式<[hH]([1-6])>,使用括號(hào)把[1-6]做為子表達(dá)式,而匹配結(jié)束標(biāo)題標(biāo)簽?zāi)J綖?lt;/[hH]\1>,其中\(zhòng)1表示引用第一個(gè)子表達(dá)式,即([1-6]),如果([1-6])匹配到的是1,那\1也匹配到1,如果匹配到2,那\1也匹配到2,所以最后一個(gè)無(wú)效的標(biāo)題標(biāo)簽就不會(huì)被匹配到了。
PS:這里再為大家提供2款非常方便的正則表達(dá)式工具供大家參考使用:
JavaScript正則表達(dá)式在線(xiàn)測(cè)試工具:
http://tools.jb51.net/regex/javascript
正則表達(dá)式在線(xiàn)生成工具:
http://tools.jb51.net/regex/create_reg
更多關(guān)于JavaScript相關(guān)內(nèi)容感興趣的讀者可查看本站專(zhuān)題:《JavaScript正則表達(dá)式技巧大全》、《JavaScript替換操作技巧總結(jié)》、《JavaScript查找算法技巧總結(jié)》、《JavaScript數(shù)據(jù)結(jié)構(gòu)與算法技巧總結(jié)》、《JavaScript遍歷算法與技巧總結(jié)》、《JavaScript中json操作技巧總結(jié)》、《JavaScript錯(cuò)誤與調(diào)試技巧總結(jié)》及《JavaScript數(shù)學(xué)運(yùn)算用法總結(jié)》
希望本文所述對(duì)大家JavaScript程序設(shè)計(jì)有所幫助。
相關(guān)文章
正則表達(dá)式(括號(hào))、[中括號(hào)]、{大括號(hào)}的區(qū)別小結(jié)
這篇文章主要介紹了正則表達(dá)式(括號(hào))、[中括號(hào)]、{大括號(hào)}的區(qū)別小結(jié),本文用(\s*)[\s*]{\s*}做例子,需要的朋友可以參考下2014-07-07正則表達(dá)式、分組、子匹配(子模式)、非捕獲子匹配(子模式)
前面我們知道正則表達(dá)式有很多元字符表示匹配次數(shù)(量詞),都是可以重復(fù)匹配前面出現(xiàn)的單個(gè)字符次數(shù),需要的朋友可以參考下2016-06-06正則表達(dá)式的神奇世界之表達(dá)、匹配和提取全解析
這篇文章主要給大家介紹了關(guān)于正則表達(dá)式的神奇世界之表達(dá)、匹配和提取的相關(guān)資料,正則表達(dá)式是由一些特定的字符組成,代表一個(gè)規(guī)則,可以用來(lái)檢驗(yàn)數(shù)據(jù)格式是否合法,也可以在一段文本中查找滿(mǎn)足要求的內(nèi)容,需要的朋友可以參考下2024-02-02比較實(shí)用的正則表達(dá)式學(xué)習(xí)筆記
最近在學(xué)習(xí)正則,一些比較有用的東西怕忘記,記下來(lái),比較亂,想一條記錄一條2008-08-08正則匹配密碼只能是數(shù)字和字母組合字符串功能【php與js實(shí)現(xiàn)】
這篇文章主要介紹了正則匹配密碼只能是數(shù)字和字母組合字符串功能,涉及針對(duì)字符、數(shù)字等正則操作相關(guān)技巧,并給出了php與js實(shí)現(xiàn)示例,需要的朋友可以參考下2017-01-01