Visual Basic Scripting Edition | 語言參考 |
限定符有時(shí)候不知道要匹配多少字符。為了能適應(yīng)這種不確定性,正則表達(dá)式支持限定符的概念。這些限定符可以指定正則表達(dá)式的一個(gè)給定組件必須要出現(xiàn)多少次才能滿足匹配。 下表給出了各種限定符及其含義的說明: 字符 | 描述 |
---|
* | 匹配前面的子表達(dá)式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。 * 等價(jià)于{0,}。 | + | 匹配前面的子表達(dá)式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等價(jià)于 {1,}。 | ? | 匹配前面的子表達(dá)式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等價(jià)于 {0,1}。 | {n} | n 是一個(gè)非負(fù)整數(shù)。匹配確定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的兩個(gè) o。 | {n,} | n 是一個(gè)非負(fù)整數(shù)。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等價(jià)于 'o+'。'o{0,}' 則等價(jià)于 'o*'。 | {n,m} | m 和 n 均為非負(fù)整數(shù),其中n <=m。最少匹配 n 次且最多匹配 m 次。劉, "o{1,3}" 將匹配 "fooooood" 中的前三個(gè) o。'o{0,1}' 等價(jià)于 'o?'。請(qǐng)注意在逗號(hào)和兩個(gè)數(shù)之間不能有空格。 |
對(duì)一個(gè)很大的輸入文檔而言,章節(jié)數(shù)很輕易就超過九章,因此需要有一種方法來處理兩位數(shù)或者三位數(shù)的章節(jié)號(hào)。限定符就提供了這個(gè)功能。下面的Visual Basic Scripting Edition 正則表達(dá)式可以匹配具有任何位數(shù)的章節(jié)標(biāo)題: /Chapter [1-9][0-9]*/
下面的 VBScript 正則表達(dá)式執(zhí)行同樣的匹配: "Chapter [1-9][0-9]*"
請(qǐng)注意限定符出現(xiàn)在范圍表達(dá)式之后。因此,它將應(yīng)用于所包含的整個(gè)范圍表達(dá)式,在本例中,只指定了從 0 到 9 的數(shù)字。 這里沒有使用 '+' 限定符,因?yàn)榈诙换蚝罄m(xù)位置上并不一定需要一個(gè)數(shù)字。同樣也沒有使用 '?' 字符,因?yàn)檫@將把章節(jié)數(shù)限制為只有兩位數(shù)字。在 'Chapter' 和空格字符之后至少要匹配一個(gè)數(shù)字。 如果已知章節(jié)數(shù)限制只有99 章,則可以使用下面的 Visual Basic Scripting Edition 表達(dá)式來指定至少有一位數(shù)字,但不超過兩個(gè)數(shù)字。 /Chapter [0-9]{1,2}/
對(duì) VBScript 可以使用下述正則表達(dá)式: "Chapter [0-9]{1,2}"
上述表達(dá)式的缺點(diǎn)是如果有一個(gè)章節(jié)號(hào)大于 99,它仍只會(huì)匹配前兩位數(shù)字。另一個(gè)缺點(diǎn)是某些人可以創(chuàng)建一個(gè) Chapter 0,而且仍能匹配。一個(gè)更好的用來匹配兩位數(shù)的 Visual Basic Scripting Edition 表達(dá)式如下: /Chapter [1-9][0-9]?/
或者 /Chapter [1-9][0-9]{0,1}/
對(duì) VBScript 而言,下述表達(dá)式與上面等價(jià): "Chapter [1-9][0-9]?"
或者 "Chapter [1-9][0-9]{0,1}"
'* '、 '+' 和 '?' 限定符都稱之為貪婪的,也就是說,他們盡可能多地匹配文字。有時(shí)這根本就不是所希望發(fā)生的情況。有時(shí)則正好希望最小匹配。 例如,你可能要搜索一個(gè) HTML 文檔來查找一處包含在 H1 標(biāo)記中的章節(jié)標(biāo)題。在文檔中該文字可能具有如下形式: <H1>Chapter 1 – Introduction to Regular Expressions</H1>
下面的表達(dá)式匹配從開始的小于號(hào) (<) 到 H1 標(biāo)記結(jié)束處的大于號(hào)之間的所有內(nèi)容。 /<.*>/
VBScript 的正則表達(dá)式為: "<.*>"
如果所要匹配的就是開始的 H1 標(biāo)記,則下述非貪婪地表達(dá)式就只匹配 <H1>。 /<.*?>/
或者 "<.*?>"
通過在 '*'、 '+' 或 '?' 限定符后放置 '?',該表達(dá)式就從貪婪匹配轉(zhuǎn)為了非貪婪或最小匹配。 HOME
|