VBS教程:正則表達(dá)式簡(jiǎn)介 -后向引用
后向引用
正則表達(dá)式一個(gè)最重要的特性就是將匹配成功的模式的某部分進(jìn)行存儲(chǔ)供以后使用這一能力。請(qǐng)回想一下,對(duì)一個(gè)正則表達(dá)式模式或部分模式兩邊添加圓括號(hào)將導(dǎo)致這部分表達(dá)式存儲(chǔ)到一個(gè)臨時(shí)緩沖區(qū)中??梢允褂梅遣东@元字符 '?:', '?=', or '?!' 來忽略對(duì)這部分正則表達(dá)式的保存。
所捕獲的每個(gè)子匹配都按照在正則表達(dá)式模式中從左至右所遇到的內(nèi)容存儲(chǔ)。存儲(chǔ)子匹配的緩沖區(qū)編號(hào)從 1 開始,連續(xù)編號(hào)直至最大 99 個(gè)子表達(dá)式。每個(gè)緩沖區(qū)都可以使用 '\n' 訪問,其中 n 為一個(gè)標(biāo)識(shí)特定緩沖區(qū)的一位或兩位十進(jìn)制數(shù)。
后向引用一個(gè)最簡(jiǎn)單,最有用的應(yīng)用是提供了確定文字中連續(xù)出現(xiàn)兩個(gè)相同單詞的位置的能力。請(qǐng)看下面的句子:
Is is the cost of of gasoline going up up?根據(jù)所寫內(nèi)容,上面的句子明顯存在單詞多次重復(fù)的問題。如果能有一種方法無需查找每個(gè)單詞的重復(fù)現(xiàn)象就能修改該句子就好了。下面的 Visual Basic Scripting Edition 正則表達(dá)式使用一個(gè)子表達(dá)式就可以實(shí)現(xiàn)這一功能。
/\b([a-z]+) \1\b/gi等價(jià)的 VBScript 表達(dá)式為:
"\b([a-z]+) \1\b"在這個(gè)示例中,子表達(dá)式就是圓括號(hào)之間的每一項(xiàng)。所捕獲的表達(dá)式包括一個(gè)或多個(gè)字母字符,即由'[a-z]+' 所指定的。該正則表達(dá)式的第二部分是對(duì)前面所捕獲的子匹配的引用,也就是由附加表達(dá)式所匹配的第二次出現(xiàn)的單詞。'\1'用來指定第一個(gè)子匹配。單詞邊界元字符確保只檢測(cè)單獨(dú)的單詞。如果不這樣,則諸如 "is issued" 或 "this is" 這樣的短語都會(huì)被該表達(dá)式不正確地識(shí)別。
在 Visual Basic Scripting Edition 表達(dá)式中,正則表達(dá)式后面的全局標(biāo)志 ('g') 表示該表達(dá)式將用來在輸入字符串中查找盡可能多的匹配。大小寫敏感性由表達(dá)式結(jié)束處的大小寫敏感性標(biāo)記 ('i') 指定。多行標(biāo)記指定可能出現(xiàn)在換行符的兩端的潛在匹配。對(duì) VBScript 而言,在表達(dá)式中不能設(shè)置各種標(biāo)記,但必須使用 RegExp 對(duì)象的屬性來顯式設(shè)置。
使用上面所示的正則表達(dá)式,下面的 Visual Basic Scripting Edition 代碼可以使用子匹配信息,在一個(gè)文字字符串中將連續(xù)出現(xiàn)兩次的相同單詞替換為一個(gè)相同的單詞:
var ss = "Is is the cost of of gasoline going up up?.\n";var re = /\b([a-z]+) \1\b/gim; //創(chuàng)建正則表達(dá)式樣式.var rv = ss.replace(re,"$1"); //用一個(gè)單詞替代兩個(gè)單詞.
最接近的等價(jià) VBScript 代碼如下:
Dim ss, re, rvss = "Is is the cost of of gasoline going up up?." & vbNewLineSet re = New RegExpre.Pattern = "\b([a-z]+) \1\b"re.Global = Truere.IgnoreCase = Truere.MultiLine = Truerv = re.Replace(ss,"$1")請(qǐng)注意在 VBScript 代碼中,全局、大小寫敏感性以及多行標(biāo)記都是使用 RegExp 對(duì)象的適當(dāng)屬性來設(shè)置的。
在replace 方法中使用 $1 來引用所保存的第一個(gè)子匹配。如果有多個(gè)子匹配,則可以用 $2, $3 等繼續(xù)引用。
后向引用的另一個(gè)用途是將一個(gè)通用資源指示符 (URI) 分解為組件部分。假定希望將下述的URI 分解為協(xié)議 (ftp, http, etc),域名地址以及頁面/路徑:
http://msdn.microsoft.com:80/scripting/default.htm下面的正則表達(dá)式可以提供這個(gè)功能。對(duì) Visual Basic Scripting Edition,為:
/(\w+):\/\/([^/:]+)(:\d*)?([^# ]*)/對(duì) VBScript 為:
"(\w+):\/\/([^/:]+)(:\d*)?([^# ]*)"第一個(gè)附加子表達(dá)式是用來捕獲該 web 地址的協(xié)議部分。該子表達(dá)式匹配位于一個(gè)冒號(hào)和兩個(gè)正斜杠之前的任何單詞。第二個(gè)附加子表達(dá)式捕獲該地址的域名地址。該子表達(dá)式匹配不包括 '^'、 '/' 或 ':' 字符的任何字符序列。第三個(gè)附加子表達(dá)式捕獲網(wǎng)站端口號(hào)碼,如果指定了該端口號(hào)。該子表達(dá)式匹配后跟一個(gè)冒號(hào)的零或多個(gè)數(shù)字。最后,第四個(gè)附加子表達(dá)式捕獲由該 web 地址指定的路徑以及\或者頁面信息。該子表達(dá)式匹配一個(gè)和多個(gè)除'#' 或空格之外的字符。
將該正則表達(dá)式應(yīng)用于上面所示的 URI 后,子匹配包含下述內(nèi)容:
RegExp.$1 包含 "http"
RegExp.$2 包含 "msdn.microsoft.com"
RegExp.$3 包含 ":80"
RegExp.$4 包含 "/scripting/default.htm"
- PHP 正則表達(dá)式效率 貪婪、非貪婪與回溯分析(推薦)
- 正則中的回溯定義與用法分析【JS與java實(shí)現(xiàn)】
- 編寫高質(zhì)量的js之正確理解正則表達(dá)式回溯
- 深度分析正則(pcre)最大回溯/遞歸限制
- 小議正則表達(dá)式效率 貪婪、非貪婪與回溯
- PHP正則表達(dá)式的效率 回溯與固化分組
- 正則表達(dá)式之回溯
- AS3 js正則表達(dá)式 反向引用(backreference)
- 詳解JavaScript正則表達(dá)式之分組匹配及反向引用
- php正則表達(dá)式的模式修正符和逆向引用使用介紹
- PHP正則表達(dá)式的逆向引用與子模式分析
- JavaScript正則表達(dá)式之后向引用實(shí)例代碼
- 正則表達(dá)式學(xué)習(xí)教程之回溯引用backreference詳解
相關(guān)文章
腳本 MsAgent組件 微軟精靈 揪出系統(tǒng)自帶的寵物
你知道系統(tǒng)里有一個(gè)隱藏的寵物嗎? 將以下代碼保存為后綴為.vbs的文件,再雙擊運(yùn)行,看看出來什么?一個(gè)可愛的魔法老人!還會(huì)說話、移動(dòng)、吹喇叭……2009-06-06
VBS實(shí)現(xiàn)工作表按指定表頭自動(dòng)分表
下面的VBS腳本就是實(shí)現(xiàn)的工作表按指定表頭(由用戶選擇)自動(dòng)分表功能。需要的朋友只要將要操作的工作表拖放到腳本文件上即可輕松實(shí)現(xiàn)工作表分表2013-01-01
vbs能調(diào)用的系統(tǒng)對(duì)象小結(jié)
這篇文章主要介紹了vbs能調(diào)用的系統(tǒng)對(duì)象小結(jié),需要的朋友可以參考下2018-04-04
用vbs實(shí)現(xiàn)防止計(jì)算機(jī)使用 LMHosts 文件
用vbs實(shí)現(xiàn)防止計(jì)算機(jī)使用 LMHosts 文件...2007-03-03
vbscript LoadPicture函數(shù)使用方法與漏洞利用
因?yàn)橛腥苏f這里L(fēng)oadPicture的代碼有些問題,所以這里給修正下,方便需要的朋友2008-12-12

