正則表達(dá)式輕松消除HTML代碼
更新時(shí)間:2009年02月27日 20:46:18 作者:
正則表達(dá)式再次讓我震撼,寥寥數(shù)行代碼就可以完成普通代碼不易實(shí)現(xiàn)的功能,至少是實(shí)現(xiàn)起來(lái)比較復(fù)雜的功能。
一、清楚內(nèi)容中的Javsscript 代碼
Function ClearJSCode(originCode)
Dim reg
set reg = New RegExp
reg.Pattern = "<SCRIPT[^<]*</SCRIPT>"
reg.IgnoreCase = True
reg.Global = True
clearJSCode = reg.Replace(originCode, "")
End Function
二、清除內(nèi)容中的HTML代碼
Function ClearHTMLCode(originCode)
Dim reg
set reg = new RegExp
reg.Pattern = "<[^>]*>"
reg.IgnoreCase = True
reg.Global = True
ClearHTMLCode = reg.Replace(originCode, "")
End Function
現(xiàn)在好多網(wǎng)站的內(nèi)容都是使用采集程序生成的,使用上邊的代碼就可以輕松的將內(nèi)容中的HTML和JS代碼清除掉。
復(fù)制代碼 代碼如下:
Function ClearJSCode(originCode)
Dim reg
set reg = New RegExp
reg.Pattern = "<SCRIPT[^<]*</SCRIPT>"
reg.IgnoreCase = True
reg.Global = True
clearJSCode = reg.Replace(originCode, "")
End Function
二、清除內(nèi)容中的HTML代碼
復(fù)制代碼 代碼如下:
Function ClearHTMLCode(originCode)
Dim reg
set reg = new RegExp
reg.Pattern = "<[^>]*>"
reg.IgnoreCase = True
reg.Global = True
ClearHTMLCode = reg.Replace(originCode, "")
End Function
現(xiàn)在好多網(wǎng)站的內(nèi)容都是使用采集程序生成的,使用上邊的代碼就可以輕松的將內(nèi)容中的HTML和JS代碼清除掉。
相關(guān)文章
正則表達(dá)式高級(jí)技巧及實(shí)例詳解 笨活兒
正則表達(dá)式(Regular Expression, abbr. regex) 功能強(qiáng)大,能夠用于在一大串字符里找到所需信息。2009-11-11java正則表達(dá)式四種常用的處理方式(匹配、分割、替代、獲?。?/a>
這篇文章主要為大家詳細(xì)介紹了java正則表達(dá)式四種常用的處理方式,包括匹配、分割、替代、獲取四種,感興趣的小伙伴們可以參考一下2016-06-06c# 正則表達(dá)式對(duì)網(wǎng)頁(yè)進(jìn)行有效內(nèi)容抽取
本問(wèn)主要總結(jié)了用正則表達(dá)式對(duì)網(wǎng)頁(yè)進(jìn)行有效內(nèi)容提取的具體實(shí)現(xiàn)方法,并給出了c#代碼2009-03-03正則表達(dá)式 特殊字符應(yīng)用分析[簡(jiǎn)單詳細(xì)入門必看]
網(wǎng)上的東西,都沒(méi)有這個(gè)詳細(xì),對(duì)于想入手正則表達(dá)式高級(jí)應(yīng)用的朋友,也是個(gè)不錯(cuò)的資料參考。2008-11-11