asp只采集網(wǎng)站可見文本的正則
更新時(shí)間:2008年08月15日 13:12:39 作者:
它可以過慮Js 可以過濾 CSS 過濾HTML標(biāo)識(shí),只采集頁(yè)面的可見文本。
我寫的是這樣:
Function ClearHTMLCode(originCode)
Dim reg
set reg = new RegExp
reg.IgnoreCase = True
reg.Global = True
reg.Pattern = "(<s+cript(.+?)<\/s+cript>)"
originCode= reg.Replace(originCode, "")
reg.Pattern = "(<s+tyle(.+?)<\/s+tyle>)"
originCode= reg.Replace(originCode, "")
reg.Pattern = "<[^>]*>"
originCode= reg.Replace(originCode, "")
ClearHTMLCode = originCode
End Function
不過有一些過濾不了!而且速度太慢!
相關(guān)文章
正則表達(dá)式實(shí)現(xiàn)與或非關(guān)系【推薦】
這篇文章主要介紹了正則表達(dá)式實(shí)現(xiàn)與或非關(guān)系,本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2018-07-07
正則表達(dá)式 口訣 學(xué)習(xí)正則的朋友看看
非常不錯(cuò)的口訣,相信學(xué)習(xí)正則的朋友感覺入門很難,其實(shí)并不是想象中的難,你看下面不知道是哪位高手整理的口訣,看口訣就知道此人對(duì)正則的熟練程度非常高了。2009-04-04
Javascript 字符串字節(jié)長(zhǎng)度計(jì)算函數(shù)代碼與效率分析(for VS 正則)
下面的函數(shù)都是用于計(jì)算字符串長(zhǎng)度,英文算一個(gè),中文算兩個(gè)。效果一樣,效率卻未必一樣,大家可以自行選擇下。2009-12-12
正則用(?>…)實(shí)現(xiàn)固化分組提高效率
用(?>…)實(shí)現(xiàn)固化分組(成功匹配后,回簌時(shí)不會(huì)考慮這個(gè)匹配的字符)2012-10-10
Python 實(shí)用技巧之正則表達(dá)式查找和替換文本的操作方法
這篇文章主要介紹了Python 實(shí)用技巧之正則表達(dá)式查找和替換文本的操作方法,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-08-08
正則基礎(chǔ)之 環(huán)視 Lookaround
環(huán)視只進(jìn)行子表達(dá)式的匹配,不占有字符,匹配到的內(nèi)容不保存到最終的匹配結(jié)果,是零寬度的。環(huán)視匹配的最終結(jié)果就是一個(gè)位置。2009-07-07

