asp 使用正則表達(dá)式替換word中的標(biāo)簽,轉(zhuǎn)為純文本
更新時間:2010年04月28日 22:35:48 作者:
asp里使用正則表達(dá)式清除后臺編輯器里復(fù)制粘貼內(nèi)容的word格式,將其轉(zhuǎn)換成純文本
公司客戶在使用網(wǎng)站后臺編輯添加修改內(nèi)容時,經(jīng)常是直接從word文檔里復(fù)制內(nèi)容到編輯器里后就提交。結(jié)果是在內(nèi)容顯示頁面上是五花八門的樣式,有時也需要部分純文本內(nèi)容作為摘錄使用,這些都需要清除word格式。改變客戶的習(xí)慣要客戶先復(fù)制到記事本里再粘貼到編輯器里編輯是很難的,所以從我們自己改變起。從網(wǎng)上百度了若干清除word格式的正則,使用效果不甚理想,所以自己寫了清除word格式的asp函數(shù),能滿足我們自己的使用需求。函數(shù)如下:
function cleanWord(html)
dim regEx
set regEx=New RegExp
regEx.IgnoreCase=True
regEx.Global=True
regEx.Pattern="<[^>]*>" '清除所有<>之間的內(nèi)容
html = regEx.replace(html,"" )
regEx.Pattern="{[^}]*}" '清除所有{}之間的內(nèi)容
html = regEx.replace(html,"" )
regEx.Pattern="/[^/]*/" '清除所有/**/之間的注釋
html = regEx.replace(html,"" )
html =Replace(html,"table.MsoNormalTable","") '替換掉漏網(wǎng)的單詞
cleanWord= html
set regEx=nothing
end function
復(fù)制代碼 代碼如下:
function cleanWord(html)
dim regEx
set regEx=New RegExp
regEx.IgnoreCase=True
regEx.Global=True
regEx.Pattern="<[^>]*>" '清除所有<>之間的內(nèi)容
html = regEx.replace(html,"" )
regEx.Pattern="{[^}]*}" '清除所有{}之間的內(nèi)容
html = regEx.replace(html,"" )
regEx.Pattern="/[^/]*/" '清除所有/**/之間的注釋
html = regEx.replace(html,"" )
html =Replace(html,"table.MsoNormalTable","") '替換掉漏網(wǎng)的單詞
cleanWord= html
set regEx=nothing
end function
相關(guān)文章
利用AdoDb.Stream對象來讀取UTF-8格式的文本文件
利用AdoDb.Stream對象來讀取UTF-8格式的文本文件...2006-10-10ASP生成隨機數(shù) ASP生成不重復(fù)隨機數(shù)
這篇文章主要介紹了ASP生成不重復(fù)隨機數(shù)的方法,需要的朋友可以參考下2014-05-05非常不錯的ASP+Access數(shù)據(jù)庫的終極安全大法18則
非常不錯的ASP+Access數(shù)據(jù)庫的終極安全大法18則...2007-06-06Coolite 中前臺獲取 GridPanel 當(dāng)前選擇行值的代碼
掌握獲取 GridPanel 當(dāng)前行的各個字段值的方法,需要的朋友可以參考下。2010-06-06