C#使用正則表達(dá)式過濾html標(biāo)簽
更新時間:2016年08月19日 09:12:28 作者:WeihanLi
最近在開發(fā)一個項目,其中有需求要求我們把一段html轉(zhuǎn)換為一般文本返回,使用正則表達(dá)式是明智的選擇,下面小編給介紹下C#使用正則表達(dá)式過濾html標(biāo)簽,需要的朋友參考下
在項目中遇到這樣一個需求,需要將一段html轉(zhuǎn)換為一般文本返回,萬能的正則表達(dá)式來了。
正則表達(dá)式來拯救你,代碼如下:
public static string Html2Text(string htmlStr)
{
if (String.IsNullOrEmpty(htmlStr))
{
return "";
}
string regEx_style = "<style[^>]*?>[\\s\\S]*?<\\/style>"; //定義style的正則表達(dá)式
string regEx_script = "<script[^>]*?>[\\s\\S]*?<\\/script>"; //定義script的正則表達(dá)式
string regEx_html = "<[^>]+>"; //定義HTML標(biāo)簽的正則表達(dá)式
htmlStr = Regex.Replace(htmlStr, regEx_style, "");//刪除css
htmlStr = Regex.Replace(htmlStr, regEx_script, "");//刪除js
htmlStr = Regex.Replace(htmlStr, regEx_html, "");//刪除html標(biāo)記
htmlStr = Regex.Replace(htmlStr, "\\s*|\t|\r|\n", "");//去除tab、空格、空行
htmlStr = htmlStr.Replace(" ", "");
htmlStr = htmlStr.Replace(""", "");//去除異常的引號" " "
htmlStr = htmlStr.Replace(""", "");
return htmlStr.Trim();
}

以上所述是小編給大家介紹的C#使用正則表達(dá)式過濾html標(biāo)簽 ,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復(fù)大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
相關(guān)文章
C#判斷指定驅(qū)動器是否是Fat分區(qū)格式的方法
這篇文章主要介紹了C#判斷指定驅(qū)動器是否是Fat分區(qū)格式的方法,涉及C#中DriveFormat屬性的使用技巧,非常具有實用價值,需要的朋友可以參考下2015-04-04
C#使用stackalloc分配堆棧內(nèi)存和非托管類型詳解
這篇文章主要為大家介紹了C#使用stackalloc分配堆棧內(nèi)存和非托管類型詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪<BR>2022-12-12
C#實現(xiàn)獲取Excel中圖片所在坐標(biāo)位置
本文以C#和vb.net代碼示例展示如何來獲取Excel工作表中圖片的坐標(biāo)位置,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2022-04-04

