C#使用正則表達式過濾html標簽
更新時間:2016年08月19日 09:12:28 作者:WeihanLi
最近在開發(fā)一個項目,其中有需求要求我們把一段html轉換為一般文本返回,使用正則表達式是明智的選擇,下面小編給介紹下C#使用正則表達式過濾html標簽,需要的朋友參考下
在項目中遇到這樣一個需求,需要將一段html轉換為一般文本返回,萬能的正則表達式來了。
正則表達式來拯救你,代碼如下:
public static string Html2Text(string htmlStr) { if (String.IsNullOrEmpty(htmlStr)) { return ""; } string regEx_style = "<style[^>]*?>[\\s\\S]*?<\\/style>"; //定義style的正則表達式 string regEx_script = "<script[^>]*?>[\\s\\S]*?<\\/script>"; //定義script的正則表達式 string regEx_html = "<[^>]+>"; //定義HTML標簽的正則表達式 htmlStr = Regex.Replace(htmlStr, regEx_style, "");//刪除css htmlStr = Regex.Replace(htmlStr, regEx_script, "");//刪除js htmlStr = Regex.Replace(htmlStr, regEx_html, "");//刪除html標記 htmlStr = Regex.Replace(htmlStr, "\\s*|\t|\r|\n", "");//去除tab、空格、空行 htmlStr = htmlStr.Replace(" ", ""); htmlStr = htmlStr.Replace(""", "");//去除異常的引號" " " htmlStr = htmlStr.Replace(""", ""); return htmlStr.Trim(); }
以上所述是小編給大家介紹的C#使用正則表達式過濾html標簽 ,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
相關文章
C#使用stackalloc分配堆棧內(nèi)存和非托管類型詳解
這篇文章主要為大家介紹了C#使用stackalloc分配堆棧內(nèi)存和非托管類型詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪<BR>2022-12-12