C#正則過濾HTML標簽并保留指定標簽的方法
本文實例講述了C#正則過濾HTML標簽并保留指定標簽的方法。分享給大家供大家參考,具體如下:
這邊主要看到一個過濾的功能:
public static string FilterHtmlTag(string s) { //<...>標記正則表達式 return Regex.Replace(s, @"<[^>]*>", delegate(Match match) { string v = match.ToString(); //圖片,<p>,<br>正則表達式 Regex rx = new Regex(@"^<(p|br|img.*)>$", RegexOptions.Compiled | RegexOptions.IgnoreCase); // if (rx.IsMatch(v)) { return v; //保留圖片,<p>,<br> } else { return ""; //過濾掉 } }); }
我這邊所有都過濾,所以我直接用正則,不再做匿名委托的保留p和br
content = Regex.Replace(content, @"/\<span(\sclass\=\S*)*\>\S*\<\/span\>/g", "", RegexOptions.IgnoreCase); content = Regex.Replace(content, @"<[^>]*>", "", RegexOptions.IgnoreCase); content = content + "。。。";
PS:這里再為大家提供2款非常方便的正則表達式工具供大家參考使用:
JavaScript正則表達式在線測試工具:
http://tools.jb51.net/regex/javascript
正則表達式在線生成工具:
http://tools.jb51.net/regex/create_reg
更多關于C#相關內(nèi)容感興趣的讀者可查看本站專題:《C#正則表達式用法總結(jié)》、《C#編碼操作技巧總結(jié)》、《C#常見控件用法教程》、《WinForm控件用法總結(jié)》、《C#數(shù)據(jù)結(jié)構與算法教程》、《C#面向?qū)ο蟪绦蛟O計入門教程》及《C#程序設計之線程使用技巧總結(jié)》
希望本文所述對大家C#程序設計有所幫助。
- c#使用htmlagilitypack解析html格式字符串
- C#抓取網(wǎng)頁數(shù)據(jù) 解析標題描述圖片等信息 去除HTML標簽
- C#自寫的一個HTML解析類(類似XElement語法)
- c#使用nsoup解析html亂碼解決方法分享 nsoup教程
- C#下解析HTML的兩種方法介紹
- C# 使用 WebBrowser 實現(xiàn) HTML 轉(zhuǎn)圖片功能的示例代碼
- 利用C#代碼將html樣式文件與Word文檔互換的方法
- C#基于正則表達式抓取a標簽鏈接和innerhtml的方法
- 通過C#實現(xiàn)發(fā)送自定義的html格式郵件
- c# 使用HtmlAgilityPack解析Html
相關文章
C#統(tǒng)計C、C++及C#程序代碼行數(shù)的方法
這篇文章主要介紹了C#統(tǒng)計C、C++及C#程序代碼行數(shù)的方法,較為詳細的分析了C#統(tǒng)計文本文件的原理與相關實現(xiàn)技巧,具有一定參考借鑒價值,需要的朋友可以參考下2015-08-08一文詳解C#中數(shù)組、鏈表、Hash的優(yōu)缺點
在 C# 中,數(shù)組(Array)、鏈表(LinkedList)和哈希表(Hash)是常用的數(shù)據(jù)結(jié)構,每種都有其自身的優(yōu)缺點,本文將通過代碼示例給大家詳細的介紹一下,需要的朋友可以參考下2024-02-02自定義實現(xiàn)Json字符串向C#對象轉(zhuǎn)變的方法
自定義實現(xiàn)Json字符串向C#對象轉(zhuǎn)變的方法,需要的朋友可以參考一下2013-03-03