asp.net中匹配URL網(wǎng)址的正則表達式
%<本人做的是asp.net的項目,內(nèi)容是阻止一個文本框中的某些URL>%
首先,正則表達式:
String check = @"((http|ftp|https)://)(([a-zA-Z0-9\._-]+\.[a-zA-Z]{2,6})|([0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}))(:[0-9]{1,4})*(/[a-zA-Z0-9\&%_\./-~-]*)?";
關(guān)于該正則表達式的說明:
①:該正則表達式匹配的字符串必須以http://、https://、ftp://開頭;
②:該正則表達式能匹配URL或者IP地址;(如:http://www.baidu.com 或者 http://192.168.1.1)
③:該正則表達式能匹配到URL的末尾,即能匹配到子URL;(如能匹配:http://www.baidu.com/s?wd=a&rsv_spt=1&issp=1&rsv_bp=0&ie=utf-8&tn=baiduhome_pg&inputT=1236)
④:該正則表達式能夠匹配端口號;
阻止某些指定的URL:
如果我們在輸入的文本框中要阻止http://www.baidu.com這個URL,傳統(tǒng)的方法是用上面的正則表達式去匹配文本框中的URL,讀出所有的URL之后在跟要阻止的URL去比較,但是這種方法有一個弊端,就是我們讀出的URL是一直到子URL,而我們在配置文件中可能就寫一個母URL,這樣要對check出來的URL進行切割,加上網(wǎng)站默認的端口號是:80,我們要去比較端口號等等,我想出了一種新的方法:
從配置文件中讀出要阻止的URL,組成一個正則表達式,去匹配文本框中,如果能夠匹配到,則阻止掉。
配置文件中應該寫:<add key="DomainCheckBlackUrl" value="baidu.com" />
在代碼中實現(xiàn):
現(xiàn)在一個正則表達式由3部分組成:
1:正則表達式的開頭,可能由任意的字符組成;
2:正則表達式的中間部分:從配置文件中讀出來的部分;
3:正則表達式的結(jié)尾部分:可能有一些子目錄或者端口號等;
首先,從配置文件中讀出URL:string[] serverlist = ConfigurationManager.AppSettings["DomainCheckBlackUrl"].Split(',');(配置文件中以“,”分割)
其次,string start = @"((http|ftp|https)://)([a-zA-Z0-9_-]+\.)*";(正則表達式的開頭)
然后,正則表達式的結(jié)尾: end = @"(:[0-9]{1,4})?((/[a-zA-Z0-9\&%_\./-~-]*)|(?=[^a-zA-Z0-9\.]))";
組合之后的正則表達式: string check = start + @"((?<=[^a-zA-Z0-9])(" + CutStr + "))" + end;
以上是本人的一些小見解,希望對大家能有所幫助。
相關(guān)文章
JavaScript 實現(xiàn)基礎(chǔ) 正則表達式
正則表達式用來從某一段字符串中匹配所需要的字符,這些字符可以非常簡單,也可以非常復雜。JavaScript生來就對正則表達式有著良好的支持,在網(wǎng)絡(luò)的字符搜索匹配中發(fā)揮著重要的作用。2009-08-08javascript高級程序設(shè)計(第三版)學習筆記(一) 正則表達式整理
javascript高級程序設(shè)計 正則表達式整理,想學習js正則表達式的朋友可以參考下2012-08-08PHP 正則表達式特殊字符 [:alnum:] [:alpha:] 等
正則表達式中有兩個很重要的特殊字符就是"[ ]"。他們可以匹配"[]"之中出現(xiàn)過的字符,比如"/[az]/"可以匹配單個字符"a"或者"z";如果把上面的表達式改成這樣"/[a-z]/",就可以匹配任何單個小寫字母,比如"a"、"b"等等。2011-09-09