JavaScript中常用的正則表達式日常整理(全)
//校驗是否全由數(shù)字組成
function isDigit(s) { var patrn=/^[0-9]{1,20}$/; if (!patrn.exec(s)) return false return true }
匹配中文字符的正則表達式: [u4e00-u9fa5]
評注:匹配中文還真是個頭疼的事,有了這個表達式就好辦了
匹配雙字節(jié)字符(包括漢字在內):[^x00-xff]
評注:可以用來計算字符串的長度(一個雙字節(jié)字符長度計2,ASCII字符計1)
匹配空白行的正則表達式:ns*r
評注:可以用來刪除空白行
匹配HTML標記的正則表達式:< (S*?)[^>]*>.*?|< .*? />
評注:網上流傳的版本太糟糕,上面這個也僅僅能匹配部分,對于復雜的嵌套標記依舊無能為力
匹配首尾空白字符的正則表達式:^s*|s*$
評注:可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達式
匹配Email地址的正則表達式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
評注:表單驗證時很實用
匹配網址URL的正則表達式:[a-zA-z]+://[^s]*
評注:網上流傳的版本功能很有限,上面這個基本可以滿足需求
匹配帳號是否合法(字母開頭,允許5-16字節(jié),允許字母數(shù)字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
評注:表單驗證時很實用
匹配國內電話號碼:d{3}-d{8}|d{4}-d{7}
評注:匹配形式如 0511-4405222 或 021-87888822
匹配騰訊QQ號:[1-9][0-9]{4,}
評注:騰訊QQ號從10000開始
匹配中國郵政編碼:[1-9]d{5}(?!d)
評注:中國郵政編碼為6位數(shù)字
匹配身份證:d{15}|d{18}
評注:中國的身份證為15位或18位
匹配ip地址:d+.d+.d+.d+
評注:提取ip地址時有用
匹配特定數(shù)字:
^[1-9]d*$ //匹配正整數(shù)
^-[1-9]d*$ //匹配負整數(shù)
^-?[1-9]d*$ //匹配整數(shù)
^[1-9]d*|0$ //匹配非負整數(shù)(正整數(shù) + 0)
^-[1-9]d*|0$ //匹配非正整數(shù)(負整數(shù) + 0)
^[1-9]d*.d*|0.d*[1-9]d*$ //匹配正浮點數(shù)
^-([1-9]d*.d*|0.d*[1-9]d*)$ //匹配負浮點數(shù)
^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$ //匹配浮點數(shù)
^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$ //匹配非負浮點數(shù)(正浮點數(shù) + 0)
^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$ //匹配非正浮點數(shù)(負浮點數(shù) + 0)
評注:處理大量數(shù)據(jù)時有用,具體應用時注意修正
匹配特定字符串:
^[A-Za-z]+$ //匹配由26個英文字母組成的字符串
^[A-Z]+$ //匹配由26個英文字母的大寫組成的字符串
^[a-z]+$ //匹配由26個英文字母的小寫組成的字符串
^[A-Za-z0-9]+$ //匹配由數(shù)字和26個英文字母組成的字符串
^w+$ //匹配由數(shù)字、26個英文字母或者下劃線組成的字符串
在使用RegularExpressionValidator驗證控件時的驗證功能及其驗證表達式介紹如下:
只能輸入數(shù)字:“^[0-9]*$”
只能輸入n位的數(shù)字:“^d{n}$”
只能輸入至少n位數(shù)字:“^d{n,}$”
只能輸入m-n位的數(shù)字:“^d{m,n}$”
只能輸入零和非零開頭的數(shù)字:“^(0|[1-9][0-9]*)$”
只能輸入有兩位小數(shù)的正實數(shù):“^[0-9]+(.[0-9]{2})?$”
只能輸入有1-3位小數(shù)的正實數(shù):“^[0-9]+(.[0-9]{1,3})?$”
只能輸入非零的正整數(shù):“^+?[1-9][0-9]*$”
只能輸入非零的負整數(shù):“^-[1-9][0-9]*$”
只能輸入長度為3的字符:“^.{3}$”
只能輸入由26個英文字母組成的字符串:“^[A-Za-z]+$”
只能輸入由26個大寫英文字母組成的字符串:“^[A-Z]+$”
只能輸入由26個小寫英文字母組成的字符串:“^[a-z]+$”
只能輸入由數(shù)字和26個英文字母組成的字符串:“^[A-Za-z0-9]+$”
只能輸入由數(shù)字、26個英文字母或者下劃線組成的字符串:“^w+$”
驗證用戶密碼:“^[a-zA-Z]w{5,17}$”正確格式為:以字母開頭,長度在6-18之間,
只能包含字符、數(shù)字和下劃線。
驗證是否含有^%&',;=?$”等字符:“[^%&',;=?$x22]+”
只能輸入漢字:“^[u4e00-u9fa5],{0,}$”
驗證Email地址:“^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$”
驗證InternetURL:“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$”
驗證電話號碼:“^((d{3,4})|d{3,4}-)?d{7,8}$”
正確格式為:“XXXX-XXXXXXX”,“XXXX-XXXXXXXX”,“XXX-XXXXXXX”,
“XXX-XXXXXXXX”,“XXXXXXX”,“XXXXXXXX”。
驗證身份證號(15位或18位數(shù)字):“^d{15}|d{}18$”
驗證一年的12個月:“^(0?[1-9]|1[0-2])$”正確格式為:“01”-“09”和“1”“12”
驗證一個月的31天:“^((0?[1-9])|((1|2)[0-9])|30|31)$”
正確格式為:“01”“09”和“1”“31”。
匹配中文字符的正則表達式: [u4e00-u9fa5]
匹配雙字節(jié)字符(包括漢字在內):[^x00-xff]
匹配空行的正則表達式:n[s| ]*r
匹配HTML標記的正則表達式:/< (.*)>.*|< (.*) />/
匹配首尾空格的正則表達式:(^s*)|(s*$)
匹配Email地址的正則表達式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
匹配網址URL的正則表達式:http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?
(1)應用:計算字符串的長度(一個雙字節(jié)字符長度計2,ASCII字符計1)
String.prototype.len=function(){return this.replace([^x00-xff]/g,”aa”).length;}
(2)應用:javascript中沒有像vbscript那樣的trim函數(shù),我們就可以利用這個表達式來實現(xiàn)
String.prototype.trim = function() { return this.replace(/(^s*)|(s*$)/g, “”); }
(3)應用:利用正則表達式分解和轉換IP地址
function IP2V(ip) //IP地址轉換成對應數(shù)值 { re=/(d+).(d+).(d+).(d+)/g //匹配IP地址的正則表達式 if(re.test(ip)) { return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1 } else { throw new Error(”Not a valid IP address!”) } }
(4)應用:從URL地址中提取文件名的javascript程序
s=”http://www.9499.net/page1.htm”; s=s.replace(/(.*/){0,}([^.]+).*/ig,”$2″) ; //Page1.htm
(5)應用:利用正則表達式限制網頁表單里的文本框輸入內容
用正則表達式限制只能輸入中文:onkeyup=”value=”/blog/value.replace(/["^u4E00-u9FA5]/g,”) ”
onbeforepaste=”clipboardData.setData('text',clipboardData.getData('text').replace(/[^u4E00-u9FA5]/g,”))”
用正則表達式限制只能輸入全角字符: onkeyup=”value=”/blog/value.replace(/["^uFF00-uFFFF]/g,”) ”
onbeforepaste=”clipboardData.setData('text',clipboardData.getData('text').replace(/[^uFF00-uFFFF]/g,”))”
用正則表達式限制只能輸入數(shù)字:onkeyup=”value=”/blog/value.replace(/["^d]/g,”) “onbeforepaste= “clipboardData.setData
('text',clipboardData.getData('text').replace(/[^d]/g,”))”
用正則表達式限制只能輸入數(shù)字和英文:onkeyup=”value=”/blog/value.replace(/[W]/g,””) “onbeforepaste=”clipboardData.setData
('text',clipboardData.getData('text').replace(/[^d]/g,”
中正則表達式,js去掉html標記,去掉字符,截取字符(2009-01-11 10:20:14)
2007-07-08 15:26
1,得到網頁上的鏈接地址:
string matchString = @"<a[^>]+href=\s*(?:'(?<href>[^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>";
2,得到網頁的標題:
string matchString = @"<title>(?<title>.*)</title>";
3,去掉網頁中的所有的html標記:
string temp = Regex.Replace(html, "<[^>]*>", ""); //html是一個要去除html標記的文檔
java 中去掉網頁中的所有標簽
str = str.replaceAll("<[^>]*>", "");
4, string matchString = @"<title>([\S\s\t]*?)</title>";
5,js去掉所有html標記的函數(shù):
function delHtmlTag(str) { return str.replace(/<\/?.+?>/g,"");//去掉所有的html標記 }
這個可能IE5會錯,那用這個,梅花的:
function delHtmlTag(str) { return str.replace(/<[^>]+>/g,"");//去掉所有的html標記 }
校驗登錄名:只能輸入5-20個以字母開頭、可帶數(shù)字、“_”、“.”的字串
function isRegisterUserName(s) { var patrn=/^[a-zA-Z]{1}([a-zA-Z0-9]|[._]){4,19}$/; if (!patrn.exec(s)) return false return true }
來源:正則匹配空格的問題
字符串內字符鍵有空格,但是空格的數(shù)量可能不一致,通過正則將空格的個數(shù)統(tǒng)一變?yōu)橐粋€。
例如:藍 色 理 想
變成:藍 色 理 想
aobert的正則:
<script type="text/javascript"> var str="藍 色 理 想" var reg=/\s+/g str = str.replace(reg," ") document.write(str) </script>
判斷字符串是不是由數(shù)字組成
來源:有沒有簡單的方法判斷字符串由數(shù)字組成?
這個正則比較簡單,寫了一個測試
<script type="text/javascript"> function isDigit(str){ var reg = /^\d*$/; return reg.test(str); } var str = "7654321"; document.write(isDigit(str)); var str = "test"; document.write(isDigit(str)); </script>
電話號碼正則
來源:想問一下關于電話號碼的正則判斷
:求一個驗證電話號碼的JS正則
/^\d{3,4}-\d{7,8}(-\d{3,4})?$/區(qū)號必填為3-4位的數(shù)字,區(qū)號之后用“-”與電話號碼連接
^\d{3,4}-電話號碼為7-8位的數(shù)字
\d{7,8}分機號碼為3-4位的數(shù)字,非必填,但若填寫則以“-”與電話號碼相連接
(-\d{3,4})?手機號碼正則表達式
正則驗證手機號,忽略前面的0,支持130-139,150-159。忽略前面0之后判斷它是11位的。
cloeft的正則:
/^0*(13|15)\d{9}$/ ^0*匹配掉開頭任意數(shù)量的0。
由于手機號碼是13任意數(shù)字9位,和15任意數(shù)字9位,所以可以用(13|15)\d{9}匹配。
測試代碼如下:
function testReg(reg,str){ return reg.test(str); } var reg = /^0*(13|15)\d{9}$/; var str = '13889294444'; var str2 = '12889293333'; var str3 = '23445567'; document.write(testReg(reg,str)+'<br />'); document.write(testReg(reg,str2)+'<br />'); document.write(testReg(reg,str3)+'<br />');
使用正則表達式實現(xiàn)刪除字符串中的空格:
來源:請問js中有沒有去掉空格的函數(shù)
代碼以及測試代碼如下:
<script type="text/javascript"> //刪除字符串兩側的空白字符。 function trim(str){ return str.replace(/^\s+|\s+$/g,''); } //刪除字符串左側的空白字符。 function ltrim(str){ return str.replace(/^\s+/g,''); } //刪除字符串右側的空白字符。 function rtrim(str){ return str.replace(/\s+$/g,''); } //以下為測試代碼 var trimTest = " 123456789 "; //前后各有一個空格。 document.write('length:'+trimTest.length+'<br />'); //使用前 document.write('ltrim length:'+ltrim(trimTest).length+'<br />'); //使用ltrim后 document.write('rtrim length:'+rtrim(trimTest).length+'<br />'); //使用rtrim后 document.write('trim length:'+trim(trimTest).length+'<br />'); //使用trim后 </script>
測試的結果如下:
length:11
ltrim length:10
rtrim length:10
trim length:9 限制文本框只能輸入數(shù)字和小數(shù)點等等
來源:文本框輸入限制的問題????
只能輸入數(shù)字和小數(shù)點
var reg = /^\d*\.?\d{0,2}$/ 開頭有若干個數(shù)字,中間有0個或者一個小數(shù)點,結尾有0到2個數(shù)字。
只能輸入小寫的英文字母和小數(shù)點,和冒號,正反斜杠(:./\)
var reg = /[a-z\.\/\\:]+/; a-z包括了小寫的英文字母,\.是小數(shù)點,\/和\\分別是左右反斜線,最后是冒號。整個組成一個字符集和代碼任一均可,最后在加上+,1或者多個。
替換小數(shù)點前內容為指定內容
來源:求一正則表達式!
請問 怎么把這個字符串的小數(shù)點前面的字符替換為我自定義的字符串?。?br />
例如:infomarket.php?id=197 替換為 test.php?id=197
應該可以把第一個點“.”之前的所有單詞字符替換為test就可以了。我寫的正則如下:
<script type="text/javascript"> var str = "infomarket.php?id=197"; var reg = /^\w*/ig; //匹配字符串開頭的任意個單詞字符 str = str.replace(reg,'test'); document.write(str); </script>
原帖的有點復雜,沒太看明白。
只匹配中文的正則表達式
來源:關于上傳的時候,只能選擇中文名稱的圖片(是否可以用toASCII方法呢?)
前兩天看的《JavaScript開發(fā)王》里恰好有中文的unicode范圍,正則如下:
/[\u4E00-\u9FA5\uf900-\ufa2d]/ 寫了一個簡單的測試,會把所有的中文替換成“哦”。
<script type="text/javascript"> var str = "有中文?and English."; var reg = /[\u4E00-\u9FA5\uf900-\ufa2d]/ig; str = str.replace(reg,'哦'); document.write(str); </script>
返回字符串的中文字符個數(shù)
來源:有沒返回中文字符字節(jié)的函數(shù)!
一般的字符長度對中文和英文都是不分別的 如JS里的length,那么如何返回字符串中中文字符的個數(shù)呢?guoshuang老師在原帖中給出了解決方案,我又沒看懂……
不過我自己也想到了一個辦法:先去掉非中文字符,再返回length屬性。函數(shù)以及測試代碼如下:
<script type="text/javascript"> function cLength(str){ var reg = /[^\u4E00-\u9FA5\uf900-\ufa2d]/g; //匹配非中文的正則表達式 var temp = str.replace(reg,''); return temp.length; } var str = "中文123"; document.write(str.length+'<br />'); document.write(cLength(str)); </script>
結果:
5
2
中文兩個,數(shù)字三個,正確。
下面的測試也正確。
var str = "中文123tets@#!#%$#[][{}"; document.write(str.length+'<br />'); document.write(cLength(str));
正則表達式取得匹配IP地址前三段
來源:如何用正則取IP前3段
192.168.118.101,192.168.118.72, 192.168.118.1都替換成:192.168.118
只要匹配掉最后一段并且替換為空字符串就行了,正則如下:
/\.\d{1,3}$/ 匹配結尾的.n,.nn或者.nnn。
測試代碼如下:
function replaceReg(reg,str){ return str.replace(reg,'') } var reg = /\.\d{1,3}$/; var str = '192.168.118.101'; var str2 = '192.168.118.72'; var str3 = '192.168.118.1'; document.write(replaceReg(reg,str)+'<br />'); document.write(replaceReg(reg,str2)+'<br />'); document.write(replaceReg(reg,str3)+'<br />');
相似的有,這個帖子里有一個驗證IP地址的方法:求檢驗MAC地址的正則表達例子
匹配<ul>與<ul>之間的內容
來源:請教個正則的小問題吧
<ul>safsf<ul>safsf</ul><ul>safsf</ul></ul>
用正則可以得到 <ul>起到下個<ul> 之間的內容。
正則如下:
/<ul>[\s\S]+?<ul>/i 首先匹配兩側的ul標簽,中間的[\s\S]+?可以匹配一個或者多個任意字符,一定要非貪婪,否則會匹配<ul>safsf<ul>safsf</ul><ul>。
用正則表達式獲得文件名
來源:C:\006.jpg
c:\images\tupian\006.jpg
可能是直接在盤符根目錄下,也可能在好幾層目錄下,要求替換到只剩文件名。
xlez的正則如下:
/[^\\\/]*[\\\/]+/g 首先匹配非左右斜線字符0或多個,然后是左右斜線一個或者多個。形如“xxx/”或者“xxx\”或者“/”或者“\”
函數(shù)以及測試代碼:
<script type="text/javascript"> function getFileName(str){ var reg = /[^\\\/]*[\\\/]+/g; //xxx\或者是xxx/ str = str.replace(reg,''); return str; } var str = "c:\\images\\tupian\\006.jpg"; document.write(getFileName(str)+'<br />'); var str2 = "c:/images/tupian/test2.jpg"; document.write(getFileName(str2)); </script>
注意,\需要轉義。
絕對路徑變相對路徑
來源:討論一個正則
將<IMG height="120" width="800" src="
其中網址可能改變,例如http://localhost等等。 cloudchen的正則: /http:\/\/[^\/]+/ 首先是http://,然后[^\/]+找過1個或者多個非/字符,因為遇到第一個/表示已經到目錄了,停止匹配。 測試代碼如下: 用戶名正則 來源:求正則,急急呀?。?/p>
用于用戶名注冊,,用戶名只 能用 中文、英文、數(shù)字、下劃線、4-16個字符。 hansir和解決方案弄成正則: /^[\u4E00-\u9FA5\uf900-\ufa2d\w]{4,16}$/ 中文字符或者單詞字符,4到16個。實現(xiàn)4到16結成到正則里的關鍵就是開始^和結束$,這就等于整個字符串只能有這些匹配的內容,不能有多余的。 函數(shù)和測試代碼如下: 匹配英文地址 來源:-求助- 正則問題 規(guī)則如下: 包含 "點", "字母","空格","逗號","數(shù)字",但開頭和結尾不能是除字母外任何字符。 [\.a-zA-Z\s,0-9]這個字符集就實現(xiàn)了字母,空格,逗號和數(shù)字。最終正則如下: /^[a-zA-Z][\.a-zA-Z\s,0-9]*?[a-zA-Z]+$/ 開頭必須有字母,結束也必須是一個以上字母。測試代碼如下: 正則匹配價格 來源:為什么這個正則不起作用啊?急啊? 價格的格式應該如下: 開頭數(shù)字若干位,可能有一個小數(shù)點,小數(shù)點后面可以有兩位數(shù)字。hansir給出的對應正則如下: /^(\d*\.\d{0,2}|\d+).*$/ hansir給出的測試代碼如下: 身份證號碼的匹配 來源:關于正則的,大家?guī)蛶兔?急,在線等 身份證號碼可以是15位或者是18位,其中最后一位可以是X。其它全是數(shù)字,正則如下: /^(\d{14}|\d{17})(\d|[xX])$/ 開頭是14位或者17位數(shù)字,結尾可以是數(shù)字或者是x或者是X。 測試代碼如下: 要求文本有指定行數(shù) 來源:[求助]求一句正則表達式的寫法 匹配至少兩行的字符串,每行都為非空字符。 只要匹配到[\n\r]就表示有換行了,再保證換行的兩段都不是空字符就可以了。正則如下: /\S+?[\n\r]\S+?/i 這個正則的應用應該是用在textarea里,如果是如下要求:可以支持所有字符,中間可帶空格,可以包括英文、數(shù)字、中文、標點 這樣的話,只要針對空格再改一下就行了。(按照非空的要求,上面有不能匹配“字符+空格+換行+字符”的字符串)。修改如下: /\S+?\s*?[\n\r]\s*?\S+?/i 單詞首字母大寫 每單詞首字大寫,其他小寫。如blue idea轉換為Blue Idea,BLUE IDEA也轉換為Blue Idea cloeft的正則: /\b(\w)|\s(\w)/g 所謂“首字母”包括兩種情況:第一種是邊界(開頭)的單詞字符,一種是空格之后的新單詞的第一個字母。測試代碼如下: 正則驗證日期格式 來源:yyyy-mm-dd的正則怎樣寫??? yyyy-mm-dd格式 正則如下: /^\d{4}-\d{1,2}-\d{1,2}$/ 4位數(shù)字,橫線,1或者2位數(shù)字,再橫線,最后又是1或者2位數(shù)字。 測試代碼如下: 第二種格式:來源:求一正則表達式 yyyy-mm-dd 或 yyyy/mm/dd 用“或”簡單地修改一下就行了。 /^\d{4}(-|\/)\d{1,2}(-|\/)\d{1,2}$/ 去掉文件的后綴名 來源:求一個正則 www.abc.com/dc/fda.asp變?yōu)?a >www.abc.com/dc/fda
<script type="text/javascript">
var str = '<IMG height="120" width="800" \src="http://23.123.22.12/image/somepic.gif">';
var reg = /http:\/\/[^\/]+/;
str = str.replace(reg,"");
alert(str)
</script>
<script type="text/javascript">
function isEmail(str){
var reg = /^[\u4E00-\u9FA5\uf900-\ufa2d\w]{4,16}$/;
return reg.test(str);
}
var str = '超級無敵用戶名regExp';
var str2 = '搗亂的@';
var str3 = '太短'
var str4 = '太長longlonglonglonglonglonglonglong'
document.write(isEmail(str)+'<br />');
document.write(isEmail(str2)+'<br />');
document.write(isEmail(str3)+'<br />');
document.write(isEmail(str4)+'<br />');
</script>
<script type="text/javascript">
function testReg(reg,str){
return reg.test(str);
}
var reg = /^[a-zA-Z][\.a-zA-Z\s,0-9]*?[a-zA-Z]+$/;
var str = 'No.8,ChangAn Street,BeiJing,China';
var str2 = '8.No,ChangAn Street,BeiJing,China';
var str3 = 'No.8,ChangAn Street,BeiJing,China88';
document.write(testReg(reg,str)+'<br />')
document.write(testReg(reg,str2)+'<br />')
document.write(testReg(reg,str3)+'<br />')
</script>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
<title>無標題文檔</title>
<script type="text/javascript">
function checkPrice(me){
if(!(/^(?:\d+|\d+\.\d{0,2})$/.test(me.value))){
me.value = me.value.replace(/^(\d*\.\d{0,2}|\d+).*$/,'$1');
}
}
</script>
</head>
<body>
<input type="text" onkeyup="checkPrice(this);"/>
</body>
</html>
<script type="text/javascript">
function testReg(reg,str){
return reg.test(str);
}
var reg = /^(\d{14}|\d{17})(\d|[xX])$/;
var str = '123456789012345';//15位
var str2 = '123456789012345678';//18位
var str3 = '12345678901234567X';//最后一位是X
var str4 = '1234';//位數(shù)不對
document.write(testReg(reg,str)+'<br />');
document.write(testReg(reg,str2)+'<br />');
document.write(testReg(reg,str3)+'<br />');
document.write(testReg(reg,str4)+'<br />');
</script>
來源:求個正則,處理英文單詞或詞組的
<script type="text/javascript">
function replaceReg(reg,str){
str = str.toLowerCase();
return str.replace(reg,function(m){return m.toUpperCase()})
}
var reg = /\b(\w)|\s(\w)/g;
var str = 'blue idea';
var str2 = 'BLUE IDEA';
var str3 = 'Test \n str is no good!';
var str4 = 'final test';
document.write(replaceReg(reg,str)+'<br />');
document.write(replaceReg(reg,str2)+'<br />');
document.write(replaceReg(reg,str3)+'<br />');
document.write(replaceReg(reg,str4)+'<br />');
</script>
<script type="text/javascript">
function testReg(reg,str){
return reg.test(str);
}
var reg = /^\d{4}-\d{1,2}-\d{1,2}$/;
var str = '2008-8-8';
var str2 = '2008-08-08';
var str3 = '08-08-2008';
var str4 = '2008 08 08';
document.write(testReg(reg,str)+'<br />');
document.write(testReg(reg,str2)+'<br />');
document.write(testReg(reg,str3)+'<br />');
document.write(testReg(reg,str4)+'<br />');
</script>
如果文件后綴已知的話這個問題就非常簡單了,正則如下:
/\.asp$/ 匹配最后的.asp而已,測試代碼如下:
<script type="text/javascript"> function delAspExtension(str){ var reg = /\.asp$/; return str.replace(reg,''); } var str = 'www.abc.com/dc/fda.asp'; document.write(delAspExtension(str)+'<br />'); </script>
如果文件名未知的話就用這個正則:/\.\w+$/,測試代碼如下:
<script type="text/javascript"> function delExtension(str){ var reg = /\.\w+$/; return str.replace(reg,''); } var str = 'example.com/dc/fda.asp'; document.write(delExtension(str)+'<br />'); var str2 = 'test/regular/fda.do'; document.write(delExtension(str2)+'<br />'); var str3 = 'example.com/dc/fda.strange_extension'; document.write(delExtension(str3)+'<br />'); </script>
驗證郵箱的正則表達式
來源:找javascript寫的表單檢查代碼!
fuchangxi的正則:
/^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+/ 開始必須是一個或者多個單詞字符或者是-,加上@,然后又是一個或者多個單詞字符或者是-。然后是點“.”和單詞字符和-的組合,可以有一個或者多個組合。
<script type="text/javascript"> function isEmail(str){ var reg = /^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+/; return reg.test(str); } var str = 'test@hotmail.com'; document.write(isEmail(str)+'<br />'); var str2 = 'test@sima.vip.com'; document.write(isEmail(str2)+'<br />'); var str3 = 'te-st@qq.com.cn'; document.write(isEmail(str3)+'<br />'); var str4 = 'te_st@sima.vip.com'; document.write(isEmail(str4)+'<br />'); var str5 = 'te.._st@sima.vip.com'; document.write(isEmail(str5)+'<br />'); </script>
我不太了解郵箱的具體規(guī)則。感覺這個正則比較簡單,EMAIL校驗 正則 討論 求解里有比較詳細的郵箱正則討論。
匹配源代碼中的鏈接
來源:正則
能夠匹配HTML代碼中鏈接的正則。
原帖正則:
/<a href=".+?">.+?<\/a>/g 感覺有點嚴格,首先要<a href="".+?">有,而且href屬性可以是一個或者多個除換行外任意字符(非貪婪)。后面是.+?<\/a>,一個或者多個除換行外任意字符(非貪婪),再加上結束標簽。
有個問題,如果a的起始標簽最后有空格,或者除了href還有其它屬性的話,上面的正則就不能匹配這個鏈接了。
例如:
<a href="asdfs" >……多了個空格。
<a id="xx" href=""asdfs">……前面有屬性。
……
重寫正則:
/<a\s(\s*\w*?=".+?")*(\s*href=".+?")(\s*\w*?=".+?")*\s*>[\s\S]*?<\/a>/ 思路如下:首先要有<a和一個空格。/<a\s/
第一個(\s*\w*?=".+?")*
可以匹配一個屬性,屬性前面可能有或者沒有多余的空格,用\s*匹配;屬性名肯定是單詞字符,用\w*?匹配;=".+?"就是匹配屬性值了非換行字符若干個;整個括號外面加個*表示可能有任意多個屬性。
(\s*href=".+?")
匹配href,它也是一個屬性,所以只要把上面子正則表達式中的\w修改為href=就行了。
(\s*\w*?=".+?")*重復第一個子正則表達式,再次接受任意個屬性。
\s*>,屬性最后再加上若干個空格和>。
[\s\S]*?,鏈接的文字,可能有任何字符組成,若干個,非貪婪。
<\/a>最后是結束標簽。
補充:屬性名和=之間,以及=和屬性值之間也可能有空格。所以要再加上幾個\s*。
最后的實例代碼如下:
<script type="text/javascript"> function findLinks(str){ var reg = /<a\s(\s*\w*?\s*=\s*".+?")*(\s*href\s*=\s*".+?")(\s*\w*?\s*=\s*".+?") *\s*>[\s\S]*?<\/a>/g; var arr = str.match(reg); for(var i=0;i<arr.length;i++){ //alert(arr[i]); document.write('link:'+arr[i]+'<br />'); } } var str = '<p>測試鏈接:<a id = "test" title="無敵">經典論壇 </a></p><a? ? >藍色理想</a>'; var arr = findLinks(str); </script>
會把所有的鏈接在頁面直接顯示出來。注意,
本帖遺留問題:如何執(zhí)行從右到左的匹配。貌似JS或者VBS沒有提供這個功能2、JS或者VBS不支持 后行斷言。。用什么方法實現(xiàn)這個功能。
匹配鏈接的文字
來源:求一正則?
代碼:<a href="#>這里要保存</a>,只保存鏈接的文本內容,標簽信息刪掉。
前面寫過一個匹配鏈接的正則:
/<a\s(\s*\w*?=".+?")*(\s*href=".+?")(\s*\w*?=".+?")*\s*>[\s\S]*?<\/a>/ 不過我們需要捕獲的是文字內容,所以需要做一定的修改。第一步就是在所有的括號內都加上?:表示不捕獲。第二步就是再多加一個括號放在[\s\S]*?兩側,這樣就可以捕獲到鏈接的文字內容了。最后正則如下:
/<a\s(?:\s*\w*?\s*=\s*".+?")*(?:\s*href\s*=\s*".+?")(?:\s*\w*?\s*=\s*".+?")*\s*>([\s\S]*?)<\/a>/
測試代碼如下:
<script type="text/javascript"> function anchorText(str){ var reg =/<a\s(?:\s*\w*?\s*=\s*".+?")*(?:\s*href\s*=\s*".+?")(?:\s*\w*?\s*=\s*".+?")*\s*> ([\s\S]*?)<\/a>/; str = str.replace(reg,'$1'); return str; } var str = '<a id = "test" title="無敵">經典論壇</a>'; document.write(anchorText(str)); </script>
正則判斷標簽是否閉合
來源:求助 超難!正則表達式如何判斷一個標簽是否閉合
例如:<img xxx=”xxx” 就是沒有閉合的標簽;
<p>p的內容,同樣也是沒閉合的標簽。
從簡單的正則開始,先匹配起始標簽
/<[a-z]+/i 再加上若干屬性:
/<[a-z]+(\s*\w*?\s*=\s*".+?")*/i 下面就到關鍵點了,標簽的閉合。標簽可能有兩種方式閉合,<img xxx=”xxx” />
或者是<p>xxx </p>。
(\s*\/>)
匹配img類的結束,即/>。
(\s*?>[\s\S]*?<\/\1>)
匹配\p類標簽的結束標簽。>是其實標簽末尾,之后是標簽內容若干個任意字符,最后的<\/\1>就是結束標簽了。
加上一個或就可以解決了,最后的完整正則表達式:
整個正則:
/<([a-z]+)(\s*\w*?\s*=\s*".+?")*(\s*?>[\s\S]*?<\/\1>|\s*\/>)/i 拿這個正則,只要匹配到了就表示閉合,沒匹配到則沒有閉合。不過沒有考慮相同標簽嵌套的問題,例如
<div>aaaaaa<div>test</div>
也被判斷為合格,可以通過把最后的匹配p類結束標簽寫成子正則表達式,并且更改為非貪心,然后在匹配結果中檢查是否成對。正則如下:
/<([a-z]+)(\s*\w*?\s*=\s*".+?")*(\s*?>[\s\S]*?(<\/\1>)+|\s*\/>)/i 用正則獲得指定標簽的內容
來源:求一正則
有如下代碼:
<channel> <title>藍色理想</title> </channel> <item> <title>界面設計測試規(guī)范</title> </item> <item> <title>《古典寫實美女》漫畫教程</title> </item> <item> <title>安遠――消失的光年</title> </item> <item> <title>asp.net 2.0多語言網站解決方案</title> </item>
要求匹配item里的title而不匹配channel里的title。
基本正則:
/<title>[\s\S]*?<\/title>/gi 首先是title標簽,內容為任意字符若干個,然后是title結束標簽。這個正則已經能匹配到所有的title標簽。
首先,我簡單地修改了一下原正則:
/<title>[^<>]*?<\/title>/gi, 因為title里面不應該再嵌有其它標簽,這個正則同樣是匹配所有標題的內容,最后再加上不去匹配channel中的title。整個正則如下:
/<title>[^<>]*?<\/title>(?!\s*<\/channel>)/gi (?!\s*<\/channel>)表示要匹配字符串的后面不能跟著若干個空格和一個channel的結束標簽。
原帖里有很方便的測試工具,這里就不給測試代碼了。
正則判斷是否為數(shù)字與字母的混合
來源:關于正則
不能小于12位,且必須為字母和數(shù)字的混合。
驗證字符串包含數(shù)字簡單,驗證字符串包含字母也簡單,驗證字符串不包含其它字符也簡單,可以用這三個正則分別檢查一次字符串,邏輯運算出最終結果。
但是怎么能把這些功能寫進一個正則表達式里呢?這個問題真有點傷腦筋。
下面是lexrus的正則:
/^([a-z]+(?=[0-9])|[0-9]+(?=[a-z]))[a-z0-9]+$/ig 思路非常的清晰?。?/p>
[a-z]+(?=[0-9])
字母開頭,后面必須緊跟著數(shù)字。
[0-9]+(?=[a-z]
數(shù)字開頭,后面必須緊跟著字母。
[a-z0-9]+
后面的字符只要是數(shù)字或者字母就可以了。經過測試,發(fā)現(xiàn)不好使,123dd會被識別為不合法,dd123則為合法,可見“數(shù)字開頭,緊跟字母”的正則沒有起作用。測試代碼如下:
<script type="text/javascript"> function istrue(str){ var reg=/^([a-z]+(?=[0-9])|[0-9]+(?=[a-z]))[a-z0-9]+$/ig; return reg.test(str); } var str? = 'AaBc'; var str2 = 'aaa123'; var str3 = '123dd'; var str4 = '1230923403982'; document.write(istrue(str)+'<br />'); document.write(istrue(str2)+'<br />'); document.write(istrue(str3)+'<br />'); document.write(istrue(str4)+'<br />'); </script>
結果為:
false,true,false,false
結果中的第三個,將'123dd'判斷為非法是錯誤的。剛開始以為是g的問題,去掉了還是不好使。應該是瀏覽器bug,我認為lexrus的正則是正確的,可能是瀏覽器無法處理或”|”的兩邊都包含正向預查(?=)。
修改之后的正則如下:
/^(([a-z]+[0-9]+)|([0-9]+[a-z]+))[a-z0-9]*$/i
意思和上面差不多,但是沒有使用正向預查,測試代碼如下:
<script type="text/javascript"> function istrue(str){ var reg=/^(([a-z]+[0-9]+)|([0-9]+[a-z]+))[a-z0-9]*$/i; return reg.test(str); } var str? = 'AaBc'; var str2 = 'aaa123'; var str3 = '123dd'; var str4 = '1230923403982'; document.write(istrue(str)+'<br />'); document.write(istrue(str2)+'<br />'); document.write(istrue(str3)+'<br />'); document.write(istrue(str4)+'<br />'); </script>
結果為
false,true,true,false
正確。
空格與英文同時存在
來源:正則問題請指教?。?/p>
匹配英文以及空格,要求必須既有英文字母又有空格。
這個思路和上面的差不多,只要把數(shù)字改成空格就可以了。正則如下:
/^(([a-z]+\s+)|(\s+[a-z]+))[a-z\s]*$/i 英文開頭加空格,或者是空格開頭加英文,后面可以是英文或者空格。測試代碼如下:
<script type="text/javascript"> function istrue(str){ var reg=/^(([a-z]+\s+)|(\s+[a-z]+))[a-z\s]*$/i; return reg.test(str); } var str? = 'asdf'; var str2 = 'sadf sdf'; var str3 = 'asdf '; document.write(istrue(str)+'<br />'); document.write(istrue(str2)+'<br />'); document.write(istrue(str3)+'<br />'); </script>
利用這個思路也可以實現(xiàn)英文空格英文,英文單詞多于兩個的匹配。同樣,也可以把英文字母換成單詞字符\w。
顯示或者保存正則表達式匹配的部分內容
有如下電話號碼:
13588888333
13658447322
13558885354
13587774654
13854554786
要求,要求只匹配135開頭的電話,但是匹配結果只保留135后面的數(shù)字。
由于JavaScript里的正則不支持(?=xx)xxx的模式,只支持xxx(?=xx)的模式。所以只能將135后面的內容作為一個子正則表達式匹配的內容,然后再在后面引用。
Carl給出的函數(shù)如下:
function f(phoneNumber) { var pattern = /^(135)(\d{8})$/; if(pattern.test(phoneNumber)) return phoneNumber.replace(pattern,"$2"); else return "不是135打頭的手機號碼!"; }
/^(135)(\d{8})$/ 正則中,135作為開頭表示第一個子正則表達式,第二個括號內的子正則表達式則匹配后面的8個數(shù)字,然后在replace中使用$2就可以引用這個子正則表達式匹配的內容了。測試代碼如下:
<script type="text/javascript"> function f(phoneNumber) { var pattern = /^(135)(\d{8})$/; if(pattern.test(phoneNumber)) return phoneNumber.replace(pattern,"$2"); else return "不是135打頭的手機號碼!"; } var arr = new Array( "13588888333", "13658447322", "13558885354", "13587774654", "13854554786" ); for(var i = 0; i < arr.length; i++) document.write(f(arr[i])+'<br />'); </script>
正則表達式替換變量
來源:求教正則
有一個數(shù)組:
var _A = ['A','B','C','D'];
有一個有“變量”的字符串。
var _B = '<ul><li>$0$</li><li>$1$</li><li>$2$</li><li>$3$</li></ul>';
說是變量,其實只是字符串中的特殊字符,例如$0$,就稱這個為偽變量吧。
最后的要求就是使用正則獲得下面這樣一個字符串:
_C = '<ul><li>A</li><li>B</li><li>C</li><li>D</li></ul>';
IamUE給出了代碼:
<script type="text/javascript"> var _A = ['A','B','C','D']; var _B = '<ul><li>$0$</li><li>$1$</li><li>$2$</li><li>$3$</li></ul>'; var reg=/\$\d+\$/ig; C=_B.replace(reg,function($1){ var indexnum=$1.replace(/\$/ig,""); if (indexnum<_A.length) {return _A[indexnum];} else{return ""} }); alert(C); </script>
代碼分析:看到代碼之后感覺有點暈,首先,正則reg中沒有任何的括號,應該是沒有捕獲內容的,那么后面怎么又使用$1了引用了呢?通過alert測試,發(fā)現(xiàn)它是整個正則匹配的內容,而且不一定要寫作$1,可以寫為$0,甚至是寫為x都沒關系,它總是整個匹配。
第一次,$1匹配到_B中的“$0$”,匿名函數(shù)中將它的$去掉,變成了0,檢查是否越界之后,用這個0作為下標去訪問數(shù)組_A。
由于正則reg定義了g屬性,所以會繼續(xù)替換$1$、$2$等等。步驟都和上面一樣。
正則替換指定屬性中的文本
來源:怎樣用正則來查找替換?
有如下代碼:
<td align="center"><img src="../photo/ccg/thumbnails/O'Malley's West_jpg.gif" border="0" onClick="MM_openBrWindow('../photo/ccg/pages/O'Malley's West_jpg.htm','BE','width=386,height=306')"><br> O'Malley's West</td>
要求將所有onclick屬性中的'替換成\',也就是將單引號轉義。
首先,需要匹配onclick屬性:
/onclick\s*=\s*".+?"/ig 然后再將所有的'都替換成\'就可以了。
將阿拉伯數(shù)字替換為中文大寫形式
來源:正則問題
將123替換成壹貳叁。
只要匹配一個數(shù)字就可以了,測試代碼如下(如果顯示為亂碼就調整一下瀏覽器的字符編碼):
function replaceReg(reg,str){ return str.replace(reg,function(m){return arr[m];}) } arr=new Array("零","壹","貳","叁","肆","伍","陸","柒","捌","玖"); var reg = /\d/g; var str = '13889294444'; var str2 = '12889293333'; var str3 = '23445567'; document.write(replaceReg(reg,str)+'<br />'); document.write(replaceReg(reg,str2)+'<br />'); document.write(replaceReg(reg,str3)+'<br />');
替換文本中的URL為鏈接
來源:求一鏈接替換正則
將一個用戶輸入的一段文字中的url替換成可以點擊的link地址。例如:http://www.blueidea.com可以替換成 [url]http://www.cctv.com[/url]
或<a href=". blueidea.com</a>.
這個正則的關鍵就在于匹配鏈接,匹配之后,在兩邊加上a標簽和屬性不是問題。
/http:\/\/[\w-]*(\.[\w-]*)+/ig 首先匹配http://。
[\w-]*是可能的www和bbs等。
\.[\w-]*匹配.xxx形式,至少有一個。
測試代碼如下:
<script type="text/javascript"> function replaceReg(reg,str){ return str.replace(reg,function(m){return '<a href="'+m+'">'+m+'</a>';}) } var reg = /http:\/\/[\w-]*(\.[\w-]*)+/ig; var str = '將一個用戶輸入的一段文字中的url替換成可以點擊的link地址。\
測試一下:http://www.blueidea.com緊接著中文,還有http://bbs.blueidea.com \
is very good!http://blueidea.com!最后在看看帶.cn的:
document.write(replaceReg(reg,str)+'<br />');
</script>
從HTML代碼段刪除指定標簽極其內容
來源:關于正則的問題
在一段代碼中去除<script ...... /script>, <head>...</head>,<%.....%>等代碼塊
隆的正則:
/<(script|meta|%)[\s\S]*?\/(script|meta|%)>/ 試了一下,匹配如下文本正常:
<script type="text/javascript">
我是要被刪除的腳本
</script>
哎。就剩下我了。 但是,如果使用類似的正則:
/<(script|head|%)[\s\S]*?\/(script|head|%)>/ig 匹配有嵌套的標簽:
<head>
<script type="text/javascript">
我是要被刪除的腳本
</script>
</head>
哎。就剩下我了。 實際匹配的內容是:
<head>
<script type="text/javascript">
我是要被刪除的腳本
</script>
這是因為[\s\S]*?里的非貪婪造成的。可以使用JavaScript正則里的反向引用來解決這個問題,如果起始標簽匹配了head,那么結束標簽也必須是head。
最后的正則如下:
/<(script|head|%)[\s\S]*?\/\1>/ig 用正則給文本分段
來源:怎樣用正則分段落
原代碼:[title]標題一[/title]內容一232323sdfga [title]標題二[/title]內容二2232323 [title]標題三[/title]內容三2232323
要把文本分段成如下格式:
一、[title]標題一[/title]內容一232323sdfga
二、[title]標題二[/title]內容二2232323
三、[title]標題三[/title]內容三2232323
只要用正則匹配title就可以了,所以正則比較簡單
/\[title\]/ig 至于開始的的漢字序號,只要一個數(shù)組就解決了,最終代碼如下:
<script type="text/javascript"> function replaceReg(reg,str){ var mark =0; return str.replace(reg,function(m){mark++;return '<br />'+arr[mark]+'、'+m;}) } var arr = ["零","壹","貳","叁","肆","伍","陸","柒","捌","玖"]; var reg = /\[title\]/ig; var str = '[title]標題一[/title]內容一232323sdfga \ [title]標題二[/title]內容二2232323 [title]標題三[/title]內容三2232323'; document.write(replaceReg(reg,str)+'<br />'); </script>
轉換源代碼中的標簽
來源:一個正則上的問題
將代碼中的HTML標簽img轉換為[img]url[/img]。
/<img(?:\s*\w*?\s*=\s*".+?")*?\s*src\s*=\s*"(.+?)"(?:\s*\w*?\s*=\s*".+?")*\s*>/ig
這段正則和匹配鏈接標簽的正則基本一樣,修改如下,標簽名img,沒有結束標簽而是>結束。
測試代碼如下:
<script type="text/javascript"> function replaceReg(reg,str){ return str.replace(reg,'[img]$1[/img]') } var reg = /<img(?:\s*\w*?\s*=\s*".+?")*?\s*src\s*=\s*"(.+?)"(?:\s*\w*?\s*=\s*".+?")*\s*>/ig; var str = '我就是傳說中的圖片了<img src="URL">哎。'; document.write(replaceReg(reg,str)+'<br />'); </script>
第二個是替換object代碼嵌入的flash代碼替換為

針對原文的正則如下:
/<object[\s\S]*?src=([\s\S]+?)(?=\s)[\s\S]*<\/object>/i 如果是所有的屬性都有雙引號的話正則也需要修改。
測試如下:
<script type="text/javascript"> function replaceReg(reg,str){ return str.replace(reg,'') } var reg = /<object[\s\S]*?src=([\s\S]+?)(?=\s)[\s\S]*<\/object>/i; var str = '<object classid=clsid:D27CDB6E-AE6D-11cf-96B8-444553540000 \ codebase=http://download.macromedia.com/pub/shockwave/cabs/flash/\ swflash.cab#version=5,0,0,0 width=255 height=250><param name=movie \ value=url><param name=quality value=high><embed src=url quality=high \ pluginspage=http://www.macromedia.com/shockwave/download/index.cgi?\ P1_Prod_Version=ShockwaveFlash type=application/x-shockwave-flash \ width=255 height=250></embed></object>'; document.write(replaceReg(reg,str)+'<br />'); </script>Flash動畫
給屬性添加雙引號
來源:請教正則表達式高手
給HTML標簽中的屬性添加雙引號。
<a href=xxx>改為:<a href="xxx">
LeXRus的第一個正則如下:
/(?!\<\w+)(\s+\w+)\=([^>\"\s]+)/ig 第一個括號沒看明白,JS應該是不支持。所以我擅自給刪掉了,剩下的正則如下:
/(\s+\w+)\=([^>\"\s]+)/ig 第一個括號里的\s+\w+匹配的是屬性名。
然后是=,不用轉義。
第二個括號里的[^>\"\s]+匹配屬性值。不匹配>”和空格。這里的引號不用轉義。在意思不改變的情況下,稍微改了改,正則如下:
/(\s+\w+)=([^>"\s]+)/ig 需要注意的是這個正則不匹配=兩邊有空格的屬性,例如href = xxx。相匹配的話就改成:
/(\s+\w+)\s*=\s*([^>"\s]+)/ig 代碼:
str=str.replace(/(?!\<\w+)(\s+\w+)\=([^>\"\s]+)/ig,'$1="$2"'); 其中'$1=”$2”'就實現(xiàn)了給屬性值添加上雙引號。不過ncs指出了這個正則替換的幾個問題,一是上面的空格問題,二是如果非標簽內部有等號,且前面又恰巧有空白字符的話,它將會被誤識別為屬性,例如:
<a href=xxx target=yyy title = asdfasf> test=sd
里面的test=sd也會被匹配。三是如果屬性原來使用了單引號,會被再包上一層雙引號……
來看看LeXRus前輩的新正則替換方法:
str=str.replace(/(?!<\w+)(\s+\w+)\s*=\s*([^>\"\s]+)(?=[^>]*>)/ig,'$1="$2"') .replace(/\"\'([^\'\"]+)\'\"/ig,'\"$1\"');
先來看第一個正則:
/ (\s+\w+)\s*=\s*([^>"\s]+)(?=[^>]*>)/ig 結尾新添的(?=[^>]*>)意在解決普通文本中有等號被誤識別為屬性的問題:
<a href=xxx target=yyy title = asdfasf> test=sd
就沒問題了,但是
<a href=xxx target=yyy title = asdfasf> test=sd<tag>又一個標簽</tag>
中的test=sd<tag>又會被識別為屬性。
我覺得改成下面的正則就沒問題了:
/(\s+\w+)\s*=\s*([^<>"\s]+)(?=[^<>]*>)/ig 分別在第二個括號的字符集合和最后的反向預查的字符集合中添加了一個<。
下面再來分析第二個正則,
/\"\'([^\'\"]+)\'\"/ig 這個正則用于匹配雙引號,單引號多層嵌套的情況,同樣,不用轉義,修改正則如下:
/"'([^'"]*)'"/ig
這樣基本任務就完成了。測試代碼如下:
<script type="text/javascript"> function rp(str,trg){ var reg1 = /(\s+\w+)\s*=\s*([^<>"\s]+)(?=[^<>]*>)/ig var reg2 = /"'([^'"]*)'"/ig; str=str.replace(reg1,'$1="$2"').replace(reg2,'\"$1\"'); trg.value=str; } </script> <textarea id="sou" style="width:100%"> <a href = xxx name=aaa target=_blank title='asdfasf' onclick=alert('blueidea')> asfd=asfd </textarea> <input type="button" onclick="rp(sou.value,sou)" value="replace"/>
原帖里LeXRus又提出了新問題:
hint=i am lexrus
這樣的屬性會有問題,不過我感覺不加引號的話,屬性值里就不可能有空格,否則會被識別為多個屬性了。不過看到最后ncs的回帖我就哭了:
onclick=if(document.forms.length>0)
這樣的屬性怎么辦?大于號會被識別為標簽結束……還是分離行為與文檔吧。補充一下,其實修補一下正則也可以解決,只要改成如下正則即可:
/(\s+\w+)\s*=\s*([^"\s]+)(?=[^<>]*>)/ig 就是去掉第二個括號內字符集合里的<>。最后這個問題也解決。
給table加上tbody
來源:通過正則表達式快速在后加上
有若干table,但是沒有tbody?,F(xiàn)在需要用正則批量加上。
匹配table結束標簽</table>比較簡單,在前面加上一個</tbody>就行了。
但是,匹配table的起始標簽有點難度,因為可能有屬性。不過之前匹配過鏈接了,這個也大同小異。
實例table代碼如下:
<table width="100%" border="0" cellpadding="2" cellspacing="3"> <table width="100%">
正則:
/<table\s(\s*\w*?\s*=\s*".+?")*?\s*?>/g 匹配一個<table,在匹配若干個屬性,最后只要再找到>就代表標簽結束。
之后再replace一下,加上<tbody>就可以了。
去掉標簽的所有屬性
來源:正則表達式(Dreamweaver8)
<td style="width: 23px; height: 26px;" align="left">***</td>
變成沒有任何屬性的
<td>***</td>
思路:非捕獲匹配屬性,捕獲匹配標簽,使用捕獲結果替換掉字符串。正則如下:
/(<td)\s(?:\s*\w*?\s*=\s*".+?")*?\s*?(>)/ 首先,td匹配掉了標簽,后面可以用$1引用,后面的若干屬性被(?:)匹配掉,而最后匹配的>則可以在后面用$2引用。
示意代碼:
str = str.replace(reg,'$1$2');
正則替換特定單詞
來源:正則表達式,拒絕幾個單詞的輸入該怎樣表達?
要求禁止輸入某幾個單詞,如果拒絕red,yellow,white。這個帖子到時不難,但是讓我弄清楚了好幾個概念。
第一個,小心字符集合里的“或”
/[^red|yellow|white]/ 這個正則里的所有或都沒有意義,等同于:
/[^redyellowwhite]/ 意思就是不能含有以下列出的所有字母。
正解:
/red|yellow|white/第二個概念:
只要整個正則匹配成功,無論子正則表達式是否匹配成功,括號都會捕捉。例如
/(red)|(yellow)|(white)/ 會捕捉到三個結果,盡管實際上最多只可能有一個括號匹配成功。但是只要有一個匹配到了,兩外兩個也會記錄空串。
指定文字高亮顯示
來源:如何用正則把網頁中的指定的字高亮顯示
請教正則表達式:如何替換搜索結果中的關鍵字為高亮顯示?
不勞而獲一次,這個子虛烏有前輩已經給出了非常好的解決方案:我直接把代碼貼出來了:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/2000/REC-xhtml1-20000126/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=gb2312" /> <META name="Author" content="Sheneyan" /> <script type="text/javascript"> function encode(s){ return s.replace(/&/g,"&").replace(/</g,"<").replace(/>/g,">").replace(/([\\\.\*\[\]\(\)\$\^])/g,"\\$1"); } function decode(s){ return s.replace(/\\([\\\.\*\[\]\(\)\$\^])/g,"$1").replace(/>/g,">").replace(/</g,"<").replace(/&/g,"&"); } function highlight(s){ if (s.length==0){ alert('搜索關鍵詞未填寫!'); return false; } s=encode(s); var obj=document.getElementsByTagName("body")[0]; var t=obj.innerHTML.replace(/<span\s+class=.?highlight.?>([^<>]*)<\/span>/gi,"$1"); obj.innerHTML=t; var cnt=loopSearch(s,obj); t=obj.innerHTML var r=/{searchHL}(({(?!\/searchHL})|[^{])*){\/searchHL}/g t=t.replace(r,"<span class='highlight'>$1</span>"); obj.innerHTML=t; alert("搜索到關鍵詞"+cnt+"處") } function loopSearch(s,obj){ var cnt=0; if (obj.nodeType==3){ cnt=replace(s,obj); return cnt; } for (var i=0,c;c=obj.childNodes[i];i++){ if (!c.className||c.className!="highlight") cnt+=loopSearch(s,c); } return cnt; } function replace(s,dest){ var r=new RegExp(s,"g"); var tm=null; var t=dest.nodeValue; var cnt=0; if (tm=t.match(r)){ cnt=tm.length; t=t.replace(r,"{searchHL}"+decode(s)+"{/searchHL}") dest.nodeValue=t; } return cnt; } </script> <style type="text/css"> .highlight{background:green;font-weight:bold;color:white;} </style> </head> <body> <form onsubmit="highlight(this.s.value);return false;"> <p><input name="s" id="s" title="搜索內容:"/><input type="submit" value="搜索"/></p> </form> <div id="content"> 測試高亮的代碼。很長很長的代碼…………………… </div> </body> </html>
刪除標簽
來源:如何使用正則表達式去除大部分HTML標記?
刪除除了<img>、<br>、<p>之外所有的標簽。子虛烏有給出代碼中關鍵的一句:
o.innerHTML.replace(/(<\/?(?!br|p|img)[^>\/]*)\/?>/gi,''); 剛開始沒反應過來,后來才想起來,這個正則不用區(qū)分起始和結束標簽。
<\/?(?!br|p|img)
匹配除了保護標簽外標簽的起始標簽或者是結束標簽的一部分。
[^>\/]*
匹配到>或者/就結束。
\/?>
起始標簽或者結束標簽的結尾。