欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

正則表達式中的反向預搜索(上)

 更新時間:2009年12月14日 03:13:50   作者:  
這幾天在用正則表達式做一個小程序,需要替換內容中的某些特殊字符串。這些字符串的出現是有規(guī)律的,那就是在它左面總會特定的內容出現,右面卻沒有。于是自然就想到了反向預搜索。
在以前的應用,大多是應用正向預搜索情況。也就是說,在查找內容的右面有特定的內容限定,例如下面的例子:
復制代碼 代碼如下:

var str3 = 'CPU: Intel Core2 5200; Memory: 2G;OS: Ubuntu 9.04';
var reg3 = /Memory\:\s+(.*(?=\;OS\:))/gim;
str3.match(reg3);
alert(RegExp.$1); //結果是2G

(.*(?=\;OS\:) 就是典型的正向預搜索,只有右面內容是“;OS: ”才會被匹配到。
但是現在要實現的效果,左面的內容是固定,而不是右面??墒荍avaScript并不支持反向預搜索。我相信,細心的朋友已經發(fā)現了,其實上面的例子已經達到了這個目的(前面的Memory\:\s+ 限定了左面的內容)。下面再給出一個例子:
復制代碼 代碼如下:

//程序目的,去掉圖片路徑中的域名
var str = '<img src="http://news.163.com/sports/yao.jpg" >';
var reg1 = /(\<img)(.*(?=(http|https)\:\/\/))((http|https)\:\/\/[^\/]*)/gim;
str.match(reg1);
alert(str.replace(RegExp.$4,''));

那么到底有沒有反向預搜索呢?答案是肯定的,可是現實是殘酷的。我查閱了一些資料,上面提到反向預搜索的形式是以?<= 或者?<! 為引導的。遺憾的是JavaScript并不支持,在高版本的Java中已獲支持,于是就編寫了下面的測試程序(JRE1.6.0_03):
復制代碼 代碼如下:

import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class RegExpTest {
    public static void main(String[] args){
        Pattern p = Pattern.compile("((?<=\\<img.*(?=(http|https)))(http|https))");
        Matcher matcher = p.matcher("<img src="http://news.163.com/sports/yao.jpg"/>");
        System.out.println(matcher.matches());
    }
}

程序本身應該沒有什么問題,但是運行結果:

Exception in thread "main" java.util.regex.PatternSyntaxException: Look-behind group does not have an obvious maximum length near index 27
((?<=\<img.*(?=(http|https)))(http|https))

我Google了半天,最后得到的唯一結果就是換種寫法。希望看到這篇文章的朋友,如果已經實現了這種效果,一定要留言不吝賜教。

另外,在我看文檔時看到了?:引導的正則表達式,上面說是“匹配不存儲”,百思不得其解。感覺還是代碼來的實在,寫一個看一下:
復制代碼 代碼如下:

var str2 = '客戶端名稱';
var reg2 = /(客戶端名(?:稱)?)/;
str2.match(reg2);
alert(RegExp.$1); //客戶端名稱
alert(RegExp.$2); //空字符串
//不使用?:
reg2 = /(客戶端名(稱)?)/;
str2.match(reg2);
alert(RegExp.$1); //客戶端名稱
alert(RegExp.$2); //稱

敏捷開發(fā)思想說:代碼是最好的文檔。給了我借口,呵呵。

相關文章

最新評論