快捷導(dǎo)航

Java正則多字符串匹配替換

更新時(shí)間：2013年02月20日 19:23:54 作者：

正則表達(dá)式異常強(qiáng)大，一直理解不深，用的也不深，這次項(xiàng)目中嘗試，體會(huì)到了它的強(qiáng)大之處。字符串查找，匹配，替換，正則無不能做，特別是靈活的運(yùn)用子串匹配得到的變量值$1,$2，再進(jìn)行二次處理能夠達(dá)到很巧妙的效果。

Java中使用也比較簡(jiǎn)單：
1. 編譯正則表達(dá)式的字面值得到對(duì)應(yīng)的模式Pattern對(duì)象；

2. 創(chuàng)建匹配給定輸入與此模式的匹配器Matcher；

3. 通過匹配器對(duì)象執(zhí)行操作，匹配器對(duì)象的方法很豐富，方法之間組合使用更加強(qiáng)大。

復(fù)制代碼代碼如下:

public static void main(String[] args) {
    //被替換關(guān)鍵字的的數(shù)據(jù)源
    Map<String,String> tokens = new HashMap<String,String>();
    tokens.put("cat", "Garfield");
    tokens.put("beverage", "coffee");

    //匹配類似velocity規(guī)則的字符串
    String template = "${cat} really needs some ${beverage}.";
    //生成匹配模式的正則表達(dá)式
    String patternString = "\\$\\{(" + StringUtils.join(tokens.keySet(), "|") + ")\\}";

    Pattern pattern = Pattern.compile(patternString);
    Matcher matcher = pattern.matcher(template);

    //兩個(gè)方法：appendReplacement, appendTail
    StringBuffer sb = new StringBuffer();
    while(matcher.find()) {
        matcher.appendReplacement(sb, tokens.get(matcher.group(1)));
    }
    matcher.appendTail(sb);

    //out: Garfield really needs some coffee.
    System.out.println(sb.toString());

    //對(duì)于特殊含義字符"\","$"，使用Matcher.quoteReplacement消除特殊意義
    matcher.reset();
    //out: cat really needs some beverage.
    System.out.println(matcher.replaceAll("$1"));
    //out: $1 really needs some $1.
    System.out.println(matcher.replaceAll(Matcher.quoteReplacement("$1")));

    //到得郵箱的前綴名。插一句，其實(shí)驗(yàn)證郵箱的正則多種多樣，根據(jù)自己的需求寫對(duì)應(yīng)的正則才是王道
    String emailPattern = "^([a-z0-9_\\.\\-\\+]+)@([\\da-z\\.\\-]+)\\.([a-z\\.]{2,6})$";
    pattern = Pattern.compile(emailPattern);
    matcher = pattern.matcher("test@qq.com");
    //驗(yàn)證是否郵箱
    System.out.println(matcher.find());
    //得到@符號(hào)前的郵箱名 out: test
    System.out.println(matcher.replaceAll("$1"));

    //獲得匹配值
    String temp = "<meta-data android:name=\"appid\" android:value=\"joy\"></meta-data>";
    pattern = Pattern.compile("android:(name|value)=\"(.+?)\"");
    matcher = pattern.matcher(temp);
    while(matcher.find()) {
        //out: appid, joy
        System.out.println(matcher.group(2));
    }
}

一些老是忘基礎(chǔ)

[...] 位于括號(hào)之內(nèi)的任意字符

[^...] 不在括號(hào)之中的任意字符

. 除了換行符之外的任意字符,等價(jià)于[^\n]

\w 任何單字字符, 等價(jià)于[a-zA-Z0-9]

\W 任何非單字字符,等價(jià)于[^a-zA-Z0-9]

\s 任何空白符,等價(jià)于[\ t \ n \ r \ f \ v]

\S 任何非空白符,等價(jià)于[^\ t \ n \ r \ f \ v]

\d 任何數(shù)字,等價(jià)于[0-9]

\D 除了數(shù)字之外的任何字符,等價(jià)于[^0-9]

[\b] 一個(gè)退格直接量(特例)

{n, m} 匹配前一項(xiàng)至少n次,但是不能超過m次

{n, } 匹配前一項(xiàng)n次,或者多次

{n} 匹配前一項(xiàng)恰好n次

? 匹配前一項(xiàng)0次或1次,也就是說前一項(xiàng)是可選的. 等價(jià)于 {0, 1}

+ 匹配前一項(xiàng)1次或多次,等價(jià)于{1,}

* 匹配前一項(xiàng)0次或多次.等價(jià)于{0,}

| 選擇.匹配的要么是該符號(hào)左邊的子表達(dá)式,要么它右邊的子表達(dá)式

(...) 分組.將幾個(gè)項(xiàng)目分為一個(gè)單元.這個(gè)單元可由 *、+、？和|等符號(hào)使用,而且還可以記住和這個(gè)組匹配的字符以供此后引用使用

\n 和第n個(gè)分組所匹配的字符相匹配.分組是括號(hào)中的子表達(dá)式(可能是嵌套的).分組號(hào)是從左到右計(jì)數(shù)的左括號(hào)數(shù)

^ 匹配的是字符的開頭,在多行檢索中,匹配的是一行的開頭

$ 匹配的是字符的結(jié)尾,在多行檢索中,匹配的是一行的結(jié)尾

\b 匹配的是一個(gè)詞語的邊界.簡(jiǎn)而言之就是位于字符\w 和 \w之間的位置(注意:[\b]匹配的是退格符)

\B 匹配的是非詞語的邊界的字符

題外話

郵箱驗(yàn)證，以前驗(yàn)證郵箱，網(wǎng)上搜個(gè)正則裝在自己程序里面就用，其實(shí)這是不對(duì)的，不同的公司對(duì)郵箱的驗(yàn)證格式是不一樣的，比方說163和qq郵箱注冊(cè)，他們要求的格式都不一樣，所以搜一個(gè)正則表達(dá)式就去套所有的郵箱格式也是不對(duì)的，符合自己的需求的正則才是正確的。

您可能感興趣的文章: