一文搞懂正則表達式基礎語法以及如何應用

更新時間：2022年09月28日 16:06:35 作者：小黎的培培筆錄

正則表達式是一種描述字符串結構的語法規(guī)則,是用于匹配字符串中字符組合的模式,同時正則表達式也是對象,下面這篇文章主要給大家介紹了關于如何通過一文搞懂正則表達式基礎語法以及如何應用的相關資料,需要的朋友可以參考下

一、正則表達式

1、基本介紹

? 概述

一個正則表達式，就是用某種模式去匹配字符串的一個公式。很多人因為它們看上去比較古怪而且復雜所以不敢去使用，不過，經(jīng)過練習后就覺得這些復雜的表達式寫起來還是相當簡單的, 而且, 一旦你弄懂它們，你就能把數(shù)小時辛苦而且易錯的文本處理工作縮短在幾分鐘（甚至幾秒鐘）內完成。
正則表達式不是只有java才有，實際上很多編程語言都支持正則表達式進行字符串操作!

? 快速入門

public class RegTheory {
    public static void main(String[] args) {
        //目標：匹配所有四個數(shù)字
        String content = "2002fsd ke ire i2222 ";
 
        //1. \\d 表示一個任意的數(shù)字
        String regStr = "(\\d\\d)(\\d\\d)";
 
        //2. 創(chuàng)建模式對象[即正則表達式對象]
        Pattern pattern = Pattern.compile(regStr);
 
        //3. 創(chuàng)建匹配器
        //說明：創(chuàng)建匹配器 matcher， 按照 正則表達式的規(guī)則 去匹配 content 字符串
        Matcher matcher = pattern.matcher(content);
 
        //4. 開始匹配
        while (matcher.find()) {
            System.out.println("找到: " + matcher.group(0));
            System.out.println("第 1 組()匹配到的值=" + matcher.group(1));
            System.out.println("第 2 組()匹配到的值=" + matcher.group(2));
        }
    }
}

? 底層源碼

matcher.find() 完成的任務（考慮分組），{什么是分組，比如 (\d\d)(\d\d) ,正則表達式中有() 表示分組,第 1 個()表示第 1 組,第 2 個()表示第 2 組...}
1. 根據(jù)指定的規(guī)則 , 定位滿足規(guī)則的子字符串 ( 比如 (20)(02))
2. 找到后，將子字符串的開始的索引記錄到 matcher 對象的屬性 int[ ] groups;
? groups[0] = 0 , 把該子字符串的結束的索引+1 的值記錄到 groups[1] = 4
? 記錄 1 組 () 匹配到的字符串 groups[2] = 0 groups[3] = 2
? 記錄 2 組 () 匹配到的字符串 groups[4] = 2 groups[5] = 4
? 如果有更多的分組.....
3. 同時記錄 oldLast 的值為子字符串的結束的索引 +1 的值即 16, 即下次執(zhí)行 find 時，就從 16 開始匹配。

? matcher.group(0) 分析

public String group(int group) {
    if (first < 0){
        throw new IllegalStateException("No match found");
    }
 
    if (group < 0 || group > groupCount()){
        throw new IndexOutOfBoundsException("No group " + group);
    }
 
    if ((groups[group*2] == -1) || (groups[group*2+1] == -1)){
        return null;
    }
 
    return getSubSequence(groups[group * 2], groups[group * 2 + 1]).toString();
}

根據(jù) groups[0]=16 和 groups[1]=20 的記錄的位置，從 content 開始截取子字符串返回

就是 [16,20) 包含 16 但是不包含索引為 20 的位置如果再次指向 find 方法 . 仍然安上面分析來執(zhí)行。

? 小結

        1. 如果正則表達式有() 即分組
        2. 取出匹配的字符串規(guī)則如下
        3. group(0) 表示匹配到的子字符串
        4. group(1) 表示匹配到的子字符串的第一組字串
        5. group(2) 表示匹配到的子字符串的第 2 組字串
        6. ... 但是分組的數(shù)不能越界.

2、正則表達式語法

? 基本介紹

如果要想靈活的運用正則表達式，必須了解其中各種元字符的功能，元字符從功能上大致分為:

①限定符，②選擇匹配符，③分組組合和反向引用符，④特殊字符，⑤字符匹配符，⑥定位符

? 元字符(Metacharacter)-轉義號

符號說明: 在我們使用正則表達式去檢索某些特殊字符的時候，需要用到轉義符號。則檢索不到結果，甚至會報錯的。案例:用$ 去匹配 “abc$(" 會怎樣?

在Java的正則表達式中，兩個\\ 代表其他語言中的一個\

需要用到轉義符號的字符有以下 : " . * + () $ / \ ? [ ] ^ { } "

二、正則語法

1、字符匹配符、選擇匹配符

? 基本介紹

? 代碼實現(xiàn)

String content = "a11c8abc _ABCy @";
 
String regStr = "[a-z]"; //匹配 a-z 之間任意一個字符
 
String regStr = "[A-Z]"; //匹配 A-Z 之間任意一個字符
 
String regStr = "abc"; //匹配 abc 字符串[默認區(qū)分大小寫]
 
String regStr = "(?i)abc"; //匹配 abc 字符串[不區(qū)分大小寫]
 
String regStr = "[0-9]"; //匹配 0-9 之間任意一個字符
 
String regStr = "[^a-z]"; //匹配 不在 a-z 之間任意一個字符
 
String regStr = "[^0-9]"; //匹配 不在 0-9 之間任意一個字符
 
String regStr = "[abcd]"; //匹配 在 abcd 中任意一個字符
 
String regStr = "\\D"; //匹配 不在 0-9 的任意一個字符
 
String regStr = "\\w"; //匹配 大小寫英文字母, 數(shù)字，下劃線
 
String regStr = "\\W"; //匹配 等價于 [^a-zA-Z0-9_]
 
// \\s 匹配任何空白字符(空格,制表符等)
String regStr = "\\s";
 
// \\S 匹配任何非空白字符 ,和\\s 剛好相反
String regStr = "\\S";
 
//. 匹配出 \n 之外的所有字符,如果要匹配.本身則需要使用 \\.
String regStr = ".";

//當創(chuàng)建 Pattern 對象時，指定 Pattern.CASE_INSENSITIVE, 表示匹配是不區(qū)分字母大小寫. 
Pattern pattern = Pattern.compile(regStr, Pattern.CASE_INSENSITIVE);

? 選擇匹配符

String content = "study hard"; 
String regStr = "t|a|r";

2、限定符

? 基本介紹

? 代碼實現(xiàn)

String content = "a211111aaaaaahello";
 
String regStr = "a{3}"; // 表示匹配 aaa
String regStr = "1{4}"; // 表示匹配 1111
String regStr = "\\d{2}"; // 表示匹配 兩位的任意數(shù)字字符
 
//細節(jié)：java 匹配默認貪婪匹配，即盡可能匹配多的
String regStr = "a{3,4}"; //表示匹配 aaa 或者 aaaa
String regStr = "1{4,5}"; //表示匹配 1111 或者 11111
String regStr = "\\d{2,5}"; //匹配 2 位數(shù)或者 3,4,5
 
//1+
String regStr = "1+"; //匹配一個 1 或者多個 1
String regStr = "\\d+"; //匹配一個數(shù)字或者多個數(shù)字
 
//1*
String regStr = "1*"; //匹配 0 個 1 或者多個 1
 
//遵守貪婪匹配
String regStr = "a1?"; //匹配 a 或者 a1

3、定位符

? 基本介紹

? 代碼實現(xiàn)

String content = "123-abc sldkjfs s dfsjf";
 
String content = "123-abc";
 
//以至少 1 個數(shù)字開頭，后接任意個小寫字母的字符串
String regStr = "^[0-9]+[a-z]*";
 
//以至少 1 個數(shù)字開頭, 必須以至少一個小寫字母結束
String regStr = "^[0-9]+\\-[a-z]+$";
 
//表示匹配邊界的 han[這里的邊界是指：被匹配的字符串最后,也可以是空格的子字符串的后面]
String regStr = "han\\b";
 
//和\\b 的含義剛剛相反
String regStr = "han\\B";

4、分組

? 基本介紹

? 代碼實現(xiàn)

String content = "hello world s7789 nn1189han";
 
//命名分組： 即可以給分組取名
String regStr = "(?<g1>\\d\\d)(?<g2>\\d\\d)";//匹配 4 個數(shù)字的字符串
 
Pattern pattern = Pattern.compile(regStr);
Matcher matcher = pattern.matcher(content);
 
while (matcher.find()) {
    System.out.println("找到=" + matcher.group(0));
    System.out.println("第 1 個分組內容=" + matcher.group(1));
    System.out.println("第 1 個分組內容[通過組名]=" + matcher.group("g1"));
    System.out.println("第 2 個分組內容=" + matcher.group(2));
    System.out.println("第 2 個分組內容[通過組名]=" + matcher.group("g2"));
}

三、常用類

1、基本介紹

? 概述

? java.util.regex 包主要包括以下三個類Pattern 類、Matcher 類和 PatternSyntaxException ? Pattern 類
        pattern 對象是一個正則表達式對象。Pattern 類沒有公共構造方法。要創(chuàng)建一個Pattern 對象調用其公共靜態(tài)方法，它返回一個Pattern 對象。該方法接受一個正則表達式作為它的第一個參數(shù)，比如: Pattern r=Pattern.compile(pattern);
? Matcher類
        Matcher對象是對輸入字符串進行解釋和匹配的引擎。與Pattern 類一樣, Matcher 也沒有公共構造方法。你需要調用 Pattern 對象的 matcher方法來獲得一個 Matcher對象
? PatternSyntaxException
        PatternSyntaxException 是一個非強制異常類, 它表示一個正則表達式模式中的語法錯誤。

? 代碼實例

public class PatternMethod {
    public static void main(String[] args) {
        String content = "hello abc hello, 努力學習";
 
        //String regStr = "hello";
 
        String regStr = "hello.*";
 
        boolean matches = Pattern.matches(regStr, content);
 
        System.out.println("整體匹配= " + matches);
    }
}

? Matcher 常用類

public class MatcherMethod {
    public static void main(String[] args) {
        String content = "hello edu jack edutom hello smith hello edu edu";
 
        String regStr = "hello";
 
        Pattern pattern = Pattern.compile(regStr);
 
        Matcher matcher = pattern.matcher(content);
 
        while (matcher.find()) {
            System.out.println(matcher.start());
            System.out.println(matcher.end());
            System.out.println("找到: " + content.substring(matcher.start(), matcher.end()));
        }
 
        //整體匹配方法，常用于，去校驗某個字符串是否滿足某個規(guī)則
        System.out.println("整體匹配=" + matcher.matches());
 
        //完成如果 content 有 edu 替換成 努力學習
        regStr = "edu";
        pattern = Pattern.compile(regStr);
        matcher = pattern.matcher(content);
 
        //注意：返回的字符串才是替換后的字符串 原來的 content 不變化
        String newContent = matcher.replaceAll("努力學習");
 
        System.out.println("newContent=" + newContent);
        System.out.println("content=" + content);
    }
}

2、分組、捕獲、反向引用

? 基本介紹

1、分組

我們可以用圓括號組成一個比較復雜的匹配模式，那么一個圓括號的部分我們可以看作是一個子表達式(一個分組)。

2、捕獲

把正則表達式中子表達式(分組匹配)的內容，保存到內存中以數(shù)字編號或顯式命名的組里, 方便后面引用, 從左向右，以分組的左括號為標志，第一個出現(xiàn)的分組的組號為1，第二個為2，以以此類推，組0代表的是整個正則式。

3、反向引用

圓括號的內容被捕獲后，可以在這個括號后被使用, 從而寫出一個比較實用的匹配式，這個我們稱為反向引用，這種引用既可以是在正則表達式內部，也可以是在正則表達式外部，內部反向引用\\分組號，外部反向引用$分組號。

? 經(jīng)典案例

public class RegExp13 {
    public static void main(String[] args) {
        String content = "我....我要....學學學學....編程 java!";
 
        //1. 去掉所有的.
        Pattern pattern = Pattern.compile("\\.");
        Matcher matcher = pattern.matcher(content);
        content = matcher.replaceAll("");
 
        //2. 去掉重復的字 我我要學學學學編程 java！
        //(1) 使用 (.)\\1+
        //(2) 使用 反向引用$1 來替換匹配到的內容
        // 注意：因為正則表達式變化，所以需要重置 matcher
 
        pattern = Pattern.compile("(.)\\1+");//分組的捕獲內容記錄到$1
 
        matcher = pattern.matcher(content);
 
        //使用 反向引用$1 來替換匹配到的內容
        content = matcher.replaceAll("$1");
 
        System.out.println("content=" + content);
    }
}

3、String 類中使用正則表達式

? 替換功能

String 類： public String replaceAll(String regex,String replacement)

? 判斷功能

String 類： public boolean matches(String regex){} // 使用 Pattern 和 Matcher 類

? 分割功能

String 類： public String[] split(String regex)

? 代碼實例

String content = "2000 年 5 月，JDK1.3、JDK1.4 和 J2SE1.3 相繼發(fā)布。";
 
//使用正則表達式方式，將 JDK1.3 和 JDK1.4 替換成 JDK
content = content.replaceAll("JDK1\\.3|JDK1\\.4", "JDK");
 
System.out.println(content);

//要求 驗證一個 手機號， 要求必須是以 138 139 開頭的
content = "13888889999";
 
if (content.matches("1(38|39)\\d{8}")) {
    System.out.println("驗證成功");
} else {
    System.out.println("驗證失敗");
}

//要求按照 # 或者 - 或者 ~ 或者 數(shù)字 來分割
content = "hello#abc-jack12smith~北京";
 
String[] split = content.split("#|-|~|\\d+");
 
for (String s : split) {
    System.out.println(s);
}

總結

到此這篇關于正則表達式基礎語法以及如何應用的文章就介紹到這了,更多相關正則表達式基礎語法及應用內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

Java使用正則表達式對注冊頁面進行驗證功能實現(xiàn)
本文給大家分享一段有關java使用正則表達式對注冊頁面進行驗證的代碼，代碼比較簡單，非常不錯，感興趣的朋友一起學習吧
2016-09-09
重溫JavaScript中的正則表達式 js學習筆記
創(chuàng)建正則表達式和創(chuàng)建字符串類似，創(chuàng)建正則表達式提供了兩種方法，一種是采用 new運算符，另一個是采用字面量方式
2012-07-07
notepad、editplus等軟件常用的文本整理正則表達式
這篇文章主要介紹了notepad、editplus等軟件常用的文本整理正則表達式,本文講解了匹配空行、所有空行、空格、換行、2個以上的空格等正則,需要的朋友可以參考下
2015-04-04
javascript正則表達式容易被忽略的小問題整理
小問題:lastIndex只對exec()和test()方法起作用，string.match(regexp)是不會影響regexp這個正則的lastIndex屬性的，具體祥看本文
2013-07-07
過濾所有HTML代碼和CSS,JS
過濾所有HTML代碼和CSS,JS...
2006-08-08
開發(fā)過程最全的正則表達式匹配中英文、字母和數(shù)字
這篇文章主要介紹了開發(fā)過程最全的正則表達式匹配中英文、字母和數(shù)字的相關知識，非常不錯，具有一定的參考借鑒價值,需要的朋友可以參考下
2019-05-05
常用正則表達式知識點解讀及判讀有效數(shù)字、手機號郵箱正則表達式
正則表達式式應用非常廣泛，本文給大家收集整理些正則表達式知識點解讀及判斷有效數(shù)字、手機號郵箱正則表達式，對常用正則表達式相關知識感興趣的朋友一起學習吧
2015-11-11
正則表達式，只匹配一次下化線！
正則表達式，只匹配一次下化線！...
2006-12-12
PHP 正則表達式驗證中文的問題
PHP 正則表達式驗證中文的問題,感覺php不支持perl轉義挺討厭的。
2009-08-08
Linux 正則表達式詳解
這篇文章主要介紹了linux 正則表達式的一些使用方法，需要的朋友可以參考下
2013-11-11

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

一文搞懂正則表達式基礎語法以及如何應用

目錄

一、正則表達式

1、基本介紹

2、正則表達式語法

二、正則語法

1、字符匹配符、選擇匹配符

2、限定符

3、定位符

4、分組

三、常用類

1、基本介紹

2、分組、捕獲、反向引用

3、String 類中使用正則表達式

總結

相關文章

最新評論

大家感興趣的內容

最近更新的內容

常用在線小工具

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

一文搞懂正則表達式基礎語法以及如何應用

目錄

一、正則表達式

1、基本介紹

2、正則表達式語法

二、正則語法

1、字符匹配符、選擇匹配符

2、限定符

3、定位符

4、分組

三、常用類

1、基本介紹

2、分組、捕獲、反向引用

3、String 類中使用正則表達式

總結

相關文章

最新評論

大家感興趣的內容

最近更新的內容

常用在線小工具

1、基本介紹

2、正則表達式語法

二、正則語法

1、字符匹配符、選擇匹配符

2、限定符

3、定位符

4、分組

1、基本介紹

2、分組、捕獲、反向引用

3、String 類中使用正則表達式