Java中Pattern.compile函數(shù)的使用詳解
Java Pattern.compile函數(shù)的使用
除了Pattern Pattern.compile(String regex),
Pattern類的compile()方法還有另一個版本:
Pattern Pattern.complie(String regex,int flag),它接受一個標(biāo)記參數(shù)flag,以調(diào)整匹配的行為。
flag來自以下Pattern類中的常量:
編譯標(biāo)記 | 效果 |
---|---|
Pattern.CANON_EQ | 兩個字符當(dāng)且僅當(dāng)它們的完全規(guī)范分解相匹配時,就認(rèn)為它們是匹配的,例如,如果我們指定這個標(biāo)記,表達(dá)式a\u030A就會匹配字符串?。在默認(rèn)的情況下,匹配不考慮規(guī)范的等價性 |
Pattern.CASE_INSENSITIVE(?i) | 默認(rèn)情況下,大小寫不敏感的匹配假定只有US-ASCII字符集中的字符才能進(jìn)行。這個標(biāo)記允許模式匹配不必考慮大小寫(大寫或小寫)。通過指定UNICODE_CASE標(biāo)記及結(jié)合此標(biāo)記,基于Unicode的大小寫不敏感的匹配就可以開啟了,也可以使用嵌入的標(biāo)記表達(dá)式?i開啟,下同 |
Pattern.COMMENTS(?x) | 在這種模式下,表達(dá)式中的空格(不是指\s,單純指空格)將被忽略掉,并且以#開始直到行末的注釋也會被忽略掉。通過嵌入的標(biāo)記表達(dá)式也可以開啟Unix的行模式 |
Pattern.DOTALL(?s) | 在dotall模式中,表達(dá)式“.”匹配所有字符,包括行終結(jié)符。默認(rèn)情況下,“.”表達(dá)式不匹配行終結(jié)符 |
Pattern.MULTLINE(?m) | 在多行模式下,表達(dá)式^和$分別匹配一行或輸入字符串的開始和結(jié)束。默認(rèn)情況下,這些表達(dá)式僅匹配輸入的完整字符串的開始和結(jié)束 |
Pattern.UNICODE_CASE(?u) | 當(dāng)指定這個標(biāo)記,并且開啟CASE_INSENSITIVE時,大小寫不敏感的匹配將按照與Unicode標(biāo)準(zhǔn)相一致的方式進(jìn)行。默認(rèn)情況下,大小寫不敏感的匹配假定只能在US-ASCII字符集中的字符才能進(jìn)行 |
Pattern.UNIX_LINES(?d) | 在這種模式下,在.、^和$行為中,只識別行終結(jié)符\n |
在這些標(biāo)記中 Pattern.CASE_INSENSITIVE(?i) ,Pattern.MULTLINE(?m),==Pattern.COMMENTS(?x)==中特別有用。
使用示例如下:
我們可以通過“或”( | )操作組合多個標(biāo)記的功能
import java.util.regex.Matcher; import java.util.regex.Pattern; public class ReFlags { public static void main(String[] args) { Pattern p=Pattern.compile("^java",Pattern.CASE_INSENSITIVE|Pattern.MULTILINE); /* * 使用Pattern.CASE_INSENSITIVE(大小寫不敏感的匹配)和Pattern.MULTILINE(多行模式)標(biāo)記,忽略大小寫地匹配所有以java開頭的行 */ Matcher m=p.matcher("java has regex\nJava has regex\n" + "JAVA has pretty good regular expression\n" + "Regular expressions are in JavA"); while (m.find()) { System.out.println(m.group());//輸出已匹配的部分 } } }
輸出結(jié)果:
java
Java
JAVA
使用Pattern.COMMENTS(?x)的例子:
import java.util.regex.Matcher; import java.util.regex.Pattern; public class ReFlags_Comments { public static void main(String[] args) { /* * 不使用Pattern.COMMENTS(不啟動注釋) */ String s="123"; Pattern p1=Pattern.compile(" (\\d+)+#test comments"); Matcher m1=p1.matcher(s); System.out.println(m1.matches());//false /* * 正則表達(dá)式中使用啟動注釋的標(biāo)記 */ Pattern p2=Pattern.compile("(?x) (\\d+)+#test comments"); Matcher m2=p2.matcher(s); System.out.println(m2.matches());//true /* * 參數(shù)中使用Pattern.COMMENTS以啟動注釋 */ Pattern p3=Pattern.compile(" (\\d+)+#test comments",Pattern.COMMENTS); Matcher m3=p3.matcher(s); System.out.println(m3.matches());//true } }
運行結(jié)果:
false
true
true
Pattern.compile函數(shù)的相關(guān)解釋
Pattern.compile函數(shù):
Pattern Pattern.compile(String regex, int flag)
flag的取值范圍如下:
Pattern.CANON_EQ
:當(dāng)且僅當(dāng)兩個字符的"正規(guī)分解(canonical decomposition)"都完全相同的情況下,才認(rèn)定匹配。比如用了這個標(biāo)志之后,表達(dá) 式"a\u030A"會匹配"?"。默認(rèn)情況下,不考慮"規(guī)范相等性(canonical equivalence)"。Pattern.CASE_INSENSITIVE
: 默認(rèn)情況下,大小寫不敏感的匹配只適用于US-ASCII字符集。這個標(biāo)志能讓表達(dá)式忽略大小寫進(jìn)行匹配。要想對Unicode字符進(jìn)行大小不明感的匹 配,只要將UNICODE_CASE與這個標(biāo)志合起來就行了。Pattern.COMMENTS
: 在這種模式下,匹配時會忽略(正則表達(dá)式里的)空格字符(不是指表達(dá)式里的"\\s",而是指表達(dá)式里的空格,tab,回車之類)。注釋從#開始,一直到這行結(jié)束??梢酝ㄟ^嵌入式的標(biāo)志來啟用Unix行模式。Pattern.DOTALL
: 在這種模式下,表達(dá)式'.'可以匹配任意字符,包括表示一行的結(jié)束符。默認(rèn)情況下,表達(dá)式'.'不匹配行的結(jié)束符。Pattern.MULTILINE
: 在這種模式下,'^'和'$'分別匹配一行的開始和結(jié)束。此外,'^'仍然匹配字符串的開始,'$'也匹配字符串的結(jié)束。默認(rèn)情況下,這兩個表達(dá)式僅僅匹配字符串的開始和結(jié)束。Pattern.UNICODE_CASE
: 在這個模式下,如果你還啟用了CASE_INSENSITIVE標(biāo)志,那么它會對Unicode字符進(jìn)行大小寫不明感的匹配。默認(rèn)情況下,大小寫不敏感的匹配只適用于US-ASCII字符集。Pattern.UNIX_LINES(?d)
在這個模式下,只有'\n'才被認(rèn)作一行的中止,并且與'.','^',以及'$'進(jìn)行匹配。
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
springboot實現(xiàn)防重復(fù)提交和防重復(fù)點擊的示例
這篇文章主要介紹了springboot實現(xiàn)防重復(fù)提交和防重復(fù)點擊的示例,幫助大家更好的理解和學(xué)習(xí)springboot框架,感興趣的朋友可以了解下2020-09-09Java異常java.lang.UnsatisfiedLinkError: no opencv_ja
這篇文章主要介紹了Java異常java.lang.UnsatisfiedLinkError: no opencv_java320 in java.library.path的解決方案,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-12-12Java?代碼本地設(shè)置Hadoop用戶名密碼的方法
在Hadoop環(huán)境中,通常使用Kerberos進(jìn)行身份驗證,這篇文章主要介紹了Java?代碼本地設(shè)置Hadoop用戶名密碼的方法,需要的朋友可以參考下2024-08-08