如何在Java中使用正則表達(dá)式API
前言:
在正則表達(dá)式的世界中,有許多不同的風(fēng)格可供選擇,比如grep、Perl、Python、PHP、awk等等。這意味著在一種編程語(yǔ)言中工作的正則表達(dá)式可能在另一種編程語(yǔ)言中不工作。Java中的正則表達(dá)式語(yǔ)法與Perl中的最相似。要在Java中使用正則表達(dá)式,我們不需要任何特殊設(shè)置。JDK包含一個(gè)特殊的java包java.util.regex完全致力于regex。我們只需要將其導(dǎo)入到我們的代碼中。此外,java.lang.String類還具有我們?cè)诖a中常用的內(nèi)置正則表達(dá)式支持。
Java正則表達(dá)式包
java.util.regex包由三個(gè)類組成:Pattern、Matcher和PatternSyntaxException:
- Pattern模式對(duì)象是一個(gè)已編譯的正則表達(dá)式。Pattern類不提供公共構(gòu)造函數(shù)。要?jiǎng)?chuàng)建一個(gè)模式,我們必須首先調(diào)用它的一個(gè)公共靜態(tài)編譯方法,然后該方法將返回一個(gè)模式對(duì)象。這些方法接受正則表達(dá)式作為第一個(gè)參數(shù)。
- Matcher對(duì)象解釋模式并對(duì)輸入字符串執(zhí)行匹配操作。它也沒(méi)有定義公共構(gòu)造函數(shù)。我們通過(guò)調(diào)用模式對(duì)象上的Matcher方法來(lái)獲得Matcher對(duì)象。
- PatternSyntaxException對(duì)象是一個(gè)未經(jīng)檢查的異常,它指示正則表達(dá)式模式中的語(yǔ)法錯(cuò)誤。
我們必須首先了解正則表達(dá)式是如何在Java中構(gòu)造的。
如果你已經(jīng)從不同的環(huán)境中熟悉了正則表達(dá)式,你可能會(huì)發(fā)現(xiàn)某些差異,但它們是最小的。
簡(jiǎn)單的例子
讓我們從正則表達(dá)式的最簡(jiǎn)單用例開(kāi)始。如前所述,當(dāng)正則表達(dá)式應(yīng)用于字符串時(shí),它可能會(huì)匹配零次或多次。
java支持的最基本的模式匹配形式。java.util.regex正則表達(dá)式API是字符串文本的匹配。例如,如果正則表達(dá)式為foo,輸入字符串為foo,則匹配將成功,因?yàn)樽址嗤?/p>
@Test
public void givenText_whenSimpleRegexMatches_thenCorrect() {
Pattern pattern = Pattern.compile("foo");
Matcher matcher = pattern.matcher("foo");
assertTrue(matcher.find());
}我們首先通過(guò)調(diào)用其靜態(tài)編譯方法并向其傳遞我們想要使用的模式來(lái)創(chuàng)建一個(gè)Pattern對(duì)象。
然后我們創(chuàng)建一個(gè)Matcher對(duì)象,調(diào)用Pattern對(duì)象的Matcher方法,并將要檢查匹配的文本傳遞給它。
之后,我們?cè)贛atcher對(duì)象中調(diào)用find方法。
find方法在輸入文本中不斷前進(jìn),并為每個(gè)匹配返回true,因此我們也可以使用它來(lái)查找匹配計(jì)數(shù):
@Test
public void givenText_whenSimpleRegexMatchesTwice_thenCorrect() {
Pattern pattern = Pattern.compile("foo");
Matcher matcher = pattern.matcher("foofoo");
int matches = 0;
while (matcher.find()) {
matches++;
}
assertEquals(matches, 2);
}由于我們將運(yùn)行更多的測(cè)試,我們可以抽象出在一個(gè)名為runTest的方法中查找匹配數(shù)的邏輯:
public static int runTest(String regex, String text) {
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(text);
int matches = 0;
while (matcher.find()) {
matches++;
}
return matches;
}
當(dāng)我們得到0個(gè)匹配項(xiàng)時(shí),測(cè)試應(yīng)該失敗,否則應(yīng)該通過(guò)。
Meta Characters元字符
元字符會(huì)影響模式匹配的方式,從而為搜索模式添加邏輯。JavaAPI支持多個(gè)Meta Characters,最簡(jiǎn)單的是“.”匹配任何字符:
@Test
public void givenText_whenMatchesWithDotMetach_thenCorrect() {
int matches = runTest(".", "foo");
assertTrue(matches > 0);
}考慮到前面的例子,其中regex-foo匹配文本foo和foo兩次。如果我們?cè)谡齽t表達(dá)式中使用點(diǎn)元字符,那么在第二種情況下,我們不會(huì)得到兩個(gè)匹配:
@Test
public void givenRepeatedText_whenMatchesOnceWithDotMetach_thenCorrect() {
int matches= runTest("foo.", "foofoo");
assertEquals(matches, 1);
}注意正則表達(dá)式中foo后面的點(diǎn)。匹配器匹配前面有foo的每個(gè)文本,因?yàn)樽詈笠粋€(gè)點(diǎn)部分表示后面的任何字符。因此,在找到第一個(gè)foo之后,其余的被視為任何角色。這就是為什么只有一場(chǎng)比賽。
該API支持其他幾個(gè)元字符<([{\^-=$!|]})?*+.>我們將在本文中進(jìn)一步探討。
Character類
瀏覽官方模式類規(guī)范,我們將發(fā)現(xiàn)受支持的正則表達(dá)式構(gòu)造的摘要。在Character類下,我們有大約6個(gè)結(jié)構(gòu)。
OR
構(gòu)造為[abc]。集合中的任何元素都是匹配的:
@Test
public void givenORSet_whenMatchesAny_thenCorrect() {
int matches = runTest("[abc]", "b");
assertEquals(matches, 1);
}如果它們都出現(xiàn)在文本中,則每一個(gè)單獨(dú)匹配,不考慮順序:
@Test
public void givenORSet_whenMatchesAnyAndAll_thenCorrect() {
int matches = runTest("[abc]", "cab");
assertEquals(matches, 3);
}它們也可以作為字符串的一部分進(jìn)行替換。在下面的示例中,當(dāng)我們通過(guò)將第一個(gè)字母與集合中的每個(gè)元素交替來(lái)創(chuàng)建不同的單詞時(shí),它們都是匹配的:
@Test
public void givenORSet_whenMatchesAllCombinations_thenCorrect() {
int matches = runTest("[bcr]at", "bat cat rat");
assertEquals(matches, 3);
}NOR
通過(guò)添加插入符號(hào)作為第一個(gè)元素來(lái)否定上述集合:
@Test
public void givenNORSet_whenMatchesNon_thenCorrect() {
int matches = runTest("[^abc]", "g");
assertTrue(matches > 0);
}另外一個(gè)例子:
@Test
public void givenNORSet_whenMatchesAllExceptElements_thenCorrect() {
int matches = runTest("[^bcr]at", "sat mat eat");
assertTrue(matches > 0);
}Range類
我們可以定義一個(gè)類,該類使用連字符(-)指定匹配文本應(yīng)該落在的范圍內(nèi),同樣,我們也可以否定一個(gè)范圍。
匹配大寫字母:
@Test
public void givenUpperCaseRange_whenMatchesUpperCase_
thenCorrect() {
int matches = runTest(
"[A-Z]", "Two Uppercase alphabets 34 overall");
assertEquals(matches, 2);
}匹配小寫字母:
@Test
public void givenLowerCaseRange_whenMatchesLowerCase_
thenCorrect() {
int matches = runTest(
"[a-z]", "Two Uppercase alphabets 34 overall");
assertEquals(matches, 26);
}匹配大小寫字母:
@Test
public void givenBothLowerAndUpperCaseRange_
whenMatchesAllLetters_thenCorrect() {
int matches = runTest(
"[a-zA-Z]", "Two Uppercase alphabets 34 overall");
assertEquals(matches, 28);
}匹配范圍:
@Test
public void givenNumberRange_whenMatchesAccurately_
thenCorrect() {
int matches = runTest(
"[1-5]", "Two Uppercase alphabets 34 overall");
assertEquals(matches, 2);
}匹配另外的數(shù)字范圍:
@Test
public void givenNumberRange_whenMatchesAccurately_
thenCorrect2(){
int matches = runTest(
"[30-35]", "Two Uppercase alphabets 34 overall");
assertEquals(matches, 1);
}Union類
union字符類是兩個(gè)或多個(gè)字符類組合的結(jié)果:
@Test
public void givenTwoSets_whenMatchesUnion_thenCorrect() {
int matches = runTest("[1-3[7-9]]", "123456789");
assertEquals(matches, 6);
}上述測(cè)試將只匹配9個(gè)整數(shù)中的6個(gè),因?yàn)椴⒓^(guò)4、5和6。
Intersection類
與union類類似,該類是在兩個(gè)或多個(gè)集合之間拾取公共元素的結(jié)果。要應(yīng)用交叉點(diǎn),我們使用&&:
@Test
public void givenTwoSets_whenMatchesIntersection_thenCorrect() {
int matches = runTest("[1-6&&[3-9]]", "123456789");
assertEquals(matches, 4);
}
我們得到4個(gè)匹配,因?yàn)閮蓚€(gè)集合的交集只有4個(gè)元素。
Subtraction類
我們可以使用減法對(duì)一個(gè)或多個(gè)字符類求反,例如匹配一組奇數(shù)十進(jìn)制數(shù):
@Test
public void givenSetWithSubtraction_whenMatchesAccurately_thenCorrect() {
int matches = runTest("[0-9&&[^2468]]", "123456789");
assertEquals(matches, 5);
}到此這篇關(guān)于Java正則表達(dá)式API系列詳情的文章就介紹到這了,更多相關(guān)Java正則表達(dá)式 內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
什么是springMVC?視圖和視圖解析器實(shí)例代碼
在 springMVC 中的目標(biāo)方法最終返回都是一個(gè)視圖,返回的視圖都會(huì)由一個(gè)視圖解析器來(lái)處理,這篇文章主要介紹了什么是springMVC?視圖和視圖解析器,需要的朋友可以參考下2023-09-09
spring boot actuator監(jiān)控超詳細(xì)教程
Spring Boot Actuator就是一款可以幫助你監(jiān)控系統(tǒng)數(shù)據(jù)的框架,其可以監(jiān)控很多很多的系統(tǒng)數(shù)據(jù),接下來(lái)通過(guò)本文給大家介紹spring boot actuator監(jiān)控超詳細(xì)教程,感興趣的朋友一起看看吧2021-10-10
Spring security用戶URL權(quán)限FilterSecurityInterceptor使用解析
這篇文章主要介紹了Spring security用戶URL權(quán)限FilterSecurityInterceptor使用解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-12-12
Spring boot整合Mybatis-plus過(guò)程解析
這篇文章主要介紹了Spring boot整合Mybatis-plus過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-03-03
Mybatis-Plus自動(dòng)填充的實(shí)現(xiàn)示例
這篇文章主要介紹了Mybatis-Plus自動(dòng)填充的實(shí)現(xiàn)示例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08
一文教你使用Java?Calendar類進(jìn)行日期計(jì)算
在日常開(kāi)發(fā)中,我們常常需要進(jìn)行日期計(jì)算,比如計(jì)算兩個(gè)日期之間的天數(shù)、月數(shù),在Java中,我們可以使用Java?Calendar類來(lái)進(jìn)行日期計(jì)算,下面就跟隨小編一起來(lái)學(xué)習(xí)一下吧2023-10-10

