一文帶你全面掌握Go語(yǔ)言中的正則表達(dá)式

更新時(shí)間：2023年05月11日 16:32:53 作者：金刀大菜牙

正則表達(dá)式是一種強(qiáng)大的模式匹配工具，能夠在文本中進(jìn)行靈活的搜索和替換操作，本文將介紹?Golang?中的正則表達(dá)式語(yǔ)法，包括常用的匹配符號(hào)、模式修飾符以及示例應(yīng)用，希望對(duì)大家有所幫助

正則表達(dá)式是一種強(qiáng)大的模式匹配工具，能夠在文本中進(jìn)行靈活的搜索和替換操作。本文將介紹 Golang 中的正則表達(dá)式語(yǔ)法，包括常用的匹配符號(hào)、模式修飾符以及示例應(yīng)用。通過(guò)深入了解 Golang 正則表達(dá)式，您將能夠更好地利用這一工具來(lái)處理字符串操作。

1. 正則表達(dá)式語(yǔ)法

正則表達(dá)式是一種用于匹配和操作文本的強(qiáng)大工具，它使用特殊的字符和語(yǔ)法來(lái)定義模式。在 Golang 的 regexp 包中，使用的正則表達(dá)式語(yǔ)法是基于標(biāo)準(zhǔn)的 POSIX 正則表達(dá)式語(yǔ)法的一個(gè)子集。

以下是一些常用的正則表達(dá)式元字符：

. ：匹配任意單個(gè)字符，除了換行符。
* ：匹配前面的元素零次或多次。
+ ：匹配前面的元素一次或多次。
? ：匹配前面的元素零次或一次。
^ ：匹配字符串的開(kāi)頭。
$ ：匹配字符串的結(jié)尾。
[] ：字符類，匹配方括號(hào)中的任意字符。
[^] ：否定字符類，匹配除方括號(hào)中字符以外的任意字符。
| ：邏輯或，匹配兩個(gè)模式之一。
() ：捕獲組，用于分組和提取匹配的子字符串。

示例代碼：

package main
?
import (
    "fmt"
    "regexp"
)
?
func main() {
    str := "Hello, World!"
    re := regexp.MustCompile(`H.llo`)
?
    fmt.Println(re.MatchString(str)) // true
}

在上面的示例中，我們創(chuàng)建了一個(gè)正則表達(dá)式對(duì)象 re，它使用了.元字符來(lái)匹配 H 后面的任意字符，然后是 llo。我們使用 MatchString 方法來(lái)檢查字符串 str 是否匹配該正則表達(dá)式，它將返回 true。

2. 創(chuàng)建正則表達(dá)式對(duì)象

在 Golang 中，要使用正則表達(dá)式進(jìn)行匹配，首先需要?jiǎng)?chuàng)建一個(gè)正則表達(dá)式對(duì)象?？梢允褂?regexp.Compile 函數(shù)或正則表達(dá)式字面量來(lái)創(chuàng)建對(duì)象。

示例代碼：

package main
?
import (
    "fmt"
    "regexp"
)
?
func main() {
    str := "Hello, World!"
    re := regexp.MustCompile(`[aeiou]`)
?
    fmt.Println(re.MatchString(str)) // true
}

當(dāng)我們運(yùn)行上述代碼時(shí)，它將打印出 true，因?yàn)檎齽t表達(dá)式 [aeiou] 匹配字符串中的任何一個(gè)元音字母。

在上面的示例中，我們使用 regexp.MustCompile 函數(shù)創(chuàng)建了一個(gè)正則表達(dá)式對(duì)象 re，該函數(shù)接受一個(gè)字符串參數(shù)，表示正則表達(dá)式的模式。這個(gè)函數(shù)會(huì)編譯正則表達(dá)式并返回一個(gè)可用于匹配的正則表達(dá)式對(duì)象。

另外，你還可以使用正則表達(dá)式字面量來(lái)創(chuàng)建正則表達(dá)式對(duì)象，如下所示：

package main
?
import (
    "fmt"
    "regexp"
)
?
func main() {
    str := "Hello, World!"
    re := `[aeiou]`
?
    match, _ := regexp.MatchString(re, str)
    fmt.Println(match) // true
}

在這個(gè)示例中，我們直接將正則表達(dá)式模式作為字符串賦值給變量 re，然后使用 regexp.MatchString 函數(shù)檢查字符串 str 是否與正則表達(dá)式匹配。這個(gè)函數(shù)返回一個(gè)布爾值表示匹配結(jié)果。

無(wú)論是使用 regexp.MustCompile 函數(shù)還是正則表達(dá)式字面量，都會(huì)創(chuàng)建一個(gè)正則表達(dá)式對(duì)象，該對(duì)象可以在后續(xù)的匹配操作中使用。

3. 字符串匹配

使用 Golang 的 regexp 包，你可以對(duì)字符串進(jìn)行正則表達(dá)式匹配操作。下面是一些常用的方法：

MatchString(pattern, s string) bool：檢查字符串 s 是否與正則表達(dá)式模式 pattern 匹配，返回一個(gè)布爾值表示匹配結(jié)果。
Match(pattern string, b []byte) (matched bool, err error)：檢查字節(jié)切片 b 是否與正則表達(dá)式模式 pattern 匹配，返回一個(gè)布爾值表示匹配結(jié)果。

示例代碼：

package main
?
import (
    "fmt"
    "regexp"
)
?
func main() {
    str := "Hello, World!"
    re := regexp.MustCompile(`^Hello`)
?
    fmt.Println(re.MatchString(str)) // true
}

在上面的示例中，我們使用 MatchString 方法檢查字符串 str 是否以 Hello 開(kāi)頭。由于 str 的開(kāi)頭確實(shí)是 Hello，所以匹配結(jié)果為 true。

另外，你也可以使用 Match 方法來(lái)檢查字節(jié)切片是否與正則表達(dá)式匹配。例如：

package main
?
import (
    "fmt"
    "regexp"
)
?
func main() {
    str := []byte("Hello, World!")
    re := regexp.MustCompile(`^Hello`)
?
    matched, _ := re.Match(str)
    fmt.Println(matched) // true
}

在這個(gè)示例中，我們將字符串 str 轉(zhuǎn)換為字節(jié)切片，并使用 Match 方法來(lái)檢查它是否以 Hello 開(kāi)頭。同樣，由于匹配成功，所以輸出為 true。

通過(guò)使用這些方法，你可以輕松地檢查字符串是否符合特定的正則表達(dá)式模式。

4. 字符串替換

在 Golang 的 regexp 包中，你可以使用正則表達(dá)式來(lái)進(jìn)行字符串替換操作。以下是常用的方法：

ReplaceAllString(src, repl, pattern string) string：將字符串 src 中所有匹配正則表達(dá)式模式 pattern 的部分替換為 repl，并返回替換后的新字符串。
ReplaceAllStringFunc(src string, repl func(string) string, pattern string) string：根據(jù)匹配的正則表達(dá)式模式 pattern，使用 repl 函數(shù)對(duì)字符串 src 進(jìn)行替換，并返回替換后的新字符串。repl 函數(shù)接收匹配的字符串作為參數(shù)，并返回替換后的字符串。

示例代碼：

package main
?
import (
    "fmt"
    "regexp"
)
?
func main() {
    str := "Hello, Golang!"
    re := regexp.MustCompile(`Golang`)
?
    newStr := re.ReplaceAllString(str, "World")
    fmt.Println(newStr) // Hello, World!
}

在上面的示例中，我們使用 ReplaceAllString 方法將字符串 str 中的 Golang 替換為 World。替換后的新字符串存儲(chǔ)在變量 newStr 中，并打印輸出結(jié)果為 Hello, World!。

如果你想根據(jù)匹配的字符串來(lái)動(dòng)態(tài)替換內(nèi)容，可以使用 ReplaceAllStringFunc 方法。例如：

package main
?
import (
    "fmt"
    "regexp"
    "strings"
)
?
func main() {
    str := "Hello, Golang!"
    re := regexp.MustCompile(`\w+`)
?
    newStr := re.ReplaceAllStringFunc(str, strings.ToUpper)
    fmt.Println(newStr) // HELLO, GOLANG!
}

在這個(gè)示例中，我們使用 ReplaceAllStringFunc 方法將字符串 str 中的每個(gè)單詞轉(zhuǎn)換為大寫(xiě)。我們提供了 strings.ToUpper 函數(shù)作為替換函數(shù)，該函數(shù)將匹配的字符串轉(zhuǎn)換為大寫(xiě)形式。結(jié)果輸出為 HELLO, GOLANG!。

通過(guò)這些方法，你可以對(duì)字符串進(jìn)行靈活的替換操作，根據(jù)正則表達(dá)式模式來(lái)實(shí)現(xiàn)各種替換需求。

5. 捕獲組

在正則表達(dá)式中，捕獲組是用括號(hào)括起來(lái)的子表達(dá)式，它們?cè)试S你在匹配中提取特定的子字符串。Golang 的 regexp 包提供了多個(gè)方法來(lái)處理捕獲組。

FindStringSubmatch(s string) []string：返回一個(gè)字符串切片，其中包含與正則表達(dá)式模式匹配的子字符串及其對(duì)應(yīng)的捕獲組。
FindAllStringSubmatch(s string, n int) string：返回一個(gè)字符串切片的切片，其中包含與正則表達(dá)式模式匹配的所有子字符串及其對(duì)應(yīng)的捕獲組。可指定 n 來(lái)限制匹配的數(shù)量。

示例代碼：

package main
?
import (
    "fmt"
    "regexp"
)
?
func main() {
    str := "John Doe, jane@example.com"
    re := regexp.MustCompile(`(\w+)\s(\w+),\s(\w+@\w+.\w+)`)
?
    match := re.FindStringSubmatch(str)
    fmt.Println(match) // [John Doe, John Doe, jane@example.com]
    fmt.Println("Name:", match[1], match[2])  // Name: John Doe
    fmt.Println("Email:", match[3]) // Email: jane@example.com
}

在上面的示例中，我們使用正則表達(dá)式 (\w+)\s(\w+),\s(\w+@\w+.\w+) 匹配形如 "John Doe, jane@example.com" 的字符串。該正則表達(dá)式包含了三個(gè)捕獲組，分別用于提取名字、姓氏和電子郵件地址。我們使用 FindStringSubmatch 方法來(lái)獲取匹配的結(jié)果，并通過(guò)索引訪問(wèn)捕獲組中的子字符串。

當(dāng)我們打印 match 時(shí)，可以看到它是一個(gè)字符串切片，其中第一個(gè)元素是整個(gè)匹配的字符串，后續(xù)元素是捕獲組中的子字符串。

7. 標(biāo)志（Flags）

Golang 的 regexp 包還提供了一些標(biāo)志（flags）選項(xiàng)，用于修改正則表達(dá)式的行為。這些標(biāo)志可以通過(guò)在正則表達(dá)式模式中添加標(biāo)志參數(shù)來(lái)設(shè)置。

以下是一些常用的標(biāo)志：

i：忽略大小寫(xiě)，使匹配對(duì)大小寫(xiě)不敏感。
m：多行模式，允許 ^ 和 $ 匹配文本的每一行的開(kāi)頭和結(jié)尾。
s：?jiǎn)涡心Ｊ?，使點(diǎn)號(hào) . 可以匹配換行符。
U：非貪婪模式，使匹配盡可能少地進(jìn)行。

示例代碼：

package main
?
import (
"fmt"
"regexp"
)
?
func main() {
    str := "Hello\nworld"
    re := regexp.MustCompile((?m)^(\w+))
    matches := re.FindAllStringSubmatch(str, -1)
    for _, match := range matches {
        fmt.Println("Matched:", match[0])
        fmt.Println("Capture Group 1:", match[1])
    }
}

在上面的示例中，我們使用正則表達(dá)式 (?m)^(\w+) 匹配多行字符串中的每一行的第一個(gè)單詞。標(biāo)志 (?m) 啟用多行模式，^ 匹配每行的開(kāi)頭，(\w+) 是一個(gè)捕獲組，用于匹配一個(gè)或多個(gè)字母數(shù)字字符。我們使用 FindAllStringSubmatch 方法來(lái)獲取所有匹配的結(jié)果，并迭代輸出每個(gè)匹配的字符串和捕獲組。

當(dāng)我們運(yùn)行該代碼時(shí)，輸出將是：

Matched: Hello
Capture Group 1: Hello
Matched: world
Capture Group 1: world

通過(guò)設(shè)置適當(dāng)?shù)臉?biāo)志，你可以調(diào)整正則表達(dá)式的行為，以滿足特定的匹配需求。

8. 常見(jiàn)正則表達(dá)式技巧

當(dāng)使用正則表達(dá)式時(shí)，有一些常見(jiàn)的技巧可以幫助你更有效地處理模式匹配。以下是一些常見(jiàn)的正則表達(dá)式技巧。

8.1 使用限定符

限定符用于指定匹配元素的數(shù)量。以下是一些常見(jiàn)的限定符：

*：匹配前一個(gè)元素零次或多次。
+：匹配前一個(gè)元素一次或多次。
?：匹配前一個(gè)元素零次或一次。
{n}：匹配前一個(gè)元素恰好 n 次。
{n,}：匹配前一個(gè)元素至少 n 次。
{n,m}：匹配前一個(gè)元素至少 n 次，但不超過(guò) m 次。

package main
?
import (
    "fmt"
    "regexp"
)
?
func main() {
    str := "aaaabbbbcccc"
?
    re := regexp.MustCompile(`a{2,}b{2,}c{2,}`)
    match := re.MatchString(str)
    fmt.Println(match) // true
}

在上面的示例中，我們使用正則表達(dá)式 a{2,}b{2,}c{2,} 匹配連續(xù)出現(xiàn)兩次或更多次的字母 "a"、"b" 和 "c"。通過(guò)使用限定符，我們可以定義所需的匹配次數(shù)。

8.2 使用字符類

字符類用于匹配一組特定的字符。以下是一些常見(jiàn)的字符類：

[abc]：匹配字符 "a"、"b" 或 "c"。
[0-9]：匹配任意一個(gè)數(shù)字。
[^0-9]：匹配除數(shù)字以外的任意字符。

package main
?
import (
    "fmt"
    "regexp"
)
?
func main() {
    str := "a1b2c3"
?
    re := regexp.MustCompile(`[0-9]`)
    matches := re.FindAllString(str, -1)
    fmt.Println(matches) // [1 2 3]
}

在上面的示例中，我們使用正則表達(dá)式 [0-9] 匹配字符串中的數(shù)字字符。通過(guò)使用字符類，我們可以定義需要匹配的字符范圍。

8.3 使用元字符

元字符具有特殊的含義。以下是一些常見(jiàn)的元字符：

.：匹配除換行符以外的任意字符。
\w：匹配字母、數(shù)字或下劃線字符。
\d：匹配數(shù)字字符。
\s：匹配空白字符。

package main
?
import (
    "fmt"
    "regexp"
)
?
func main() {
    str := "Hello, World!"
?
    re := regexp.MustCompile(`\w+`)
    matches := re.FindAllString(str, -1)
    fmt.Println(matches) // [Hello World]
}

8.4 使用捕獲組

捕獲組允許你提取匹配的子字符串。通過(guò)使用括號(hào)將子表達(dá)式括起來(lái)，你可以將其作為捕獲組。以下是一個(gè)示例：

package main
?
import (
    "fmt"
    "regexp"
)
?
func main() {
    str := "Hello, Golang!"
?
    re := regexp.MustCompile(`(\w+), (\w+)!`)
    matches := re.FindStringSubmatch(str)
    fmt.Println(matches[0])   // Hello, Golang!
    fmt.Println(matches[1])   // Hello
    fmt.Println(matches[2])   // Golang
}

在上面的示例中，我們使用正則表達(dá)式 (\w+), (\w+)! 匹配以逗號(hào)分隔的兩個(gè)單詞，并將它們作為捕獲組。通過(guò)使用 FindStringSubmatch 方法，我們可以提取整個(gè)匹配的子字符串以及每個(gè)捕獲組的內(nèi)容。

8.5 使用反向引用

反向引用允許你在正則表達(dá)式中引用先前匹配的捕獲組。通過(guò)使用 \n，其中 n 是捕獲組的索引，你可以引用先前的捕獲組。以下是一個(gè)示例：

package main
?
import (
    "fmt"
    "regexp"
)
?
func main() {
    str := "hello hello"
?
    re := regexp.MustCompile(`(\w+) \1`)
    match := re.MatchString(str)
    fmt.Println(match) // true
}

在上面的示例中，我們使用正則表達(dá)式 (\w+) \1 匹配重復(fù)的單詞。\1 表示引用第一個(gè)捕獲組的內(nèi)容。通過(guò)使用反向引用，我們可以匹配重復(fù)出現(xiàn)的模式。

8.6 使用錨點(diǎn)

錨點(diǎn)用于指定匹配發(fā)生的位置。以下是一些常見(jiàn)的錨點(diǎn)：

^：匹配字符串的開(kāi)頭。
$：匹配字符串的結(jié)尾。
\b：匹配單詞的邊界。

package main
?
import (
    "fmt"
    "regexp"
)
?
func main() {
    str := "Hello, Golang!"
?
    re := regexp.MustCompile(`^Hello`)
    match := re.MatchString(str)
    fmt.Println(match) // true
?
    re = regexp.MustCompile(`Golang!$`)
    match = re.MatchString(str)
    fmt.Println(match) // true
?
    re = regexp.MustCompile(`\bGolang\b`)
    match = re.MatchString(str)
    fmt.Println(match) // true
}

在上面的示例中，我們使用不同的錨點(diǎn)來(lái)匹配字符串的開(kāi)頭、結(jié)尾和單詞邊界。通過(guò)使用錨點(diǎn)，我們可以限定匹配發(fā)生的位置。

8.7 使用修飾符

修飾符是用于修改正則表達(dá)式的行為的特殊標(biāo)記。它們可以影響匹配的方式和規(guī)則。以下是一些常見(jiàn)的修飾符。

8.7.1 i 修飾符（不區(qū)分大小寫(xiě)）

使用 i 修飾符可以使匹配過(guò)程對(duì)大小寫(xiě)不敏感。

package main
?
import (
    "fmt"
    "regexp"
)
?
func main() {
    str := "Hello, World!"
?
    re := regexp.MustCompile(`hello`)
    match := re.MatchString(str)
    fmt.Println(match) // false
?
    re = regexp.MustCompile(`(?i)hello`)
    match = re.MatchString(str)
    fmt.Println(match) // true
}

在上面的示例中，正則表達(dá)式 (?i)hello 使用了 i 修飾符，使匹配過(guò)程不區(qū)分大小寫(xiě)。

8.7.2 m 修飾符（多行模式）

使用 m 修飾符可以使 ^ 和 $ 錨點(diǎn)匹配每一行的開(kāi)頭和結(jié)尾，而不僅僅是整個(gè)字符串的開(kāi)頭和結(jié)尾。

package main
?
import (
    "fmt"
    "regexp"
)
?
func main() {
    str := `Line 1
Line 2
Line 3`
?
    re := regexp.MustCompile(`^Line \d+$`)
    match := re.MatchString(str)
    fmt.Println(match) // false
?
    re = regexp.MustCompile(`(?m)^Line \d+$`)
    match = re.MatchString(str)
    fmt.Println(match) // true
}

在上面的示例中，正則表達(dá)式 (?m)^Line \d+使用了m修飾符，使和使用了 m 修飾符，使 ^ 和使用了m修飾符，使和錨點(diǎn)匹配每一行的開(kāi)頭和結(jié)尾。

8.7.3 s 修飾符（單行模式）

使用 s 修飾符可以使 . 元字符匹配包括換行符在內(nèi)的任意字符。

package main
?
import (
    "fmt"
    "regexp"
)
?
func main() {
    str := "Hello\nWorld!"
?
    re := regexp.MustCompile(`Hello.World!`)
    match := re.MatchString(str)
    fmt.Println(match) // false
?
    re = regexp.MustCompile(`(?s)Hello.World!`)
    match = re.MatchString(str)
    fmt.Println(match) // true
}

在上面的示例中，正則表達(dá)式 (?s)Hello.World! 使用了 s 修飾符，使 . 元字符可以匹配包括換行符在內(nèi)的任意字符。

修飾符可以在正則表達(dá)式中使用括號(hào)和 ? 符號(hào)的形式，如 (?i)、(?m) 和 (?s)。它們可以單獨(dú)使用，也可以組合使用，以適應(yīng)特定的匹配需求。

8.7.4 x 修飾符（忽略空白字符）

使用 x 修飾符可以在正則表達(dá)式中忽略空白字符，包括空格、制表符和換行符。這樣可以使正則表達(dá)式更易讀和維護(hù)。

package main
?
import (
    "fmt"
    "regexp"
)
?
func main() {
    str := "Hello World!"
?
    re := regexp.MustCompile(`Hello   World!`)
    match := re.MatchString(str)
    fmt.Println(match) // false
?
    re = regexp.MustCompile(`(?x)Hello   World!`)
    match = re.MatchString(str)
    fmt.Println(match) // true
}

在上面的示例中，正則表達(dá)式 (?x)Hello World! 使用了 x 修飾符，忽略了正則表達(dá)式中的空白字符。這樣可以使正則表達(dá)式更易讀，減少了空格的影響。

8.7.5 U 修飾符（非貪婪模式）

使用 U 修飾符可以將匹配模式設(shè)置為非貪婪模式，即盡可能少地匹配字符。

package main
?
import (
    "fmt"
    "regexp"
)
?
func main() {
    str := "Hello World!"
?
    re := regexp.MustCompile(`H.*o`)
    match := re.FindString(str)
    fmt.Println(match) // Hello World!
?
    re = regexp.MustCompile(`H.*?o`)
    match = re.FindString(str)
    fmt.Println(match) // Hello
}

在上面的示例中，正則表達(dá)式 H.o 使用了貪婪模式，匹配了從 "H" 到最后一個(gè) "o" 的最長(zhǎng)字符串。而正則表達(dá)式 H. ?o 使用了 U 修飾符，將匹配模式設(shè)置為非貪婪模式，只匹配了從 "H" 到第一個(gè) "o" 的最短字符串。

9. 總結(jié)

通過(guò)本文的介紹，希望你現(xiàn)在能夠?qū)τ?Golang 正則表達(dá)式語(yǔ)法有更深入的了解。正則表達(dá)式是一個(gè)強(qiáng)大的字符串匹配工具，在文本處理、數(shù)據(jù)清洗、表單驗(yàn)證等方面都有廣泛的應(yīng)用。掌握正則表達(dá)式語(yǔ)法，可以提高大家的字符串處理效率和靈活性。希望本文能夠?qū)Υ蠹以?Golang 中使用正則表達(dá)式提供幫助，并激發(fā)大家對(duì)正則表達(dá)式的進(jìn)一步探索。

以上就是一文帶你全面掌握Go語(yǔ)言中的正則表達(dá)式的詳細(xì)內(nèi)容，更多關(guān)于Go語(yǔ)言正則表達(dá)式的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章！

您可能感興趣的文章: