Golang 正則匹配效率詳解
最近有個小需求,校驗IMEI是否為15位純數(shù)字(是否合法)
以下是正則匹配
與自己實現(xiàn)的簡單驗證方式進(jìn)行壓測
package main
import (
"regexp"
"testing"
)
func BenchmarkIsDigitalRegexp(b *testing.B) {
for i := 0; i < b.N; i++ {
_ = isDigitalRegexp("358901806972417")
}
}
func BenchmarkIsDigital(b *testing.B) {
for i := 0; i < b.N; i++ {
_ = isDigital("358901806972417")
}
}
func isDigitalRegexp(imei string) bool {
if ok, _ := regexp.Match("^[0-9]{15}$", []byte(imei)); ok {
return true
}else {
return false
}
}
func isDigital(imei string) bool {
n := len(imei)
if n == 15 {
for i := 0; i < n; i++ {
if imei[i] >= 48 && imei[i] <= 57 {
continue
}else {
return false
}
}
}else {
return false
}
return true
}
壓測結(jié)果:
C:\Users\M709FJSA\go\src\pprof_demo\re>go test -bench=. -benchmem goos: windows goarch: amd64 pkg: pprof_demo/re BenchmarkIsDigitalRegexp-12 300000 4644 ns/op 6450 B/op 70 allocs/op BenchmarkIsDigital-12 200000000 9.48 ns/op 0 B/op 0 allocs/op PASS ok pprof_demo/re 4.577s
很明顯,正則需要重新分配內(nèi)存較多,從pprof生成圖也可以看出,正則調(diào)用關(guān)系錯綜復(fù)雜

補充:Golang —— 正則表達(dá)式
正則表達(dá)式是一種進(jìn)行模式匹配和文本操縱的復(fù)雜而又強大的工具。雖然正則表達(dá)式比純粹的文本匹配效率低,但是它卻更靈活。
按照它的語法規(guī)則,隨需構(gòu)造出的匹配模式就能夠從原始文本中篩選出幾乎任何你想要得到的字符組合。
Go語言通過regexp標(biāo)準(zhǔn)包為正則表達(dá)式提供了官方支持,如果你已經(jīng)使用過其他編程語言提供的正則相關(guān)功能,那么你應(yīng)該對Go語言版本的不會太陌生,但是它們之間也有一些小的差異,因為Go實現(xiàn)的是RE2標(biāo)準(zhǔn),除了\C。
其實字符串處理我們可以使用strings包來進(jìn)行搜索(Contains、Index)、替換(Replace)和解析(Split、Join)等操作,但是這些都是簡單的字符串操作,他們的搜索都是大小寫敏感,而且固定的字符串,如果我們需要匹配可變的那種就沒辦法實現(xiàn)了,當(dāng)然如果strings包能解決你的問題,那么就盡量使用它來解決。
因為他們足夠簡單、而且性能和可讀性都會比正則好。
正則匹配規(guī)則圖
詳細(xì)請參考官方文檔

簡單的正則表達(dá)式
1. 匹配任意類型
buf := "abc azc a7c aac 888 a9c tac"
// 1. 解釋規(guī)則
reg := regexp.MustCompile(`a.c`) // 這里會解析正則表達(dá)式,成功就返回解釋器(. ——> 除\n外任意字符)
if reg == nil { // 解釋失敗
fmt.Println("MustCompile err")
return
}
// 2. 根據(jù)規(guī)則提取關(guān)鍵信息
res := reg.FindAllStringSubmatch(buf, -1) //-1表示匹配所有的
// res := reg.FindAllStringSubmatch(buf, 1) //1表示匹配一個
fmt.Println("res = ", res)
執(zhí)行結(jié)果:
res = [[abc] [azc] [a7c] [aac] [a9c]]
2. 使用 […] (字符集) 匹配[0-9]之間的數(shù)值
buf := "abc azc a7c aac 888 a9c tac"
//1) 解釋規(guī)則, 它會解析正則表達(dá)式,如果成功返回解釋器
reg1 := regexp.MustCompile(`a[0-9]c`)
if reg1 == nil { //解釋失敗,返回nil
fmt.Println("MustCompile err")
return
}
//2) 根據(jù)規(guī)則提取關(guān)鍵信息
result1 := reg1.FindAllStringSubmatch(buf, -1)
fmt.Println("result1 = ", result1)
執(zhí)行結(jié)果:
result1 = [[a7c] [a9c]]
3. 使用 \d 匹配[0-9]之間的數(shù)值
buf := "abc azc a7c aac 888 a9c tac"
//1) 解釋規(guī)則, 它會解析正則表達(dá)式,如果成功返回解釋器
reg1 := regexp.MustCompile(`a\dc`)
if reg1 == nil { //解釋失敗,返回nil
fmt.Println("MustCompile err")
return
}
//2) 根據(jù)規(guī)則提取關(guān)鍵信息
result1 := reg1.FindAllStringSubmatch(buf, -1)
fmt.Println("result1 = ", result1)
執(zhí)行結(jié)果:
result1 = [[a7c] [a9c]]
4.匹配小數(shù)
buf := "3.14 456 adsc as23d 1.23 3. 9.99 1lsa23d 0.08 0.00 "
// 解釋正則表達(dá)式
reg := regexp.MustCompile(`\d+\.\d+`) // +表示匹配前一個字符的一次或者多次
if reg == nil {
fmt.Println("MustCompile err")
return
}
// 提取關(guān)鍵信息
res := reg.FindAllStringSubmatch(buf, -1)
fmt.Println("res = ", res)
執(zhí)行結(jié)果:
res = [[3.14] [1.23] [9.99] [0.08] [0.00]]
5.匹配信息中某關(guān)鍵字并過濾帶標(biāo)簽的
// ` ` 是原生字符串
buf := `
<!DOCTYPE html>
<html lang="zh-CN">
<head>
<title>Go語言標(biāo)準(zhǔn)庫文檔中文版 | Go語言中文網(wǎng) | Golang中文社區(qū) | Golang中國</title>
<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1.0, user-scalable=no">
<meta http-equiv="X-UA-Compatible" content="IE=edge, chrome=1">
<meta charset="utf-8">
<link rel="shortcut icon" href="/static/img/go.ico" rel="external nofollow" >
<link rel="apple-touch-icon" type="image/png" href="/static/img/logo2.png" rel="external nofollow" >
<meta name="author" content="polaris <polaris@studygolang.com>">
<meta name="keywords" content="中文, 文檔, 標(biāo)準(zhǔn)庫, Go語言,Golang,Go社區(qū),Go中文社區(qū),Golang中文社區(qū),Go語言社區(qū),Go語言學(xué)習(xí),學(xué)習(xí)Go語言,Go語言學(xué)習(xí)園地,Golang 中國,Golang中國,Golang China, Go語言論壇, Go語言中文網(wǎng)">
<meta name="description" content="Go語言文檔中文版,Go語言中文網(wǎng),中國 Golang 社區(qū),Go語言學(xué)習(xí)園地,致力于構(gòu)建完善的 Golang 中文社區(qū),Go語言愛好者的學(xué)習(xí)家園。分享 Go 語言知識,交流使用經(jīng)驗">
</head>
<div>和愛好</div>
<div>哈哈
你在嗎
不在
</div>
<div>測試</div>
<div>你過來啊</div>
<frameset cols="15,85">
<frame src="/static/pkgdoc/i.html">
<frame name="main" src="/static/pkgdoc/main.html" tppabs="main.html" >
<noframes>
</noframes>
</frameset>
</html>
`
// 解釋正則表達(dá)式
reg := regexp.MustCompile(`<div>(?s:(.*?))</div>`) // s用來處理換行情況
if reg == nil {
fmt.Println("MustCompile err")
return
}
// 提取關(guān)鍵字
res := reg.FindAllStringSubmatch(buf, -1)
// fmt.Println("res = ", res)
// 過濾<> </>
for _, text := range res {
//fmt.Println("text[0] = ", text[0]) // 帶<> </>的
fmt.Println("text[1] = ", text[1]) // 不帶<> </> 的
}
執(zhí)行結(jié)果:
text[1] = 和愛好
text[1] = 哈哈
你在嗎
不在
text[1] = 測試
text[1] = 你過來啊
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
Golang實現(xiàn)解析JSON的三種方法總結(jié)
這篇文章主要為大家詳細(xì)介紹了Golang實現(xiàn)解析JSON的三種方法,文中的示例代碼講解詳細(xì),對我們學(xué)習(xí)了解JSON有一定幫助,需要的可以參考一下2022-09-09
golang使用mTLS實現(xiàn)雙向加密認(rèn)證http通信
這篇文章主要為大家介紹了golang如何調(diào)用mTLS實現(xiàn)雙向加密認(rèn)證http通信,文中的示例代碼講解詳細(xì),具有一定的學(xué)習(xí)價值,需要的小伙伴可以參考下2023-08-08
CMD下執(zhí)行Go出現(xiàn)中文亂碼的解決方法
需要在Go寫的服務(wù)里面調(diào)用命令行或者批處理,并根據(jù)返回的結(jié)果做處理。但是windows下面用cmd返回中文會出現(xiàn)亂碼,本文就詳細(xì)的介紹一下解決方法,感興趣的可以了解一下2021-12-12
golang API開發(fā)過程的中的自動重啟方式(基于gin框架)
這篇文章主要介紹了golang API開發(fā)過程的中的自動重啟方式(基于gin框架),本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-12-12

