腳本之家服務器常用軟件

快捷導航

淺談正則表達式回溯陷阱

更新時間：2023年11月27日 09:35:34 作者：JebLin02

日常編程經(jīng)常會用到正則表達式,躲不開這個陷阱,本文主要介紹了淺談正則表達式回溯陷阱,具有一定的參考價值,感興趣的可以了解一下

一、匹配場景

判斷一個句子是不是正規(guī)英文句子

text = "I am a student"

一個正常的英文句子如上，英文單詞 + 空格隔開

英文單詞 = 多個英文字符 [a-zA-Z]

空格用 \s 表示

那么一個句子就是單詞 + 空格（一個或者多個，最后那個單詞是0個）（可能有多個單詞+空格）+ 最后一個句號 .

那正則就是

^([a-zA-Z]+(\s)*)+$

JAVA代碼

public static void main(String[] args) {
        String text = "I am a good student";
        String regex = "^([a-zA-Z]+(\\s)*)+$";

        Pattern pattern = Pattern.compile(regex);
        Matcher matcher = pattern.matcher(text);
        System.out.println(matcher.find());
        System.out.println(matcher.group(0));
    }

輸出結果：

true
I am a good student

二、性能測試

regex101: build, test, and debug regex.

icon-default.png?t=N7T8

句子改成：I am a good good student

匹配成功了。39 step，耗時0.1ms，

但是假如把句子拉長點，最后加上一個問號 ？

I am a good good student？

83408 step，耗時5.4ms

假如把句子再拉長點，那么直接就干爆CPU，耗時指數(shù)增長，

為啥會這樣呢？

三、正則的回溯陷阱

1、了解下NFA與DFA

DFA (Deterministic finite automaton) 確定型有窮自動機
NFA (Non-deterministic finite automaton) 非確定型有窮自動機

DFA ：遍歷text字符串，去和Pattern匹配

NFA：遍歷Pattern，去與text匹配

DFA（是電動機）和NFA（汽油機）都有很長的歷史，不過，正如汽油機一樣，NFA 的歷史更長一些。也有些系統(tǒng)采用了混合引擎，它們會根據(jù)任務的不同選擇合適的引擎（甚至對同一表達式中的不同部分采用不同的引擎，以求得功能與速度之間的最佳平衡）。 ——《精通正則表達式》

絕大多數(shù)編程語言都選擇的引擎——NFA (非確定型有窮自動機) 引擎

2、NFA的回溯

字符串：abc

表達式：a(d|b)c

注意這個位置回退！?。?/strong>

3、簡易例子分析

表達式 = ^(a*)+$ 文本 = aaaaaaaaaaaaaaab

走了16w步，花了7.3ms

首先 (a*) 已經(jīng)匹配到 aaaaaaaaaaaaaaa 了，
(a*)+ 也匹配到 aaaaaaaaaaaaaaa ，
結束符$去匹配的時候，發(fā)現(xiàn)text不是結束，而是一個b
那吐出最后的a，變成 (aaaaaaaaaaaaaa) a ，沒匹配上，繼續(xù)吐

a* a* (aaaaaaaaaaaaa) (aa) a* a* a* (aaaaaaaaaaaaa) (a)(a) a* a* (aaaaaaaaaaaa) (aaa) a* a* a* (aaaaaaaaaaaa) (aa)(a) a* a* a* a* (aaaaaaaaaaaa) (a)(a)(a) --> 吐到最后 (a)(a)(a)(a)(a)(a)(a)(a)(a)(a)(a)(a)(a)(a)(a)

直接干爆CPU

4、咋優(yōu)化?

1、對于 ^(a*)+$

直接把表達式

^(a*)+$

改成 ^(a*)$

把后面的 + 號去掉。

直接就是 5 Step，0.1ms

2、對于 ^([a-zA-Z]+(\s)*)+$

把后面的 + 號去掉。就不回溯了，

但是匹配不上，因為語句有問題，就是空格必須存在，但是最后的空格不存在

所以改成：^[a-zA-Z]+(\s[a-zA-Z]+)*$

遇到問號也不回溯

去掉問號也匹配上了

到此這篇關于淺談正則表達式回溯陷阱的文章就介紹到這了,更多相關正則表達式回溯陷阱內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:
正則表達式之回溯
PHP正則表達式的效率回溯與固化分組
小議正則表達式效率貪婪、非貪婪與回溯
編寫高質(zhì)量的js之正確理解正則表達式回溯
PHP 正則表達式效率貪婪、非貪婪與回溯分析(推薦)
正則表達式學習教程之回溯引用backreference詳解
正則表達式之分組的回溯引用問題
如何防止JavaScript中的正則表達式回溯

正則表達式

回溯

相關文章

JS基礎教程——正則表達式示例(推薦)
本文給大家分享js基礎之正則表達式知識，以及在正則表達式中() [] {}所代表的意思，本文給大家介紹的非常詳細，需要的朋友參考下
2017-01-01

正則表達式學習問答
正則表達式是難學的，這不存在疑義。但是我認為，難點也只在語法方面。正則表達式已經(jīng)有年頭了，它（的語法）誕生于上世紀七十年代。那是個怎樣的情景？
2012-09-09

$正則表達式[\s\S]*與[\w\W]* 什么意思$
正則表達式[\s\S]*與[\w\W]* 什么意思
很多人咨詢[\s\S]*與[\w\W]* 什么意思，不是有.了嗎，那么它們的組合，表示所有的都匹配，與它相對應的，有[\w\W]等，意義完全相同,需要的朋友可以參考下
2020-03-03

正則表達式(?=)正向先行斷言實戰(zhàn)案例
x(?=y)稱為先行斷言(Positive look-ahead),x只有在y前面才匹配,y不會被計入返回結果,比如要匹配后面跟著百分號的數(shù)字,可以寫成/\d+(?=%)/,這篇文章主要給大家介紹了關于正則表達式(?=)正向先行斷言的相關資料,需要的朋友可以參考下
2022-11-11

php獲取超鏈接文本內(nèi)容的正則表達式(五種方法)
正則表達式在php中應用非常廣泛，下面是腳本之家小編跟大家分享的php獲取超鏈接文本內(nèi)容的正則表達式，感興趣的朋友一起看看吧
2015-10-10

正則表達式模式修飾符
下面列出了當前可用的正則表達式修飾符。括號中提到的名字是正則表達式內(nèi)部這些修飾符的名稱。模式修飾符中的空格，換行符會被忽略，其他字符會導致錯誤
2016-12-12

JS點擊圖片改變圖片圖徑并用正則表達式取圖片名的代碼
JS點擊圖片改變圖片圖徑并用正則表達式取圖片名，非常不錯的效果。
2010-06-06

正則表達式匹配IP的表達式(推薦)
正則表達式，又稱規(guī)則表達式。接下來通過本文給大家介紹正則表達式匹配IP的表達式，非常不錯，具有參考借鑒價值，需要的的朋友參考下吧
2016-12-12

C#中正則表達式與回車換行符問題
這篇文章主要介紹了C#中正則表達式與回車換行符問題,需要的朋友可以參考下
2018-03-03

好東西，老外用正則表達式寫的HTML分離函數(shù)
好東西，老外用正則表達式寫的HTML分離函數(shù)...
2006-06-06

最新評論

大家感興趣的內(nèi)容

1正則表達式匹配不包含某些字符串的技巧
2最新手機號碼、電話號碼正則表達式
3正則表達式匹配任意字符（包括換行符）的寫法
4比較正宗的驗證郵箱的正則表達式js代碼詳解
5Java 正則表達式詳解
6JS利用正則配合replace替換指定字符
7javascript 手機號碼正則表達式驗證函數(shù)
8正則表達式 \w \d 的意義
9正則中需要轉(zhuǎn)義的特殊字符小結
10PHP preg_replace() 正

最近更新的內(nèi)容

VS里的正則表達式的替換技巧
vbs:把一段文字中指定字符顏色變成紅色的正則
PHP正則匹配圖片并給圖片加鏈接詳解
js處理網(wǎng)頁編輯器轉(zhuǎn)義、去除轉(zhuǎn)義、去除HTML標簽的正則
JavaScript 正則表達式與字符串查找方法
正則表達式練習器
sql關鍵詞腳本檢查正則表達式的方法
65條最常用正則表達式你要的都在這里了
正則表達式中對各字符集編碼范圍的總結
淺談正則速記法的技巧

常用在線小工具

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

淺談正則表達式回溯陷阱

目錄

一、匹配場景

二、性能測試

三、正則的回溯陷阱

1、了解下NFA與DFA

2、NFA的回溯

3、簡易例子分析

4、咋優(yōu)化?

相關文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

淺談正則表達式回溯陷阱

目錄

一、匹配場景

二、性能測試

三、正則的回溯陷阱

1、了解下NFA與DFA

2、NFA的回溯

3、簡易例子分析

4、咋優(yōu)化?

相關文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

一、匹配場景

三、正則的回溯陷阱

1、了解下NFA與DFA

2、NFA的回溯

3、簡易例子分析

4、咋優(yōu)化?