C#正則表達(dá)式的遞歸匹配分析
在C#程序設(shè)計(jì)中經(jīng)常會(huì)遇到這樣的需求,要求匹配出成對(duì)的小括號(hào)里的內(nèi)容,但是一般正則表達(dá)式中的 ?R 的語法似乎在C#中不被支持, 經(jīng)過一番查找與測(cè)試,終于找到以下一段描述
/( 應(yīng)該是 \( 不是用 /轉(zhuǎn)義而是用 \來轉(zhuǎn)義
匹配嵌套的構(gòu)造
微軟公司已經(jīng)包含了一個(gè)有趣的創(chuàng)新來匹配穩(wěn)定的構(gòu)造(歷史上,這是正則表達(dá)式所做不到的)。這并不容易掌握 — 盡管這節(jié)較短,但是注意,它非常的晦澀難懂。
從一個(gè)例子開始可能更簡(jiǎn)單一些,所以我用這段代碼作為開始:
Regex r = new Regex(@"/((?>[^()]+|/((?<DEPTH>)|/)(?<-DEPTH>))*(?(DEPTH)(?!))/)");
這能匹配到首個(gè)完全配對(duì)的括號(hào)組,比如"before (nope (yes (here) okay) after"里面的"(yes (here) okay)"。注意第一個(gè)左括號(hào)沒有被匹配到,因?yàn)闆]有和它匹配的右括號(hào)。
下面是它如何運(yùn)作的概覽:
1、在每個(gè)"("被匹配到的時(shí)候,"(?<DEPTH>)"在這里加上一,告訴正則表達(dá)式系統(tǒng)當(dāng)前括號(hào)嵌套的深度( 正則表達(dá)式開頭的"/("不包括在這里)。
2、在每個(gè)")"被匹配到的時(shí)候,"(?<-DEPTH>)"從深度值內(nèi)減一。
3、"(?(DEPTH)(?!))"保證在匹配最后一個(gè)右括號(hào)之前深度為零。
它能工作的原因在于引擎的回逆堆棧保存了匹配成功的組的軌跡。"(?<DEPTH>)"不過是一個(gè)帶有名稱的分組構(gòu)造,它將總是匹配成功(不匹配任何東西)。而由于它被緊接著放在"/("之后,它的成功匹配(仍然在堆棧上直到被移除)被用于左括號(hào)的計(jì)數(shù)。
譯注:還有一種寫法是"(?<DEPTH>/()",我個(gè)人比較喜歡這種形式,而不是"/((?<DEPTH>)"。后面的"/)(?<-DEPTH>)"也是一樣。
這樣,匹配成功了的名為"DEPTH"的分組的計(jì)數(shù)在回逆堆棧上被建立起來。而當(dāng)找到右括號(hào)的時(shí)候我們還希望從深度值減一,這是由.NET特別的語法構(gòu)造"(?<-DEPTH>)"實(shí)現(xiàn)的,它將從堆棧上移除最近匹配的"DEPTH"分組。如果堆棧上已經(jīng)沒有記錄,"(?<-DEPTH>)"分組匹配失敗,從而防止了正則表達(dá)式系統(tǒng)匹配多余的右括號(hào)。
最后,"(?(DEPTH)(?!))"是一個(gè)用于"(?!)"的斷言,如果"DEPTH"分組到目前為止還是成功的話。如果當(dāng)我們匹配到這里時(shí)還是成功的,這里有個(gè)未配對(duì)的左括號(hào)還沒有被"(?<-DEPTH>)"移除。在這種情況,我們希望停止匹配(我們不希望匹配一個(gè)未配對(duì)的括號(hào)),所以我們使用"(?!)",它是一個(gè)“零寬度負(fù)預(yù)測(cè)先行斷言”,僅當(dāng)子表達(dá)式不在此位置的右側(cè)匹配時(shí)才繼續(xù)匹配。
這就是在.NET的正則表達(dá)式實(shí)現(xiàn)中匹配嵌套結(jié)構(gòu)的方法。
以上內(nèi)容似乎很難懂, 其實(shí)如果覺的難懂的話也簡(jiǎn)單,那你就不要去理解,你只要能用就OK了,把() 替換成你要的字符,相信可以解決不少你的問題,
以下根據(jù)這個(gè)用法寫了個(gè)測(cè)試用例
private void button3_Click( object sender, EventArgs e ) { Regex r = new Regex( @"/[(?>[^/[/]]+|/[(?<DEPTH>)|/](?<-DEPTH>))*(?(DEPTH)(?!))/]" ); StringBuilder sb = new StringBuilder(); MatchString( "[111[222[333]]][222[333]][333]", r, sb ); MessageBox.Show( sb.ToString(), "取到的信息" ); } private void MatchString( string OutString, Regex r, StringBuilder sb ) { MatchCollection ms = r.Matches( OutString );// 獲取所有的匹配 foreach ( Match m in ms ) { if ( m.Success ) { sb.AppendLine( m.Groups[0].Value ); MatchString( m.Groups[0].Value.Substring( 1, m.Groups[0].Value.Length - 1 ), r, sb );// 去掉匹配到的頭和尾的 "[" 和 "]",避免陷入死循環(huán)遞歸中,導(dǎo)致溢出 } } return; }
可以得到
[111[222[333]]] [222[333]] [333] [222[333]] [333] [333]
相信本文所述對(duì)大家的C#程序設(shè)計(jì)有一定的借鑒價(jià)值。
- C#中正則表達(dá)式的3種匹配模式
- C#正則表達(dá)式Regex類的常用匹配
- 詳解C#正則表達(dá)式Regex常用匹配
- 實(shí)例分析js和C#中使用正則表達(dá)式匹配a標(biāo)簽
- C#匹配中文字符串的4種正則表達(dá)式分享
- C#正則表達(dá)式匹配HTML中的圖片路徑,圖片地址代碼
- c#使用正則表達(dá)式匹配字符串驗(yàn)證URL示例
- c#匹配整數(shù)和小數(shù)的正則表達(dá)式
- JS和C#實(shí)現(xiàn)的兩個(gè)正則替換功能示例分析
- C#正則函數(shù)用法實(shí)例【匹配、替換、提取】
- C#正則表達(dá)式匹配與替換字符串功能示例
相關(guān)文章
winform開發(fā)使用通用多線程基類分享(以隊(duì)列形式)
多線程這個(gè)概念大家都很熟悉,對(duì)于winform的開發(fā)人員來說,用的還是多的.但估計(jì)都是用Timer,或者backgroundWorker,為大家寫了一個(gè)多線程的基類,只有你用到多線程拿過來就可以用了2013-12-12Unity shader實(shí)現(xiàn)頂點(diǎn)動(dòng)畫波動(dòng)效果
這篇文章主要為大家詳細(xì)介紹了Unity shader實(shí)現(xiàn)頂點(diǎn)動(dòng)畫波動(dòng)效果,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2020-04-04基于C#實(shí)現(xiàn)的輕量級(jí)多線程隊(duì)列圖文詳解
這篇文章主要給大家介紹了關(guān)于基于C#實(shí)現(xiàn)的輕量級(jí)多線程隊(duì)列的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者使用C#具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08分享C#操作內(nèi)存讀寫方法的主要實(shí)現(xiàn)代碼
這篇文章介紹了C#操作內(nèi)存讀寫方法的主要實(shí)現(xiàn)代碼,下面讓我們來看看具體的實(shí)例實(shí)現(xiàn),有需要的朋友可以參考一下2013-08-08Unity UGUI的ToggleGroup選項(xiàng)組件介紹使用
這篇文章主要為大家介紹了Unity UGUI的ToggleGroup選項(xiàng)組件介紹使用示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-07-07C#連接SQL數(shù)據(jù)庫和查詢數(shù)據(jù)功能的操作技巧
本文給大家分享C#連接SQL數(shù)據(jù)庫和查詢數(shù)據(jù)功能的操作技巧,本文通過圖文并茂的形式給大家介紹的非常詳細(xì),需要的朋友參考下吧2021-05-05