一個perl擴展正則表達式代碼分析
更新時間:2013年02月28日 16:46:52 投稿:mdxy-dxy
今天傍晚回來翻了翻perlre文檔,基本算是看懂,趕緊記錄下來
復(fù)制代碼 代碼如下:
my $ip = "192.168.0.1|192.168.0.2|192.168.0.1";
if ( $ip =~ /
^
(?:
((?:\d{1,3}\.){3}\d{1,3})
(?=
(?:
\|(?!\1)(?1)
)*
\z
)
\|
)*
(?1)
$
/x ) {
print "match\n";
}
根據(jù)perlre文檔的說明,一點一點解釋。 首先是/x,用這個來去除regex里的空格,不然的話寫在一行太難看懂了; 然后是^,表示從最開頭開始; 然后是(?:,這個表示本括號不記入反向引用$&中; 然后是((?:\d{1,3}.){3}\d{1,3}),同樣里面一個(?:,也就是說這一行匹配一個ip,并計為$1; 然后是(?=,這個表示在上面那行ip的正則后面必須出現(xiàn)符合本括號定義,同樣也不計入$&(術(shù)語叫”零寬肯定前向斷言”是吧?); 然后一個隔開ip的|; 然后是(?!,這個表示本括號內(nèi)的東西絕對不能出現(xiàn),同樣也不計入$&(術(shù)語叫”零寬否定前向斷言”是吧?); 然后是\1,這個就是前面捕獲的$1,跟上行解釋的斷言合在一起,就是|后面不能有和前面匹配的ip重復(fù); 然后是(?1,這個表示前面捕獲$1的正則表達式,也就是不重復(fù)ip的情況下,繼續(xù)捕獲新ip; 然后是),這個)閉合到|前面的(?:,也就是說|ip可以重復(fù)多個; 然后是\z,這個是字符串邊界,相當于單行里$的作用,在本例中可以互換,用在這里,就是為了讓(?!\1)的檢查一直執(zhí)行到最后; 然后是),閉合(?=; 然后是|和),這里閉合到^(,表示符合不重復(fù)ip條件的ip|格式不斷正則匹配; 然后是(?1)$,定義最后一個ip,使用和$1相同的正則,也就是字符串至少要有一個ip。 OK,解釋完畢。其實,從后往前看,反而清晰一些~~ 另:perlre中在(??{CODE})段的表述中有如下一段話“In perl 5.12.x and earlier, because the regex engine was not re-entrant, delayed code could not safely invoke the regex engine either directly with “m//” or “s///”), or indirectly with functions such as “split”.”,而(?R)和(??{CODE})做的是類似而簡單的任務(wù),所以如果linux發(fā)行版里帶的perl版本不夠高的話,這里就不能用(?1)的簡單寫法,需要自己再寫一遍了??梢赃@么判斷:
復(fù)制代碼 代碼如下:
my $re = $^V lt v5.14 ? '(?:\d{1,3}\.?){4}' : '(?1)';
my $ip = "192.168.0.1|192.168.0.2|192.168.0.3|192.168.0.4|192.168.0.5";
if ( $ip =~ m/
^
(?:
((?:\d{1,3}\.?){4})
(?=
(?:
\|(?!\1)$re
)*
\z
)
\|
)*
$re
$
/x ) {
print "$1 match\n";
}
相關(guān)文章
perl從文件中讀取數(shù)據(jù)并輸出的實現(xiàn)代碼
perl從文件中讀取數(shù)據(jù)并輸出,附一個蛋白質(zhì)序列的讀取,有需要的朋友可以參考下2013-02-02perl命令行參數(shù)內(nèi)建數(shù)組@ARGV淺析
這篇文章主要介紹了perl命令行參數(shù)內(nèi)建數(shù)組@ARGV淺析,本文重點在于講解@ARGV的用法,并通過實例來說明,需要的朋友可以參考下2014-06-06