coolcode轉(zhuǎn)SyntaxHighlighter與Mysql正則表達(dá)式實(shí)現(xiàn)分析
更新時(shí)間:2011年04月13日 00:55:41 作者:
blog的代碼高亮插件原來(lái)是coolcode的,coolcode的高亮插件確實(shí)很酷,顯示效果也很棒,但是占用的位子太大了。
最近,我抽空改成SyntaxHighlighter。由于coolcode插件的開(kāi)頭標(biāo)簽是
<coolcode>
或者[coolcode]這樣的,而SyntaxHighlighter是
[code lang="php"]
這樣的(或者其他)。遂只能想辦法把老的格式轉(zhuǎn)化成新的格式。當(dāng)然,肯定用到正則表達(dá)式了。
原來(lái)的代碼高亮開(kāi)頭標(biāo)識(shí)為
<coolcode lang="php" download="123.php" linenum="on"><coolcode lang="php" linenum="off"><coolcode lang="php">
這種類型的,
而SyntaxHighlighter的標(biāo)識(shí)為
[code lang="php"]
那根據(jù)要求寫的正則表達(dá)式為
<coolcode lang="[a-z]+".*?>
解釋一下
[a-z]+ 匹配 php,javascript,cpp,sql,css 等,后面的.*?中的 .表示任何除了換行之外的字符,而*表示0次或者無(wú)數(shù)次,*+這些表述次數(shù)的符號(hào)后面接的?標(biāo)識(shí)非貪婪模式

看圖,這個(gè)正則可以實(shí)現(xiàn)上述要求了。
但是,問(wèn)題還沒(méi)解決,我們還有一種情況沒(méi)考慮,那就是
<coolcode
后面不一定接的就是lang="php"這樣的屬性啊,有可能是download,也有可能是linenum="on/off"啊,所以,我們的正則還需要改。
CFC4N把正則改為
<coolcode.*?lang="[a-z]+".*?>
截圖如下

細(xì)心的朋友可能看出來(lái)圖中匹配的紅色框內(nèi)多出了
<coolcode
,意思也就是說(shuō),前面的
<coolcode>
需要排除掉。如何排除呢?聰明的你肯定立刻想到.這個(gè)萬(wàn)能字符替換成非<>兩個(gè)符號(hào)的規(guī)則,好,CFC4N立刻修改一下。
修改之后的正則為
<coolcode.*?lang="[a-z]+".*?>
果然,匹配正常了。結(jié)果見(jiàn)截圖。

到這里,問(wèn)題似乎解決了,可是,當(dāng)初糊涂的我,把coolcode的兩種開(kāi)頭標(biāo)識(shí)都用了,那就是
<coolcode
和[coolcode,那么,看官您認(rèn)為這個(gè)正則該如何改寫呢?
沒(méi)錯(cuò),無(wú)非就是開(kāi)頭,結(jié)尾的標(biāo)識(shí)考慮兩種情況<和[,那么正則就好改了。(別忘了排除規(guī)則里的符號(hào)哦)
[<\[]coolcode[^<>\[\]]*?lang="[a-z]+"[^<>\[\]]*?[>\]]
嗯,好,我們來(lái)看下效果:

很好很完美。
下面,就可以去執(zhí)行了。
可是,我遇到一個(gè)很意外的事情。居然發(fā)現(xiàn)老的代碼里包含這樣的格式
[coolcode linenum=\"off\" lang=\"cpp\"]<coolcode download=\"\" lang=\"cpp\" linenum="off">
呃,問(wèn)題在這里了,只是多了個(gè)轉(zhuǎn)義字符\罷了,那么,改起來(lái),也簡(jiǎn)單。也就是允許\出現(xiàn)0次或者一次,而標(biāo)識(shí)0次或者1次的符號(hào)為?,那么我們直接在\后面加個(gè)?,也就是改成這樣\?就可以了嗎?
顯然,不是。在正則表達(dá)式里,\也表示轉(zhuǎn)義,那么,匹配\的話,也得轉(zhuǎn)義一下\,則應(yīng)該為\\? 這樣才對(duì)。
修改后正則為
[<\[]coolcode[^<>\[\]]*?lang=\\?"[a-z]+\\?"[^<>\[\]]*?[>\]]
匹配結(jié)果見(jiàn)下圖:

現(xiàn)在,大功告成了。我們可以進(jìn)行轉(zhuǎn)換了。關(guān)于轉(zhuǎn)換,我們可以用兩種方法。
•Mysql的REPLACE函數(shù),單個(gè)的去替換
<coolcode lang="php/cpp/javascript/sql/css等" download="name" linenum="on/off">
為對(duì)應(yīng)的
[code lang="php/cpp/javascript/sql/css等"]
,這樣操作,省的去寫程序,取出,替換,再寫入了,缺點(diǎn)是量大,手工也挺累,體力活。mysql僅僅支持正則查詢,不支持正則查詢的替換,我們也可以構(gòu)造聯(lián)合嵌套的SQL來(lái)替換正則匹配的字符串,但是無(wú)法取出php/cpp/javascrip這樣的語(yǔ)言標(biāo)記,替換為新的語(yǔ)言標(biāo)記。也就是說(shuō),mysql不支持正則表達(dá)式的反向引用。
•PHP讀數(shù)據(jù)庫(kù),替換,再寫入。PHP的preg_replace函數(shù)支持反向引用(preg_replace不支持自定義組名的反向引用),我們只好寫個(gè)查詢語(yǔ)句,查詢包含coolcode標(biāo)識(shí)的文章,然后再替換,當(dāng)然,直接查詢包含coolcode的文章可能太多,我們也可以寫個(gè)MYSQL支持的POSIX正則引擎的表達(dá)式,來(lái)匹配使用coolcode標(biāo)簽的文章,再來(lái)替換,寫入。以減少文章的操作量。當(dāng)然正則表達(dá)式也會(huì)浪費(fèi)很大的資源。
當(dāng)然,在PHP代碼的preg_replace函數(shù)使用上面的正則,進(jìn)行反向引用時(shí),需要對(duì)正則稍作修改。給lang=""中間的一個(gè)組名。正則修改為
[<\[]coolcode[^<>\[\]]*?lang=\\?"([a-z]+\\?)"[^<>\[\]]*?[>\]]
PHP的替換代碼為
$contents = preg_replace('/[<|[]coolcode[^>[\]]*?lang=\\\\?"([^"]+?)\\\\?"[^>[\]]*?[>|\]]/i','[code lang="\\1"',$contents);
其中正則的i修飾符標(biāo)識(shí)不區(qū)分大小寫。

還有,別忘記了coolcode的結(jié)束標(biāo)識(shí)和[/coolcode]要替換成[/code]。
mysql里執(zhí)行兩句sql即可
UPDATE wp_posts SET post_content = REPLACE(post_content,'</coolcode>','[\/code]'); //注意后面多了個(gè)反斜杠,記得去掉
UPDATE wp_posts SET post_content = REPLACE(post_content,'[/coolcode]','[\/code]'); //注意后面多了個(gè)反斜杠,記得去掉
總結(jié):
本文牽扯的正則表達(dá)式并無(wú)高級(jí)用法,都是平常很簡(jiǎn)單的用法。關(guān)于PCRE引擎正則表達(dá)式的遞歸(迭代),組命名,反向引用,零寬斷言等,CFC4N會(huì)在以后的時(shí)間里,找合適的例子寫出來(lái)。當(dāng)然,這些高級(jí)用法,CFC4N在幫朋友寫的正則表達(dá)式里已經(jīng)用到了,大家可以看看,歡迎批評(píng)和指點(diǎn)。
PS:如果需要coolcode轉(zhuǎn)SyntaxHighlighter的完整PHP程序,留言即可,我抽空寫出來(lái)。
<coolcode>
或者[coolcode]這樣的,而SyntaxHighlighter是
[code lang="php"]
這樣的(或者其他)。遂只能想辦法把老的格式轉(zhuǎn)化成新的格式。當(dāng)然,肯定用到正則表達(dá)式了。
原來(lái)的代碼高亮開(kāi)頭標(biāo)識(shí)為
<coolcode lang="php" download="123.php" linenum="on"><coolcode lang="php" linenum="off"><coolcode lang="php">
這種類型的,
而SyntaxHighlighter的標(biāo)識(shí)為
[code lang="php"]
那根據(jù)要求寫的正則表達(dá)式為
<coolcode lang="[a-z]+".*?>
解釋一下
復(fù)制代碼 代碼如下:
[a-z]+ 匹配 php,javascript,cpp,sql,css 等,后面的.*?中的 .表示任何除了換行之外的字符,而*表示0次或者無(wú)數(shù)次,*+這些表述次數(shù)的符號(hào)后面接的?標(biāo)識(shí)非貪婪模式

看圖,這個(gè)正則可以實(shí)現(xiàn)上述要求了。
但是,問(wèn)題還沒(méi)解決,我們還有一種情況沒(méi)考慮,那就是
<coolcode
后面不一定接的就是lang="php"這樣的屬性啊,有可能是download,也有可能是linenum="on/off"啊,所以,我們的正則還需要改。
CFC4N把正則改為
<coolcode.*?lang="[a-z]+".*?>
截圖如下

細(xì)心的朋友可能看出來(lái)圖中匹配的紅色框內(nèi)多出了
<coolcode
,意思也就是說(shuō),前面的
<coolcode>
需要排除掉。如何排除呢?聰明的你肯定立刻想到.這個(gè)萬(wàn)能字符替換成非<>兩個(gè)符號(hào)的規(guī)則,好,CFC4N立刻修改一下。
修改之后的正則為
<coolcode.*?lang="[a-z]+".*?>
果然,匹配正常了。結(jié)果見(jiàn)截圖。

到這里,問(wèn)題似乎解決了,可是,當(dāng)初糊涂的我,把coolcode的兩種開(kāi)頭標(biāo)識(shí)都用了,那就是
<coolcode
和[coolcode,那么,看官您認(rèn)為這個(gè)正則該如何改寫呢?
沒(méi)錯(cuò),無(wú)非就是開(kāi)頭,結(jié)尾的標(biāo)識(shí)考慮兩種情況<和[,那么正則就好改了。(別忘了排除規(guī)則里的符號(hào)哦)
[<\[]coolcode[^<>\[\]]*?lang="[a-z]+"[^<>\[\]]*?[>\]]
嗯,好,我們來(lái)看下效果:

很好很完美。
下面,就可以去執(zhí)行了。
可是,我遇到一個(gè)很意外的事情。居然發(fā)現(xiàn)老的代碼里包含這樣的格式
[coolcode linenum=\"off\" lang=\"cpp\"]<coolcode download=\"\" lang=\"cpp\" linenum="off">
呃,問(wèn)題在這里了,只是多了個(gè)轉(zhuǎn)義字符\罷了,那么,改起來(lái),也簡(jiǎn)單。也就是允許\出現(xiàn)0次或者一次,而標(biāo)識(shí)0次或者1次的符號(hào)為?,那么我們直接在\后面加個(gè)?,也就是改成這樣\?就可以了嗎?
顯然,不是。在正則表達(dá)式里,\也表示轉(zhuǎn)義,那么,匹配\的話,也得轉(zhuǎn)義一下\,則應(yīng)該為\\? 這樣才對(duì)。
修改后正則為
[<\[]coolcode[^<>\[\]]*?lang=\\?"[a-z]+\\?"[^<>\[\]]*?[>\]]
匹配結(jié)果見(jiàn)下圖:

現(xiàn)在,大功告成了。我們可以進(jìn)行轉(zhuǎn)換了。關(guān)于轉(zhuǎn)換,我們可以用兩種方法。
•Mysql的REPLACE函數(shù),單個(gè)的去替換
<coolcode lang="php/cpp/javascript/sql/css等" download="name" linenum="on/off">
為對(duì)應(yīng)的
[code lang="php/cpp/javascript/sql/css等"]
,這樣操作,省的去寫程序,取出,替換,再寫入了,缺點(diǎn)是量大,手工也挺累,體力活。mysql僅僅支持正則查詢,不支持正則查詢的替換,我們也可以構(gòu)造聯(lián)合嵌套的SQL來(lái)替換正則匹配的字符串,但是無(wú)法取出php/cpp/javascrip這樣的語(yǔ)言標(biāo)記,替換為新的語(yǔ)言標(biāo)記。也就是說(shuō),mysql不支持正則表達(dá)式的反向引用。
•PHP讀數(shù)據(jù)庫(kù),替換,再寫入。PHP的preg_replace函數(shù)支持反向引用(preg_replace不支持自定義組名的反向引用),我們只好寫個(gè)查詢語(yǔ)句,查詢包含coolcode標(biāo)識(shí)的文章,然后再替換,當(dāng)然,直接查詢包含coolcode的文章可能太多,我們也可以寫個(gè)MYSQL支持的POSIX正則引擎的表達(dá)式,來(lái)匹配使用coolcode標(biāo)簽的文章,再來(lái)替換,寫入。以減少文章的操作量。當(dāng)然正則表達(dá)式也會(huì)浪費(fèi)很大的資源。
當(dāng)然,在PHP代碼的preg_replace函數(shù)使用上面的正則,進(jìn)行反向引用時(shí),需要對(duì)正則稍作修改。給lang=""中間的一個(gè)組名。正則修改為
[<\[]coolcode[^<>\[\]]*?lang=\\?"([a-z]+\\?)"[^<>\[\]]*?[>\]]
PHP的替換代碼為
$contents = preg_replace('/[<|[]coolcode[^>[\]]*?lang=\\\\?"([^"]+?)\\\\?"[^>[\]]*?[>|\]]/i','[code lang="\\1"',$contents);
其中正則的i修飾符標(biāo)識(shí)不區(qū)分大小寫。

還有,別忘記了coolcode的結(jié)束標(biāo)識(shí)和[/coolcode]要替換成[/code]。
mysql里執(zhí)行兩句sql即可
復(fù)制代碼 代碼如下:
UPDATE wp_posts SET post_content = REPLACE(post_content,'</coolcode>','[\/code]'); //注意后面多了個(gè)反斜杠,記得去掉
UPDATE wp_posts SET post_content = REPLACE(post_content,'[/coolcode]','[\/code]'); //注意后面多了個(gè)反斜杠,記得去掉
總結(jié):
本文牽扯的正則表達(dá)式并無(wú)高級(jí)用法,都是平常很簡(jiǎn)單的用法。關(guān)于PCRE引擎正則表達(dá)式的遞歸(迭代),組命名,反向引用,零寬斷言等,CFC4N會(huì)在以后的時(shí)間里,找合適的例子寫出來(lái)。當(dāng)然,這些高級(jí)用法,CFC4N在幫朋友寫的正則表達(dá)式里已經(jīng)用到了,大家可以看看,歡迎批評(píng)和指點(diǎn)。
PS:如果需要coolcode轉(zhuǎn)SyntaxHighlighter的完整PHP程序,留言即可,我抽空寫出來(lái)。
您可能感興趣的文章:
- SyntaxHighlighter 去掉右側(cè)滾動(dòng)條的方法
- 防止SyntaxHighlighter.js的代碼高亮?xí)r閃一下的解決方法
- SyntaxHighlighter自動(dòng)識(shí)別并加載腳本語(yǔ)言
- z-blog SyntaxHighlighter 長(zhǎng)代碼無(wú)法換行解決辦法(基于jquery)
- SyntaxHighlighter 3.0.83使用筆記
- ckeditor syntaxhighlighter代碼高亮插件配置分享
- CKEditor中加入syntaxhighlighter代碼高亮插件
- z-blog SyntaxHighlighter 長(zhǎng)代碼無(wú)法換行解決辦法(jquery)
- 解決SyntaxHighlighter 代碼高亮不換行問(wèn)題的解決方法
- FCKeditor + SyntaxHighlighter 讓代碼高亮著色插件
- 代碼著色之SyntaxHighlighter項(xiàng)目(最流行的代碼高亮)
- syntaxhighlighter 去掉右上角問(wèn)號(hào)圖標(biāo)的三種方法
- 為SyntaxHighlighter添加新語(yǔ)言的方法
- SyntaxHighlighter配合CKEditor插件輕松打造代碼語(yǔ)法著色
- SyntaxHighlighter語(yǔ)法高亮插件使用說(shuō)明
- ckeditor syntaxhighlighter代碼高亮插件,完美修復(fù)
- FCKeditor 和 SyntaxHighlighter 代碼高亮插件的整合
- SyntaxHighlighter 語(yǔ)法高亮插件的使用教程
- 使用SyntaxHighlighter實(shí)現(xiàn)HTML高亮顯示代碼的方法
- FCKEditor SyntaxHighlighter整合實(shí)現(xiàn)代碼高亮顯示
- SyntaxHighlighter代碼加色使用方法
- syntaxhighlighter 使用方法
- 關(guān)于實(shí)現(xiàn)代碼語(yǔ)法標(biāo)亮 dp.SyntaxHighlighter
- SyntaxHighlighter?Autoloader(自動(dòng)加載)最優(yōu)方式
相關(guān)文章
notepad、editplus等軟件常用的文本整理正則表達(dá)式
這篇文章主要介紹了notepad、editplus等軟件常用的文本整理正則表達(dá)式,本文講解了匹配空行、所有空行、空格、換行、2個(gè)以上的空格等正則,需要的朋友可以參考下2015-04-04學(xué)php正則!超基礎(chǔ)簡(jiǎn)單例子
我一直都覺(jué)得正則表達(dá)式只要在要用的時(shí)候翻一下百度就Ok了,然后今天寫php的時(shí)候發(fā)現(xiàn),原來(lái)我正則完全一點(diǎn)都不懂。2011-09-09javascript將字符串中的多個(gè)空格替換為一個(gè)空格的正則實(shí)例
這篇文章主要介紹了javascript將字符串中的多個(gè)空格替換為一個(gè)空格的正則實(shí)例,需要的朋友可以參考下2016-12-12淺談js正則字面量//與new RegExp的執(zhí)行效率
以前看到很多文章都說(shuō) 字面量 會(huì)比 new 對(duì)象 形式效率高,但是在正則這里,好像不是這么回事,具體的請(qǐng)看下面的分析2020-04-04正則表達(dá)式中的正向預(yù)查和負(fù)向預(yù)查實(shí)例分析
這篇文章主要介紹了正則表達(dá)式中的正向預(yù)查和負(fù)向預(yù)查,實(shí)例分析了正向預(yù)查和負(fù)向預(yù)查的概念與具體用法,具有一定參考借鑒價(jià)值,需要的朋友可以參考下2015-01-01