巧解 JavaScript 中的嵌套替換(強大正則)
更新時間:2012年09月09日 10:28:43 作者:
如何僅使用JavaScript支持的正則語法,將有嵌套的內(nèi)容替換
網(wǎng)友wys提問:如何僅使用JavaScript支持的正則語法,將
<p>
<table> <p> <p> </table>
<table> <p> <p> </table>
<p>
中<table>...</table>之間的<p>都替換為<br/>?
思考
該問題的難點之一在于JavaScript支持的正則特性實在有限。樓主已經(jīng)想到了非JavaScript的解法,如下:
re=/(?<=<table.*?)(<p>)(?=.*?<\/table>)/gi;
alert (sourcestr.replace(re,"<br>"));
嗯,思路大致是這樣。較真起來,即使JavaScript支持逆序環(huán)視,上面答案并不能夠如愿運行。原因是帶有量詞的逆序環(huán)視(即在(?<=)里面使用?, *, +, {}這樣的量詞)是更高級的的語法,極少有語言能夠支持(特例是.Net)。
但是,像樓主這樣的正則問題應(yīng)該是很普便的一個問題,我們經(jīng)常需要循環(huán)地替換一些內(nèi)容。該如何解答呢?
思路一
閱讀JavaScript的文檔,我找到了lastIndex這樣的東東。根據(jù)這個東東,我形成了這樣的思路:
•先按外層循環(huán),找到第一組較大的匹配。正則代碼是<table[^>]*>[\s\S]*?<\/table>
•定位到這次匹配結(jié)束的起始位置,替換掉這一段字串中所有的<p>。
•循環(huán)執(zhí)行。
我覺得上述思路大致清晰,但是細節(jié)太多(每次匹配涉及3個位置點,一個長度),解起來并非從容不迫,最終的代碼想必也不會賞心悅目;尤為重要的是,整個思路像是原始的 Crack,而不是高手的 Hack 。而且思路與正則關(guān)系不大。我決定換一條路。
思路二
關(guān)鍵是循環(huán)和嵌套。還好不是盜夢空間的深層遞歸。能否將匹配的內(nèi)容保護起來,替換完之后再放回原位呢?
想到這里,就豁然開朗了。
思路:先找到所有的匹配內(nèi)容,記路在數(shù)組inner中;
同時使用該正則,將原字串split為另一個數(shù)組wrapper;
一個重要的特點是,wrapper一定比inner多一個元素,它一一將inner項隔開,并處于最外層。wrapper 和 inner 的關(guān)系,就像是一個手掌的5根指頭與4個指縫的關(guān)系。將中間的元素取出,記下位置,等處理完之后,再將所有的元素粘合在一起。就是這樣簡單。代碼如下(為了讓問題更有普使性,我稍改了一下源字串):
<script type="text/javascript">
var str="<p> <table> <p> ,<p> </table> <p> <table> <p> <p> </table> <p> <table> <p> <p> </table>";
var patt=/<table[^>]*>[\s\S]*?<\/table>/i;
var wrapper_result=str.split(patt);
var inner_result = str.match(/<table[^>]*>[\s\S]*?<\/table>/ig);
var len=inner_result.length;
var final=wrapper_result[0];
for (i=0; i<len; i++)
{
tmp=inner_result[i].replace(/<p>/gi,"<br>");
final+=tmp+wrapper_result[i+1];
}
alert(final);
</script>
貼圖:

更新
果然是能人輩出,評論更精彩!請看評論中的這則代碼:
PS: 本站剛剛添加了評論中代碼的解析,可以貼代碼了。格式見評論部分的圖例顯示。謝謝合作!
復(fù)制代碼 代碼如下:
<p>
<table> <p> <p> </table>
<table> <p> <p> </table>
<p>
中<table>...</table>之間的<p>都替換為<br/>?
思考
該問題的難點之一在于JavaScript支持的正則特性實在有限。樓主已經(jīng)想到了非JavaScript的解法,如下:
復(fù)制代碼 代碼如下:
re=/(?<=<table.*?)(<p>)(?=.*?<\/table>)/gi;
alert (sourcestr.replace(re,"<br>"));
嗯,思路大致是這樣。較真起來,即使JavaScript支持逆序環(huán)視,上面答案并不能夠如愿運行。原因是帶有量詞的逆序環(huán)視(即在(?<=)里面使用?, *, +, {}這樣的量詞)是更高級的的語法,極少有語言能夠支持(特例是.Net)。
但是,像樓主這樣的正則問題應(yīng)該是很普便的一個問題,我們經(jīng)常需要循環(huán)地替換一些內(nèi)容。該如何解答呢?
思路一
閱讀JavaScript的文檔,我找到了lastIndex這樣的東東。根據(jù)這個東東,我形成了這樣的思路:
•先按外層循環(huán),找到第一組較大的匹配。正則代碼是<table[^>]*>[\s\S]*?<\/table>
•定位到這次匹配結(jié)束的起始位置,替換掉這一段字串中所有的<p>。
•循環(huán)執(zhí)行。
我覺得上述思路大致清晰,但是細節(jié)太多(每次匹配涉及3個位置點,一個長度),解起來并非從容不迫,最終的代碼想必也不會賞心悅目;尤為重要的是,整個思路像是原始的 Crack,而不是高手的 Hack 。而且思路與正則關(guān)系不大。我決定換一條路。
思路二
關(guān)鍵是循環(huán)和嵌套。還好不是盜夢空間的深層遞歸。能否將匹配的內(nèi)容保護起來,替換完之后再放回原位呢?
想到這里,就豁然開朗了。
思路:先找到所有的匹配內(nèi)容,記路在數(shù)組inner中;
同時使用該正則,將原字串split為另一個數(shù)組wrapper;
一個重要的特點是,wrapper一定比inner多一個元素,它一一將inner項隔開,并處于最外層。wrapper 和 inner 的關(guān)系,就像是一個手掌的5根指頭與4個指縫的關(guān)系。將中間的元素取出,記下位置,等處理完之后,再將所有的元素粘合在一起。就是這樣簡單。代碼如下(為了讓問題更有普使性,我稍改了一下源字串):
復(fù)制代碼 代碼如下:
<script type="text/javascript">
var str="<p> <table> <p> ,<p> </table> <p> <table> <p> <p> </table> <p> <table> <p> <p> </table>";
var patt=/<table[^>]*>[\s\S]*?<\/table>/i;
var wrapper_result=str.split(patt);
var inner_result = str.match(/<table[^>]*>[\s\S]*?<\/table>/ig);
var len=inner_result.length;
var final=wrapper_result[0];
for (i=0; i<len; i++)
{
tmp=inner_result[i].replace(/<p>/gi,"<br>");
final+=tmp+wrapper_result[i+1];
}
alert(final);
</script>
貼圖:

更新
果然是能人輩出,評論更精彩!請看評論中的這則代碼:
復(fù)制代碼 代碼如下:
alert(sourcestr.replace(/<table.*?\/table>/ig, function($1){return $1.replace(/<p>/ig,"<br>")}));
PS: 本站剛剛添加了評論中代碼的解析,可以貼代碼了。格式見評論部分的圖例顯示。謝謝合作!
您可能感興趣的文章:
- JS使用正則表達式實現(xiàn)關(guān)鍵字替換加粗功能示例
- js正則表達式replace替換變量方法
- js正則查找match()與替換replace()用法實例
- js使用正則實現(xiàn)ReplaceAll全部替換的方法
- JS利用正則配合replace替換指定字符
- js 替換功能函數(shù),用正則表達式解決,js的全部替換
- JavaScript replace(rgExp,fn)正則替換的用法
- JS、replace利用正則表達式替換SQL所有參數(shù)為指定格式的數(shù)據(jù)
- javascript replace()正則替換實現(xiàn)代碼
- js正則實現(xiàn)的密碼框簡單制作,還可以替換成自己想用得符號
- javascript用正則表達式把1234567890替換為abcdefghij
- JS使用正則表達式過濾多個詞語并替換為相同長度星號的方法
相關(guān)文章
正則表達式Regular Expression (RegExp)詳解
正則表達式,又稱正規(guī)表示式、正規(guī)表示法、正規(guī)表達式、規(guī)則表達式、常規(guī)表示法(英語:Regular Expression,在代碼中常簡寫為regex、regexp或RE2015-11-11JavaScript正則方法replace實現(xiàn)搜索關(guān)鍵字高亮顯示
這里介紹的是JavaScript的正則表達式的replace方法 ,和實現(xiàn)搜索關(guān)鍵字高亮的功能.先介紹一下正則表達式的replace方法,具體內(nèi)容詳情大家參考下本文2017-09-09asp.net(c#) 使用Rex正則來生成字符串?dāng)?shù)組的代碼
我們在項目中,經(jīng)常要使用正則表達式,現(xiàn)在有一個工具可以按正則表達式生成數(shù)據(jù).正則表達式的語法忘記了嗎?2010-05-05