快捷導(dǎo)航

如何使用正則匹配最后一個字符串詳解

更新時間：2021年04月13日 11:35:16 作者：putline

這篇文章主要給大家介紹了關(guān)于如何使用正則匹配最后一個字符串的相關(guān)資料，文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

前幾天遇到一個需求，輸入的是

<user>
    <user>
        <name>a</name>
    </user>
    <user>
        <name>a</name>
    </user>
</user>
<password>123</password>

要求拿到

<user>
    <user>
        <name>a</name>
    </user>
    <user>
        <name>a</name>
    </user>
</user>

也就是去掉最后一個</user>后面的字符串。

方法有很多，我首先想到的是用正則匹配去掉</user>后面的字符串。

最后寫出來的表達(dá)式是(?<=</user>)(?![\w\W]*</user>)[\w\W]+。

首先用(?<=</user>)匹配所有前面是</user>的位置，如圖，總共有三個位置。

這里寫圖片描述

這里我們正則表達(dá)式(?<=</user>)的意思就是匹配的位置之前的字符串是</user>，也就是我們匹配到的位置在</user>之后。

這里用到了正則表達(dá)式語法中的斷言，有的書上也稱該語法為預(yù)查或者環(huán)視，都是一樣的用法。有如下語法：
(?=pattern) 零寬正向先行斷言 (?!pattern) 零寬負(fù)向先行斷言 (?<=pattern) 零寬正向后行斷言 (?<!pattern) 零寬負(fù)向后行斷言

這里用到的是(?<=pattern),零寬表示它匹配的是在字符串中的位置，如同^匹配字符串串首，$匹配字符串串尾。正向代表它必須滿足pattern。后行代表它匹配的位置在pattern之后。

^匹配字符串串首

其次，再這三個位置上進(jìn)行篩選，能夠看出這三個位置的區(qū)別是后面是否有</user>，如果沒有的話那么它就是最后一個</user>后面的位置。在之前的表達(dá)式后面添上(?![\w\W]*?</user>)此時表達(dá)式變?yōu)?code>(?<=</user>)(?![\w\W]*?</user>)。

這里寫圖片描述

能夠看到得到了最后一個匹配結(jié)果。

這里的正則表達(dá)式(?!pattern) 是零寬負(fù)向先行斷言，也就是它會往后匹配pattern，匹配到的位置在pattern之前，并且匹配到的字符串必須不滿足pattern。

(?![\w\W]*?</user>)的意思是在匹配到的位置后面必須不是[\w\W]*?</user>,\w匹配的是[a-zA-Z0-9_]即匹配字母數(shù)字和下劃線，而\W匹配的是[^a-zA-Z0-9_]即不是字母數(shù)字也不是下劃線的字符，同時匹配這兩個就相當(dāng)于匹配任意字符。[\w\W]后面的*代表匹配0-任意多次，后面的?代表懶惰模式，即只要滿足條件就立即返回。

最后，在之前的正則表達(dá)式后面加上[\w\W]+貪婪匹配即盡可能多的匹配該位置后面的字符串。最終的正則表達(dá)式是(?<=</user>)(?![\w\W]*?</user>)[\w\W]*

這里寫圖片描述