解決Python正則表達式匹配反斜杠''\''問題
在學習Python正則式的過程中,有一個問題一直困擾我,如何去匹配一個反斜杠(即“\”)?
一、引入
在學習了Python特殊字符和原始字符串之后,我覺得答案應該是這樣的:
1)普通字符串:'\\'
2)原始字符串:r'\'
但事實上在提取諸如“3\8”反斜杠之前的數(shù)字時,我屢次碰壁,始終得不到結果。最終發(fā)現(xiàn)自己理解錯了,原來原始字符串和“正則轉義”沒有一點關系;下面詳細談一談。
二、字符串轉義
反斜杠,在Python中比較特殊,就是它可以用來構成一些特殊字符,比如“\n”表示換行,“\t”表示制表符。下面是使用“\n”的一行代碼:
>>>print ('Hello\World\nPython' )
結果為:
“Hello\World
Python“
可以看到其中的“\n”已轉義為換行符,而“\W”沒有發(fā)生轉義,原因是“\W”在“字符串轉義”中并不對應著特殊字符,沒有特殊含義。
如果現(xiàn)在要求變了,要求不對“\n”轉義為換行,而是原封不動輸出為“Hello\World\nPython”,該怎么辦呢?
1)可以這樣寫“Hello\World\\nPython”,這樣輸出的時候,“字符串轉義”會把“\\”轉義為“\”;
2)也可使用另一種方法:原始字符串;原始字符串(即r'...'):字符串中所有字符都直接按照字面意思來使用,不轉義特殊字符。
下面是使用原始字符串的代碼:
print r'Hello\World\nPython'
結果為:
“Hello\World\nPython”
可以清楚看到,在使用原始字符串之后,“\n”未被轉義為換行符,而是直接被輸出了。
三、正則轉義
好了,上面講的只是“字符串轉義”。同理,在正則表達式中也存在轉義,我們姑且先稱其為“正則轉義”,其與“字符串轉義”完全不同,比如“\d”代表數(shù)字,“\s”代表空白符。下面我們先編寫開頭的例子,然后再分析。
提取“3\8”反斜杠之前的數(shù)字:
import re string = '3\8' m = re.search('(\d+)\\\\', string) if m is not None: print m.group(1) # 結果為:3 n = re.search(r'(\d+)\\', string) if n is not None: print n.group(1) # 結果為:3
正則表達式字符串需要經(jīng)過兩次轉義,這兩次分別是上面的“字符串轉義”和“正則轉義”,個人認為“字符串轉義”一定先于“正則轉義”。
1)'\\\\'的過程:
先進行“字符串轉義”,前兩個反斜杠和后兩個反斜杠分別被轉義成了一個反斜杠;即“\\|\\”被轉成了“\|\”(“|”為方便看清,請自動忽略)?!白址D義”后馬上進行“正則轉義”,“\\”被轉義為了“\”,表示該正則式需要匹配一個反斜杠。
2)r'\\'的過程:
由于原始字符串中所有字符直接按照字面意思來使用,不轉義特殊字符,故不做“字符串轉義”,直接進入第二步“正則轉義”,在正則轉義中“\\”被轉義為了“\”,表示該正則式需要匹配一個反斜杠。
四、結論
也就是說原始字符串(即r'...')與“正則轉義”毫無關系,原始字符串僅在“字符串轉義”中起作用,使字符串免去一次轉義。
總結
以上所述是小編給大家介紹的解決Python正則表達式匹配反斜杠''\''問題,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
如果你覺得本文對你有幫助,歡迎轉載,煩請注明出處,謝謝!
相關文章
python中分組函數(shù)groupby和分組運算函數(shù)agg的使用
本文主要介紹了python中分組函數(shù)groupby和分組運算函數(shù)agg的使用,文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2021-10-10利用ImageAI庫只需幾行python代碼實現(xiàn)目標檢測
這篇文章主要介紹了利用ImageAI庫只需幾行python代碼超簡實現(xiàn)目標檢測功能,非常不錯,具有一定的參考借鑒價值,需要的朋友可以參考下2019-08-08通過pycharm的database設置進行數(shù)據(jù)庫的可視化方式
這篇文章主要介紹了通過pycharm的database設置進行數(shù)據(jù)庫的可視化方式,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-09-09