Python正則表達式教程之二:捕獲篇
前言
在上一篇文中,我們介紹了關于Python正則表達式的基礎,那么在這一篇文章里,我們將總結一下正則表達式關于捕獲的用法。下面話不多說,來看看詳細的介紹吧。
捕獲
捕獲和分組在正則表達式中有著密切的聯(lián)系,一般情況下,分組即捕獲,都用小括號完成(因此,小括號在正則表達式中也屬于特殊字符,表達原含義時需要轉(zhuǎn)義):
(…) 正常分組,并捕獲
(?:…) 分組,但是不捕獲
舉個例子,假設我們需要匹配一個座機號碼:
>>> m = re.search(r'^(\d{3,4}-)?(\d{7,8})$','020-82228888')
>>> m.group(0)
'020-82228888'
>>> m.group(1)
'020-'
>>> m.group(2)
'82228888'
這里,默認分組(0)是完整的匹配,之后的分組則按出現(xiàn)順序排列。
接下來,我們想在一整段文本中,找出所有的座機號碼,這里需要用到re.findall:
>>> re.findall(r'(\d{3,4}-)?(\d{7,8})','020-82228888\n0357-4227865')
[('020-', '82228888'), ('0357-', '4227865')]
findall有一個特性,就是如果結果中有捕獲的分組,則將捕獲的分組組成tuple返回。利用這個特點,和上面提到的分組,但是不捕獲的語法,可以得到我們想要的結果:
>>> re.findall(r'(?:\d{3,4}-)?\d{7,8}','020-82228888\n0357-4227865')
['020-82228888', '0357-4227865']
>>> re.findall(r'(?:\d{3,4}-)?\d{7,8}','020-82228888\n4227865')
['020-82228888', '4227865']
在正則表達式中,也可以通過\1,\2等來指代之前捕獲的字符串組合。這個經(jīng)常用于單雙引號的正確匹配:
>>> sentence = """You said "why?" and I say "I don't know"."""
>>> re.findall(r'["\'](.*?)["\']', sentence)
['why?', 'I don']
>>> re.findall(r'(["\'])(.*?)\1', sentence)
[('"', 'why?'), ('"', "I don't know")]
此外,如果覺得\1,\2這種表示可讀性不好的話,還可以給捕獲起一個英文名字。如下例子中,實現(xiàn)了兩種不同的日期格式之間的轉(zhuǎn)換:
>>> sentence = "from 12/22/1629 to 11/14/1643"
>>> re.sub(r'(?P<month>\d{2})/(?P<day>\d{2})/(?P<year>\d{4})', r'\g<year>-\g<month>-\g<day>', sentence)
'from 1629-12-22 to 1643-11-14'
但是,這種命名引用捕獲的方式,在findall、search中卻是無效的:
>>> sentence = """You said "why?" and I say "I don't know"."""
>>> re.findall(r'(?P<quote>["\'])(.*?)\g<quote>', sentence)
[]
>>> re.search(r'(?P<quote>["\'])(.*?)\g<quote>', sentence)
>>> re.search(r'(?P<quote>["\'])(.*?)\1', sentence)
<_sre.SRE_Match object; span=(9, 15), match='"why?"'>
>>> re.search(r'(?P<quote>["\'])(.*?)\1', sentence).groupdict()
{'quote': '"'}
總結
以上就是Python正則表達式中關于分組捕獲的全部內(nèi)容了,希望本文的內(nèi)容對大家的學習或者使用python能能帶來一定的幫助,如果有疑問大家可以留言交流,如果有疑問大家可以留言交流。下一篇文章,我會繼續(xù)總結一下正則表達式匹配時的貪婪/非貪婪特性。 請繼續(xù)關注腳本之家。
- Python使用正則表達式獲取網(wǎng)頁中所需要的信息
- python 正則表達式 re.sub & re.subn
- python使用正則表達式的search()函數(shù)實現(xiàn)指定位置搜索功能
- python正則表達式re之compile函數(shù)解析
- python爬蟲 正則表達式使用技巧及爬取個人博客的實例講解
- Python基于正則表達式實現(xiàn)檢查文件內(nèi)容的方法【文件檢索】
- Python基于正則表達式實現(xiàn)文件內(nèi)容替換的方法
- Python正則表達式非貪婪、多行匹配功能示例
- Python正則表達式分組概念與用法詳解
- Python正則表達式常用函數(shù)總結
- Python使用正則表達式實現(xiàn)文本替換的方法
- Python正則表達式教程之三:貪婪/非貪婪特性
- 詳解Python中的正則表達式
相關文章
python使用pymysql操作MySQL錯誤代碼1054和1064處理方式
這篇文章主要介紹了python使用pymysql操作MySQL錯誤代碼1054和1064處理方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-06-06
Python PIL庫Image函數(shù)的基本圖像處理操作實例
這篇文章主要為大家介紹了Python PIL庫Image函數(shù)的基本圖像處理操作實例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2024-01-01
Python實現(xiàn)SMTP發(fā)送郵件詳細教程
這篇文章主要為大家詳細介紹了Python實現(xiàn)SMTP發(fā)送郵件詳細教程,附SMTP郵件發(fā)送代碼,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2016-08-08
python+selenium+autoit實現(xiàn)文件上傳功能
這篇文章主要介紹了python+selenium+autoit實現(xiàn)文件上傳功能,需要的朋友可以參考下2017-08-08
基于Python編寫一個計算器程序,實現(xiàn)簡單的加減乘除和取余二元運算
這篇文章主要介紹了基于Python編寫一個計算器程序,實現(xiàn)簡單的加減乘除和取余二元運算,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2020-08-08

