Python正則表達(dá)式教程之二:捕獲篇
前言
在上一篇文中,我們介紹了關(guān)于Python正則表達(dá)式的基礎(chǔ),那么在這一篇文章里,我們將總結(jié)一下正則表達(dá)式關(guān)于捕獲的用法。下面話(huà)不多說(shuō),來(lái)看看詳細(xì)的介紹吧。
捕獲
捕獲和分組在正則表達(dá)式中有著密切的聯(lián)系,一般情況下,分組即捕獲,都用小括號(hào)完成(因此,小括號(hào)在正則表達(dá)式中也屬于特殊字符,表達(dá)原含義時(shí)需要轉(zhuǎn)義):
(…) 正常分組,并捕獲
(?:…) 分組,但是不捕獲
舉個(gè)例子,假設(shè)我們需要匹配一個(gè)座機(jī)號(hào)碼:
>>> m = re.search(r'^(\d{3,4}-)?(\d{7,8})$','020-82228888') >>> m.group(0) '020-82228888' >>> m.group(1) '020-' >>> m.group(2) '82228888'
這里,默認(rèn)分組(0)是完整的匹配,之后的分組則按出現(xiàn)順序排列。
接下來(lái),我們想在一整段文本中,找出所有的座機(jī)號(hào)碼,這里需要用到re.findall
:
>>> re.findall(r'(\d{3,4}-)?(\d{7,8})','020-82228888\n0357-4227865') [('020-', '82228888'), ('0357-', '4227865')]
findall有一個(gè)特性,就是如果結(jié)果中有捕獲的分組,則將捕獲的分組組成tuple返回。利用這個(gè)特點(diǎn),和上面提到的分組,但是不捕獲的語(yǔ)法,可以得到我們想要的結(jié)果:
>>> re.findall(r'(?:\d{3,4}-)?\d{7,8}','020-82228888\n0357-4227865') ['020-82228888', '0357-4227865'] >>> re.findall(r'(?:\d{3,4}-)?\d{7,8}','020-82228888\n4227865') ['020-82228888', '4227865']
在正則表達(dá)式中,也可以通過(guò)\1,\2等來(lái)指代之前捕獲的字符串組合。這個(gè)經(jīng)常用于單雙引號(hào)的正確匹配:
>>> sentence = """You said "why?" and I say "I don't know".""" >>> re.findall(r'["\'](.*?)["\']', sentence) ['why?', 'I don'] >>> re.findall(r'(["\'])(.*?)\1', sentence) [('"', 'why?'), ('"', "I don't know")]
此外,如果覺(jué)得\1,\2這種表示可讀性不好的話(huà),還可以給捕獲起一個(gè)英文名字。如下例子中,實(shí)現(xiàn)了兩種不同的日期格式之間的轉(zhuǎn)換:
>>> sentence = "from 12/22/1629 to 11/14/1643" >>> re.sub(r'(?P<month>\d{2})/(?P<day>\d{2})/(?P<year>\d{4})', r'\g<year>-\g<month>-\g<day>', sentence) 'from 1629-12-22 to 1643-11-14'
但是,這種命名引用捕獲的方式,在findall、search中卻是無(wú)效的:
>>> sentence = """You said "why?" and I say "I don't know".""" >>> re.findall(r'(?P<quote>["\'])(.*?)\g<quote>', sentence) [] >>> re.search(r'(?P<quote>["\'])(.*?)\g<quote>', sentence) >>> re.search(r'(?P<quote>["\'])(.*?)\1', sentence) <_sre.SRE_Match object; span=(9, 15), match='"why?"'> >>> re.search(r'(?P<quote>["\'])(.*?)\1', sentence).groupdict() {'quote': '"'}
總結(jié)
以上就是Python正則表達(dá)式中關(guān)于分組捕獲的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者使用python能能帶來(lái)一定的幫助,如果有疑問(wèn)大家可以留言交流,如果有疑問(wèn)大家可以留言交流。下一篇文章,我會(huì)繼續(xù)總結(jié)一下正則表達(dá)式匹配時(shí)的貪婪/非貪婪特性。 請(qǐng)繼續(xù)關(guān)注腳本之家。
- Python使用正則表達(dá)式獲取網(wǎng)頁(yè)中所需要的信息
- python 正則表達(dá)式 re.sub & re.subn
- python使用正則表達(dá)式的search()函數(shù)實(shí)現(xiàn)指定位置搜索功能
- python正則表達(dá)式re之compile函數(shù)解析
- python爬蟲(chóng) 正則表達(dá)式使用技巧及爬取個(gè)人博客的實(shí)例講解
- Python基于正則表達(dá)式實(shí)現(xiàn)檢查文件內(nèi)容的方法【文件檢索】
- Python基于正則表達(dá)式實(shí)現(xiàn)文件內(nèi)容替換的方法
- Python正則表達(dá)式非貪婪、多行匹配功能示例
- Python正則表達(dá)式分組概念與用法詳解
- Python正則表達(dá)式常用函數(shù)總結(jié)
- Python使用正則表達(dá)式實(shí)現(xiàn)文本替換的方法
- Python正則表達(dá)式教程之三:貪婪/非貪婪特性
- 詳解Python中的正則表達(dá)式
相關(guān)文章
python使用pymysql操作MySQL錯(cuò)誤代碼1054和1064處理方式
這篇文章主要介紹了python使用pymysql操作MySQL錯(cuò)誤代碼1054和1064處理方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-06-06Python PIL庫(kù)Image函數(shù)的基本圖像處理操作實(shí)例
這篇文章主要為大家介紹了Python PIL庫(kù)Image函數(shù)的基本圖像處理操作實(shí)例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2024-01-01python 如何在 Matplotlib 中繪制垂直線(xiàn)
這篇文章主要介紹了python 如何在 Matplotlib 中繪制垂直線(xiàn),幫助大家更好的理解和學(xué)習(xí)使用python,感興趣的朋友可以了解下2021-04-04Python實(shí)現(xiàn)SMTP發(fā)送郵件詳細(xì)教程
這篇文章主要為大家詳細(xì)介紹了Python實(shí)現(xiàn)SMTP發(fā)送郵件詳細(xì)教程,附SMTP郵件發(fā)送代碼,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2016-08-08Python圖像運(yùn)算之頂帽運(yùn)算和底帽運(yùn)算詳解
數(shù)學(xué)形態(tài)學(xué)是應(yīng)用于圖像處理和模式識(shí)別領(lǐng)域的新方法。數(shù)學(xué)形態(tài)學(xué)表示以形態(tài)為基礎(chǔ)對(duì)圖像進(jìn)行分析的數(shù)學(xué)工具,基本思想是用具有一定形態(tài)的結(jié)構(gòu)元素去量度和提取圖像中對(duì)應(yīng)形狀以達(dá)到對(duì)圖像分析和識(shí)別的目的。本文將為大家介紹頂帽運(yùn)算和底帽運(yùn)算,需要的可以參考一下2022-07-07python+selenium+autoit實(shí)現(xiàn)文件上傳功能
這篇文章主要介紹了python+selenium+autoit實(shí)現(xiàn)文件上傳功能,需要的朋友可以參考下2017-08-08基于Python編寫(xiě)一個(gè)計(jì)算器程序,實(shí)現(xiàn)簡(jiǎn)單的加減乘除和取余二元運(yùn)算
這篇文章主要介紹了基于Python編寫(xiě)一個(gè)計(jì)算器程序,實(shí)現(xiàn)簡(jiǎn)單的加減乘除和取余二元運(yùn)算,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-08-08Python實(shí)現(xiàn)線(xiàn)性搜索算法的示例代碼
線(xiàn)性搜索算法,也稱(chēng)為順序搜索算法,是一種簡(jiǎn)單但常用的搜索技術(shù),在本文中,將深入研究線(xiàn)性搜索算法,并演示如何在?Python?中實(shí)現(xiàn)它,需要的可以參考下2024-02-02matplotlib繪制符合論文要求的圖片實(shí)例(必看篇)
下面小編就為大家?guī)?lái)一篇matplotlib繪制符合論文要求的圖片實(shí)例(必看篇)。小編覺(jué)得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2017-06-06