欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python re.match()用法相關(guān)示例

 更新時間:2021年01月27日 10:38:55   作者:虛在君  
這篇文章主要介紹了python re.match()用法相關(guān)示例,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

學(xué)習(xí)python爬蟲時遇到了一個問題,書上有示例如下:

import re

line='Cats are smarter than dogs'
matchObj=re.match(r'(.*)are(.*?).*',line)

if matchObj:
 print('matchObj.group():',matchObj.group())
 print('matchObj.group(1):', matchObj.group(1))
 print('matchObj.group(2):', matchObj.group(2))
else:
 print('No match!\n')

書上的期望輸出是:

matchObj.group(): Cats are smarter than dogs
matchObj.group(1): Cats
matchObj.group(2):smarter

但是我在電腦上跑了一遍得到的輸出卻是:

matchObj.group(): Cats are smarter than dogs
matchObj.group(1): Cats
matchObj.group(2):

于是開始想辦法徹底搞清楚這個差別的原因所在。

首先要讀懂這幾行代碼,而這一行代碼的關(guān)鍵在于這一句:

matchObj=re.match(r'(.*)are(.*?).*',line)

匹配的正則表達(dá)式是

(.*)are(.*?).*
前面的r表示的是匹配的字符不進行轉(zhuǎn)義,而要匹配的字符串是line,也就是
Cats are smarter than dogs
后面使用group(num),個人理解是,按照正則表達(dá)式中的括號數(shù)可以捕獲得到對應(yīng)數(shù)量的捕獲組,而調(diào)用group(num)就可以得到對應(yīng)捕獲組的內(nèi)容,
其中g(shù)roup(0)表示的是匹配的整個表達(dá)式的字符串,在本例中就是‘Cats are smarter than dogs'。
參照網(wǎng)上可以搜到的符號的作用:
.匹配除換行符以外的任意字符
*重復(fù)之前的字符零次或更多次
?重復(fù)之前的字符零次或一次
那么第一個括號的內(nèi)容,應(yīng)當(dāng)就是匹配要匹配的字符串中are之前的所有字符(除換行符),
而第二個括號的內(nèi)容應(yīng)當(dāng)是匹配are之后的內(nèi)容,但具體想指代什么卻顯得有些不明確。
不明確的點就在于*和?這兩個符號的連用,根據(jù)優(yōu)先級這兩個符號是同一優(yōu)先級的,那么應(yīng)當(dāng)按照順序生效,那么如此翻譯的話,這一語句匹配的就是長度為0到無限大的任意字符串,為了探清此時
程序判斷的具體內(nèi)容,我們給匹配字符串末尾的.*也加上括號以提取其內(nèi)容,而后在輸出部分加上對應(yīng)語句:

import re

line='Cats are smarter than dogs'
matchObj=re.match(r'(.*)are(.*?)(.*)',line)

if matchObj:
 print("matchObj.group():",matchObj.group())
 print("matchObj.group(1):", matchObj.group(1))
 print("matchObj.group(2):", matchObj.group(2))
 print("matchObj.group(3):", matchObj.group(3))
else:
 print('No match!\n')

得到的結(jié)果是:

matchObj.group(): Cats are smarter than dogs
matchObj.group(1): Cats
matchObj.group(2):
matchObj.group(3):  smarter than dogs

可見第二個括號里的內(nèi)容被默認(rèn)為空了,然后刪去那個?,可以看到結(jié)果變成:

matchObj.group(): Cats are smarter than dogs
matchObj.group(1): Cats
matchObj.group(2):  smarter than dogs
matchObj.group(3):

那么這是否就意味著?的默認(rèn)值很可能是0次,那?這個符號到底有什么用呢

仔細(xì)想來這個說法并不是很嚴(yán)謹(jǐn)。嘗試使用單獨的.?組合可以看到這個組合可以用于提取

單個不知道是否存在的字符,而如下代碼

import re

line='Cats are smarter than dogs'
matchObj=re.match(r'(.*) are(.*)?',line)

if matchObj:
 print("matchObj.group():",matchObj.group())
 print("matchObj.group(1):", matchObj.group(1))
 print("matchObj.group(2):", matchObj.group(2))

也能在組別2中正常提取到are之后的字符內(nèi)容,但稍微改動一下將?放到第二個括號內(nèi),

就什么也提取不到,同時導(dǎo)致group(0)中匹配的字符到Cats are就截止了(也就是第二個括號匹配失?。?/p>

令人感到奇怪的是,如果將上面的代碼改成

import re

line='Cats are smarter than dogs'
matchObj=re.match(r'(.*) are (.*)+',line)

if matchObj:
 print("matchObj.group():",matchObj.group())
 print("matchObj.group(1):", matchObj.group(1))
 print("matchObj.group(2):", matchObj.group(2))

也就是僅僅將?改為+,雖然能成功匹配整個line但group(2)中沒有內(nèi)容,

如果把+放到第二個括號中就會產(chǎn)生報錯,匹配失敗。

那么是否可以認(rèn)為.*?這三個符號連用只是一個不規(guī)范的操作,但由于?的特殊性所以沒有報錯反而匹配成功了呢?

具體的可能要研究代碼本身的機理了,暫且擱置。還有一個問題就是如何達(dá)到樣例本身想要的,用第二個括號提取單個單詞的目的。

如果單單考慮這個例子的話,把原本第二個括號中的?換成r就可以了,也就是如下代碼:

import re

line='Cats are smarter than dogs'
matchObj=re.match(r'(.*) are (.*r).*',line)

if matchObj:
 print("matchObj.group():",matchObj.group())
 print("matchObj.group(1):", matchObj.group(1))
 print("matchObj.group(2):", matchObj.group(2))
 #print("matchObj.group(3):", matchObj.group(3))
else:
 print('No match!\n')

為了泛用性嘗試了一下把r改成‘ '但是得到的結(jié)果是‘smarter than '。于是嘗試把.換成表示任意字母的

[a-zA-Z],成功提取出了單個smarter,代碼如下:

import re

line='Cats are smarter than dogs'
matchObj=re.match(r'(.*) are ([a-zA-Z]* ).*',line)

if matchObj:
 print("matchObj.group():",matchObj.group())
 print("matchObj.group(1):", matchObj.group(1))
 print("matchObj.group(2):", matchObj.group(2))
 #print("matchObj.group(3):", matchObj.group(3))
else:
 print('No match!\n')

到此這篇關(guān)于python re.match()用法相關(guān)示例的文章就介紹到這了,更多相關(guān)python re.match()內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python定義一個Actor任務(wù)

    Python定義一個Actor任務(wù)

    這篇文章主要介紹了Python定義一個Actor任務(wù),文中講解非常細(xì)致,代碼幫助大家更好的理解和學(xué)習(xí),感興趣的朋友可以了解下
    2020-07-07
  • torch 中各種圖像格式轉(zhuǎn)換的實現(xiàn)方法

    torch 中各種圖像格式轉(zhuǎn)換的實現(xiàn)方法

    這篇文章主要介紹了torch 中各種圖像格式轉(zhuǎn)換的實現(xiàn)方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-12-12
  • Python3 log10()函數(shù)簡單用法

    Python3 log10()函數(shù)簡單用法

    在本文中我們給大家整理了關(guān)于Python3中l(wèi)og10()函數(shù)的基本用法和相關(guān)知識點,需要的可以學(xué)習(xí)下。
    2019-02-02
  • Python文件操作之二進制文件詳解

    Python文件操作之二進制文件詳解

    下面小編就為大家?guī)硪黄褂肞ython文件操作之二進制文件。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2021-09-09
  • Python pass語句作用和Python assert斷言函數(shù)的用法

    Python pass語句作用和Python assert斷言函數(shù)的用法

    這篇文章主要介紹了Python pass語句作用和Python assert斷言函數(shù)的用法,文章內(nèi)容介紹詳細(xì)具有一定的參考價值,需要的小伙伴可以參考一下,希望對你有所幫助
    2022-03-03
  • 解決python 虛擬環(huán)境刪除包無法加載的問題

    解決python 虛擬環(huán)境刪除包無法加載的問題

    這篇文章主要介紹了解決python 虛擬環(huán)境刪除包無法加載的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-07-07
  • Python之web模板應(yīng)用

    Python之web模板應(yīng)用

    這篇文章主要介紹了Python之web模板應(yīng)用,web模板可以更加靈活和方便的控制HTML的顯示,非常具有實用價值,有需要的小伙伴可以參考下
    2017-12-12
  • Python爬蟲包 BeautifulSoup  遞歸抓取實例詳解

    Python爬蟲包 BeautifulSoup 遞歸抓取實例詳解

    這篇文章主要介紹了Python爬蟲包 BeautifulSoup 遞歸抓取實例詳解的相關(guān)資料,需要的朋友可以參考下
    2017-01-01
  • Elasticsearch之倒排索引及索引操作

    Elasticsearch之倒排索引及索引操作

    這篇文章主要為大家介紹了Elasticsearch之倒排索引及索引操作示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2022-04-04
  • Python并發(fā)編程之IO模型

    Python并發(fā)編程之IO模型

    本文詳細(xì)講解了Python并發(fā)編程之IO模型,文中通過示例代碼介紹的非常詳細(xì)。對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2022-06-06

最新評論