欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

輕松入門正則表達(dá)式之非貪婪匹配篇詳解

 更新時(shí)間:2021年10月20日 14:39:21   作者:小旺不正經(jīng)  
正則表達(dá)式(regular expression)描述了一種字符串匹配的模式(pattern),可以用來(lái)檢查一個(gè)串是否含有某種子串、將匹配的子串替換或者從某個(gè)串中取出符合某個(gè)條件的子串等

非貪婪匹配 (.*?)

import re
a = '456qwe789rty123abc'
re=re.findall('456(.*?)789',a)
print(re)

image-20211018145402204

通常情況,滿足匹配規(guī)則“456(.*?)789”的內(nèi)容通常不止一個(gè),那么findall()函數(shù)會(huì)從字符串的起始位置開始尋找文本A,找到后開始尋找文本B,當(dāng)找到第一個(gè)文本B后,暫時(shí)停止尋找,將文本A和文本B之間的內(nèi)容存入列表;然后繼續(xù)尋找文本A,并重復(fù)之前的步驟,直到到達(dá)字符串的結(jié)束位置,并將所有匹配到的內(nèi)容存入列表。

import re
a = '456qwe789rty123456kkk789abc456xiaowang789'
re=re.findall('456(.*?)789',a)
print(re)

image-20211018145652096

貪婪模式的話就會(huì)尋找最長(zhǎng)的

import re
a = '456qwe789rty123456kkk789abc456xiaowang789'
re=re.findall('456(.*)789',a)
print(re)

image-20211018145749767

非貪婪匹配 .*?

import re
a='<a  rel="external nofollow"  target="_blank" data-report-click="{&quot;spm&quot;:&quot;3001.5501&quot;}" data-report-query="spm=3001.5501" data-v-6fe2b6a7="">'
re=re.findall('<a href="(.*?)" rel="external nofollow"  rel="external nofollow" .*?',a)
print(re)

image-20211018150444488

" 和 url后面的html代碼.*?代表,需要提取的是<a href="后的內(nèi)容,用“(.*?)”代表

實(shí)戰(zhàn)爬取博客專欄url

import re,requests
url='https://blog.csdn.net/weixin_42403632/category_11076268.html'
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:93.0) Gecko/20100101 Firefox/93.0'}
html=requests.get(url,headers=headers).text

re=re.findall('<a href="(.*?)" rel="external nofollow"  rel="external nofollow" .*?rel="noopener">',html)
for i in re:
    print(i)

image-20211018152344699

到此這篇關(guān)于輕松入門正則表達(dá)式之非貪婪匹配篇詳解的文章就介紹到這了,更多相關(guān)正則表達(dá)式 非貪婪匹配內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評(píng)論