欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python 正則表達(dá)式貪婪模式與非貪婪模式原理、用法實(shí)例分析

 更新時(shí)間:2019年10月14日 11:34:07   作者:兩步一腳印  
這篇文章主要介紹了python 正則表達(dá)式貪婪模式與非貪婪模式原理、用法,結(jié)合實(shí)例形式詳細(xì)分析了python 正則表達(dá)式貪婪模式與非貪婪模式的功能、原理、用法及相關(guān)操作注意事項(xiàng),需要的朋友可以參考下

本文實(shí)例講述了python 正則表達(dá)式貪婪模式與非貪婪模式原理、用法。分享給大家供大家參考,具體如下:

之前未接觸過正則表達(dá)式,今日看python網(wǎng)絡(luò)爬蟲的源碼,里面一行正則表達(dá)式匹配的代碼初看之下,不是很理解,代碼如下:

myItems = re.findall('<div.*?class="content".*?title="(.*?)">(.*?)</div>',unicodePage,re.S)

“.*?”這種匹配方式,按理解應(yīng)該是匹配任意字符0個(gè)或多個(gè)(re.S模式,“.”可以匹配“\n”),但是這個(gè)“?”總覺的在這兒是多余的,既然不理解,就敲代碼試試:

import re
patern = re.compile('www\..*')
match1 = patern.match("www.baidu.com")
if match1:
  print(match1.group())
else:
  print("match1 don't match")
#output
>>> ==================RESTART =============================
>>> 
www.baidu.com

這個(gè)結(jié)果,應(yīng)該說是意料之中,加個(gè)“?”呢?

import re
patern = re.compile('www\..*?')
match1 = patern.match("www.baidu.com")
if match1:
  print(match1.group())
else:
  print("match1 don't match")
#output
>>> ==================RESTART =============================
>>> 
www.

竟然是這個(gè)結(jié)果。。?!??”一個(gè)字符都沒匹配,按“.”、“”、“?”的匹配理解,也就是“*”“?”均匹配前面字符0次,才會(huì)是這個(gè)結(jié)果,可是為啥就是0次了?

這就是正則表達(dá)式貪婪模式和非貪婪模式:

  • 貪婪模式,總是嘗試匹配盡可能多的字符;
  • 非貪婪模式則相反,總是嘗試匹配盡可能少的字符。

Python里數(shù)量詞默認(rèn)是貪婪的,這就解釋了第一個(gè)匹配實(shí)驗(yàn),輸出結(jié)果為”www.baidu.com”(貪婪模式),也就是說第二個(gè)匹配實(shí)驗(yàn)是非貪婪模式,僅僅因?yàn)榧恿恕??”,繼續(xù)實(shí)驗(yàn)

import re
patern = re.compile('www\..?')
match1 = patern.match("www.baidu.com")
if match1:
  print(match1.group())
else:
  print("match1 don't match")
#output
>>> ==================RESTART =============================
>>> 
www.b

此次匹配結(jié)果,顯然是貪婪模式。奇怪了,也就是“?”的特殊組合才是非貪婪模式。

網(wǎng)上搜索得如下說明:

標(biāo)準(zhǔn)量詞修飾的子表達(dá)式,在可匹配可不匹配的情況下,總會(huì)先嘗試進(jìn)行匹配,稱這種方式為匹配優(yōu)先,或者貪婪模式。此前介紹的一些量詞,“{m}”、“{m,n}”、“{m,}”、“?”、“*”和“+”都是匹配優(yōu)先的。
一些NFA正則引擎支持忽略優(yōu)先量詞,也就是在標(biāo)準(zhǔn)量詞后加一個(gè)“?”,此時(shí),在可匹配可不匹配的情況下,總會(huì)先忽略匹配,只有在由忽略優(yōu)先量詞修飾的子表達(dá)式,必須進(jìn)行匹配才能使整個(gè)表達(dá)式匹配成功時(shí),才會(huì)進(jìn)行匹配,稱這種方式為忽略優(yōu)先,或者非貪婪模式。忽略優(yōu)先量詞包括“{m}?”、“{m,n}?”、“{m,}?”、“??”、“*?”和“+?”。

顯然“*?”的組合是非貪婪模式,猜想正確,原來如此啊。

PS:這里再為大家提供2款非常方便的正則表達(dá)式工具供大家參考使用:

JavaScript正則表達(dá)式在線測(cè)試工具:
http://tools.jb51.net/regex/javascript

正則表達(dá)式在線生成工具:
http://tools.jb51.net/regex/create_reg

更多關(guān)于Python相關(guān)內(nèi)容可查看本站專題:《Python正則表達(dá)式用法總結(jié)》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》、《Python入門與進(jìn)階經(jīng)典教程》及《Python文件與目錄操作技巧匯總

希望本文所述對(duì)大家Python程序設(shè)計(jì)有所幫助。

相關(guān)文章

  • Python pexpect模塊及shell腳本except原理解析

    Python pexpect模塊及shell腳本except原理解析

    這篇文章主要介紹了Python pexpect模塊及shell腳本except原理解析,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-08-08
  • Pandas.concat連接DataFrame,Series的示例代碼

    Pandas.concat連接DataFrame,Series的示例代碼

    本文主要介紹了Pandas.concat連接DataFrame,Series的示例代碼,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2023-02-02
  • pandas根據(jù)指定條件篩選數(shù)據(jù)的實(shí)現(xiàn)示例

    pandas根據(jù)指定條件篩選數(shù)據(jù)的實(shí)現(xiàn)示例

    條件篩選是pandas中非常重要的一個(gè)功能,它允許我們根據(jù)特定條件來快速、高效地篩選數(shù)據(jù),本文主要介紹了pandas根據(jù)指定條件篩選數(shù)據(jù)的實(shí)現(xiàn)示例,具有一定的參考價(jià)值,感興趣的可以了解一下
    2024-03-03
  • python處理文本文件并生成指定格式的文件

    python處理文本文件并生成指定格式的文件

    本節(jié)主要介紹了python如何處理文本文件并生成指定格式的文件,需要的朋友可以參考下
    2014-07-07
  • tesseract-ocr使用以及訓(xùn)練方法

    tesseract-ocr使用以及訓(xùn)練方法

    這篇文章主要介紹了tesseract-ocr使用以及訓(xùn)練方法,結(jié)合圖文形式詳細(xì)分析了tesseract-ocr基本功能、用法、樣本訓(xùn)練與糾錯(cuò)技巧,需要的朋友可以參考下
    2023-04-04
  • 利用python計(jì)算時(shí)間差(返回天數(shù))

    利用python計(jì)算時(shí)間差(返回天數(shù))

    這篇文章主要給大家介紹了關(guān)于如何利用python計(jì)算時(shí)間差(返回天數(shù))的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者使用python具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-09-09
  • tensorflow多維張量計(jì)算實(shí)例

    tensorflow多維張量計(jì)算實(shí)例

    今天小編就為大家分享一篇tensorflow多維張量計(jì)算實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2020-02-02
  • python 解壓、復(fù)制、刪除 文件的實(shí)例代碼

    python 解壓、復(fù)制、刪除 文件的實(shí)例代碼

    這篇文章主要介紹了python 解壓、復(fù)制、刪除 文件的實(shí)例代碼,代碼簡(jiǎn)單易懂非常不錯(cuò),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-02-02
  • 如何在Python中使用pyecharts圖形畫可視化大屏

    如何在Python中使用pyecharts圖形畫可視化大屏

    最近碰巧需要用到pyecharts,pyecharts庫是一個(gè)用于生成echarts圖表的類庫,這篇文章主要給大家介紹了關(guān)于如何在Python中使用pyecharts圖形畫可視化大屏的相關(guān)資料,需要的朋友可以參考下
    2024-05-05
  • python數(shù)據(jù)分析數(shù)據(jù)標(biāo)準(zhǔn)化及離散化詳解

    python數(shù)據(jù)分析數(shù)據(jù)標(biāo)準(zhǔn)化及離散化詳解

    這篇文章主要為大家詳細(xì)介紹了python數(shù)據(jù)分析數(shù)據(jù)標(biāo)準(zhǔn)化及離散化,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-02-02

最新評(píng)論