欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python正則-re的用法詳解

 更新時間:2019年07月28日 09:30:28   作者:浩然haoran  
這篇文章主要介紹了python正則-re的用法詳解,文中給大家提到了正則中的修飾符以及它的功能,需要的朋友可以參考下

天在刷題的時候用到了正則,用的過程中就感覺有點不太熟練了,很久沒有用正則都有點忘了。所以現(xiàn)在呢,我們就一起來review一下python中正則模塊re的用法吧。

今天是review,所以一些基礎(chǔ)的概念就不做介紹了,先來看正則中的修飾符以及它的功能:

修飾符

•re.I 使匹配對大小寫不敏感
•re.L 做本地化識別匹配
•re.M 多行匹配,影響^和$
•re.S 使.匹配包括換行在內(nèi)的所有字符
•re.U 根據(jù)Unicode字符集解析字符.這個標志影響\w \W \b \B
•re.X 該標志通過給予你更靈活的格式以便你將正則表達式寫的更易于理解.

模式

•^ 匹配字符串開頭
•$ 匹配字符串結(jié)尾
•. 匹配人以字符,除了換行符號.當re.DOTAALL標記被指定時,則可以匹配包括換行符的任意字符.
•[...] 用來表示一組字符,單獨列出:[amk]匹配a,m或k
•[^...] 不在[]中的字符:[^amk]匹配除amk之外的字符
•re* 匹配0個或多個的表達式
•re+ 匹配1個或多個的表達式
•re? 匹配0個或1個由前面的正則表達式定義的片段,非貪婪方式.
•re{n} 精準匹配n個前面表達式
•re{n,} 匹配大于等于n個前面表達式
•re{n,m} 匹配n到m個前面的表達式定義的片段,貪婪方式
•a|b 匹配a或b
•(re) 對正則表達式分組,并記住匹配的文本
•(?imx) 正則表達式包含三種可選標志,imx,只影響括號中的區(qū)域.
•(?-imx) 正則表達式關(guān)閉imx可選標志,只影響括號中的區(qū)域.
•(?:re) 類似(...)但不表示一個組
•(?imx:re) 在括號中使用imx可選標志
•(?-imx:re) 在括號中不是用imx可選標志
•(?#...) 注釋
•(?=re) 前向肯定界定符.如果所含正則表達式,以...表示,在當前位置成功匹配時成功,否則失敗.但一旦所含表達式已經(jīng)嘗試,匹配引擎根本沒有提高,模式的剩余部分還要嘗試界定符右邊.
•(?!re) 前向否定界定符.與肯定界定符相反;當所含的表達式不能在字符串當前位置匹配成功時成功.
•(?>re) 匹配的獨立模式,省去回朔.
•\w 匹配字符數(shù)字以及下劃線
•\W 匹配非字母數(shù)字下劃線
•\s 匹配任意空白字符,等價于[\t\n\r\f]
•\S 匹配任意非空白字符
•\d 匹配任意數(shù)字
•\D 匹配任意非數(shù)字
•\A 匹配字符串開始
•\Z 匹配字符串結(jié)束,如果是存在換行,只匹配到換行前的結(jié)束字符串.
•\z 匹配字符串結(jié)束
•\G 匹配最后匹配完成的位置
•\b 匹配一個單詞邊界,也就是指單詞和空格之間的位置
•\B 匹配非單詞邊界
•\n \t 匹配一個換行符,一個制表符
•\1...\9 匹配第n個分組的內(nèi)容

上面這些呢,是我們會用到的一些模式,這里面絕大部分都是應(yīng)該熟記于心的。

接下來我們看re的一些方法:

re.compile

這個方法會生成一個正則對象,他的第一個參數(shù)是正則字符串,第二個參數(shù)是修飾符,就是 re.I, re.S 這些。

生成的這個正則對象呢,它還有一些方法,比如match、findall、finditer、search等等,這些方法的用法請往下看。

re.match

match方法是從給定字符串的開頭開始進行匹配,并且只匹配一次。也就是說如果字符串和正則的第一個字母就對不上那就匹配失敗了。

ta的參數(shù)是pettern,string,flags

•pettern 就是正則字符串,如果是通過re.compile方法生成的正則對象.match來調(diào)用的話,就不需要這個參數(shù)了,因為正則對象本身就代表了一個正則匹配模式。

•string 就是要進行匹配的目標字符串

•flags 就是正則的修飾符,比如 re.I

match 如果匹配失敗返回None,匹配懲罰返回的則是一個match對象。

match對象有一些方法,比較常用的有:span、group、groups等等
•span 方法返回的一個二元組,分別表示匹配字符串在目標字符串中的起始下標和結(jié)束下標
•group 函數(shù)有一個int類型的參數(shù),參數(shù)為0表示返回正則匹配的字符串,參數(shù)為1返回正則中第一個組匹配的內(nèi)容,2返回第二組的內(nèi)容一次類推
•groups 函數(shù)是所有g(shù)roup函數(shù)結(jié)果組成一個元組。

re.search

search 函數(shù)和 match 函數(shù)是類似的,區(qū)別在于match方法是只在目標函數(shù)開頭匹配一次;search函數(shù)是在整個目標函數(shù)上匹配一次,一次匹配成功后不再進行匹配。

同樣search方法返回的也是一個match對象,用法和match方法返回的結(jié)果一樣。

re.split

split 函數(shù)是用來分割字符串的一個函數(shù)。它的功能就是根據(jù)匹配的字符串對目標字符串進行分割,返回的結(jié)果是一個列表。

需要注意的是,如果正則中有組,組內(nèi)的字符在結(jié)果列表中也會保留,不是組內(nèi)的字符在結(jié)果列表中不會被保留。什么意思呢?通過一個例子來看一下:

st = 'www.baidu.com www.taobao.com'
result = re.split('bai(du)', st)
print(result)

結(jié)果:

['www.', 'du', '.com www.taobao.com']

可以看到,字符串‘du'是被括號括起來的,所以在結(jié)果中也有'du'這個元素,而'bai'沒有被括號括起來,在結(jié)果中就不會有‘bai'這個元素。

re.findall

這個函數(shù)是我在爬蟲項目中用的最多的一個函數(shù)了,它可以把所有匹配的結(jié)果以列表的形式返回,而不是像match和search一樣只匹配一個結(jié)果。我們來試一下:

st = 'www.baidu.com www.taobao.com'
result = re.findall(r'www\.(\w*)\.(com)', st)
print(result)
[('baidu', 'com'), ('taobao', 'com')]
re.finditer

這個函數(shù)和findall的功能一樣。不同之處在于這個函數(shù)返回的結(jié)果是一個生成器,而生成器中的每一項是一個match對象,我們一起來看一下:

st = 'www.baidu.com www.taobao.com'
result = re.finditer(r'www\.(\w*)\.(com)', st)
print(result.__next__().group(0, 1, 2))
print(next(result).groups(2))
('www.baidu.com', 'baidu', 'com')
('taobao', 'com')
re.sub

這個函數(shù)是用來替換字符串的??梢詫⑵ヅ涞淖址鎿Q成指定的字符串,我們來看一下:

st = 'www.111.com www.222.com'
result = re.sub(r'\d+', 'OK', st)
print(result)

結(jié)果:

www.OK.com www.OK.com

我們的第二個參數(shù)除了可以是一個給定的字符串還可以是一個函數(shù):

def toOK(matched):
  value = matched.group()
  return str(int(value)*2)
st = 'www.111.com www.222.com'
result = re.sub(r'\d+', toOK, st)
print(result)

結(jié)果:

www.222.com www.444.com

總結(jié)

以上所述是小編給大家介紹的python正則-re的用法詳解,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
如果你覺得本文對你有幫助,歡迎轉(zhuǎn)載,煩請注明出處,謝謝!

相關(guān)文章

  • keras 簡單 lstm實例(基于one-hot編碼)

    keras 簡單 lstm實例(基于one-hot編碼)

    這篇文章主要介紹了keras 簡單 lstm實例(基于one-hot編碼),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-07-07
  • 利用Python實現(xiàn)手機短信監(jiān)控通知的方法

    利用Python實現(xiàn)手機短信監(jiān)控通知的方法

    今天小編就為大家分享一篇利用Python實現(xiàn)手機短信監(jiān)控通知的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-07-07
  • Python 異常處理實例詳解

    Python 異常處理實例詳解

    python提供了兩個非常重要的功能(異常處理和斷言(Assertions))來處理python程序在運行中出現(xiàn)的異常和錯誤,你可以使用該功能來捕捉python程序的異常
    2014-03-03
  • Python實現(xiàn)本地緩存的幾種方法小結(jié)

    Python實現(xiàn)本地緩存的幾種方法小結(jié)

    緩存是一種常見的技術(shù),用于存儲重復請求的結(jié)果,Python 作為一種靈活的編程語言,提供了多種實現(xiàn)本地緩存的方法,本文將探討 Python 中實現(xiàn)本地緩存的幾種策略,并提供具體的代碼示例,感興趣的小伙伴跟著小編一起來看看吧
    2024-07-07
  • 對Python生成漢字字庫文字,以及轉(zhuǎn)換為文字圖片的實例詳解

    對Python生成漢字字庫文字,以及轉(zhuǎn)換為文字圖片的實例詳解

    今天小編就為大家分享一篇對Python生成漢字字庫文字,以及轉(zhuǎn)換為文字圖片的實例詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-01-01
  • Python生成器實現(xiàn)簡單

    Python生成器實現(xiàn)簡單"生產(chǎn)者消費者"模型代碼實例

    這篇文章主要介紹了Python生成器實現(xiàn)簡單"生產(chǎn)者消費者"模型代碼實例,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2020-03-03
  • Python格式化日期時間操作示例

    Python格式化日期時間操作示例

    這篇文章主要介紹了Python格式化日期時間操作,結(jié)合實例形式分析了Python使用time模塊針對日期時間的獲取、轉(zhuǎn)換、格式化、判斷等相關(guān)操作技巧,需要的朋友可以參考下
    2018-06-06
  • 使用Python中的Argparse實現(xiàn)將列表作為命令行參數(shù)傳遞

    使用Python中的Argparse實現(xiàn)將列表作為命令行參數(shù)傳遞

    Argparse?是一個?Python?庫,用于以用戶友好的方式解析命令行參數(shù),本文我們將討論如何使用?Python?中的?Argparse?庫將列表作為命令行參數(shù)傳遞,感興趣的可以了解下
    2023-08-08
  • 詳解Python用戶登錄接口的方法

    詳解Python用戶登錄接口的方法

    這篇文章主要介紹了Python用戶登錄接口的方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2019-04-04
  • Python語言快速上手學習方法

    Python語言快速上手學習方法

    今天小編就為大家分享一篇關(guān)于Python語言快速上手學習方法,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧
    2018-12-12

最新評論