欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

詳解Python正則表達式re模塊

 更新時間:2019年03月19日 09:34:20   作者:丹楓無跡  
這篇文章主要介紹了Python正則表達式re模塊,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

正則是處理字符串最常用的方法,我們編碼中到處可見正則的身影。

正則大同小異,python 中的正則跟其他語言相比略有差異:

1、替換字符串時,替換的字符串可以是一個函數(shù)
2、split 函數(shù)可以指定分割次數(shù),這會導致有個坑
3、前項界定的表達式必須定長

下面詳細描述下 re 模塊的使用方法,其實,注意上面提到的三點差異就好

1、match

說明:
re.match 嘗試從字符串的起始位置匹配一個模式,如果不是起始位置匹配成功的話,match()就返回 None。

語法:
re.match(pattern, string, flags=0)

flags為可選標識,多個標識可以通過按位或 (|) 來指定。如 re.I | re.M 被設置成 I 和 M 標識:

修飾符

描述

re.I

使匹配對大小寫不敏感

re.L

做本地化識別(locale-aware)匹配

re.M

多行匹配,影響 ^ 和 $

re.S

使 . 匹配包括換行在內(nèi)的所有字符

re.U

根據(jù)Unicode字符集解析字符。這個標志影響 \w, \W, \b, \B.

re.X

該標志通過給予你更靈活的格式以便你將正則表達式寫得更易于理解。

匹配成功re.match方法返回一個匹配的對象,可以使用group(num) 或 groups() 匹配對象函數(shù)來獲取匹配表達式。group() 或 group(0),返回整個正則表達式的匹配結(jié)果。

舉例:

s= 'abc123abc'

print(re.match('[a-z]+', s))           # <_sre.SRE_Match object; span=(0, 3), match='abc'>

print(re.match('[a-z]+', s).group(0))      # abc
print(re.match('[\d]+', s))            # None
print(re.match('[A-Z]+', s, re.I).group(0))   # abc
print(re.match('[a-z]+', s).span())       # (0, 3)

2、search

說明:
re.search 掃描整個字符串并返回第一個成功的匹配。

語法:
re.search(pattern, string, flags=0)

匹配成功re.search方法返回一個匹配的對象,否則返回None??梢允褂胓roup(num) 或 groups() 匹配對象函數(shù)來獲取匹配表達式。

s = 'abc123abc'

print(re.search('[a-z]+', s).group())  # abc
print(re.search('[a-z]+', s).span())   # (0, 3)
print(re.search('[\d]+', s).group())   # 123
print(re.search('[\d]+', s).span())   # (3, 6)
print(re.search('xyz', s))         # None

groupdict
groupdict 返回匹配到的所有命名子組的字典。

print(re.search('[a-z]+', s).groupdict())   # {}

print(re.search('(?P<letter>[a-z]+)(?P<num>\d+)', s).groupdict()) # {'num': '123', 'letter': 'abc'}

3、sub 和 subn

說明:
re.sub用于替換字符串中的匹配項。

re.subn返回一個元組,包含替換后的字符串及替換次數(shù)。

語法:
sub(pattern, repl, string, count=0, flags=0)

repl: 替換的字符串,也可為一個函數(shù)。

count: 模式匹配后替換的最大次數(shù),默認 0 表示替換所有的匹配。

舉例:

s = 'abc123abc'

print(re.sub('[\d]+', '數(shù)字', s))  # abc數(shù)字abc
print(re.sub('[a-z]+', '字母', s, 1)) # 字母123abc


# 將匹配的數(shù)字乘以 2
def double(matched):
 value = int(matched.group('value'))
 return str(value * 2)


# repl是一個函數(shù)
print(re.sub('(?P<value>\d+)', double, s))  # abc246abc
print(re.subn('[\d]+', '數(shù)字', s))       # ('abc數(shù)字abc', 1)
print(re.subn('[a-z]+', '字母', s,))      # ('字母123字母', 2)
print(re.subn('[a-z]+', '字母', s, 1))     # ('字母123字母', 1)

4、compile

說明:
re.compile 用于編譯正則表達式,生成一個正則表達式(Pattern)對象,供 match() 和 search() 這兩個函數(shù)使用。

語法:
compile(pattern, flags=0)

舉例:

s = 'abc123abc'

p = re.compile('[\d]+')

print(p.match(s, 4, 5).group(0)) # 2 從位置4開始匹配到位置5
print(p.search(s).group(0))   # 123

5、findall

說明:
re.findall 在字符串中查找正則表達式所匹配的所有子串,并返回一個列表,如果沒有找到匹配的,則返回空列表。

語法:
findall(pattern, string, flags=0)

舉例:

s = 'abc123abc'

print(re.findall('[a-z]+', s)) # ['abc', 'abc']
print(re.findall('[h-n]+', s)) # []

6、finditer

說明:
finditer和 findall 類似,在字符串中查找正則表達式所匹配的所有子串,并把它們作為一個迭代器返回。

語法:
finditer(pattern, string, flags=0)

舉例:

s = 'abc123def'

it = re.finditer('[a-z]+', s)

for match in it:
 print(match.group())

7、split

說明:
re.split 方法按照能夠匹配的子串將字符串分割后返回列表。

語法:
split(pattern, string, maxsplit=0, flags=0)

maxsplit:分隔次數(shù),maxsplit=1 分隔一次,默認為 0,不限制次數(shù)。

舉例:

print(re.split('a', '1A1a2A3', re.I))   # ['1A1', '2A3']

# 輸出結(jié)果并未能區(qū)分大小寫,這是因為re.split(pattern,string,maxsplit, flags)默認是四個參數(shù),當我們傳入的三個參數(shù)的時候,系統(tǒng)會默認re.I是第三個參數(shù),所以就沒起作用。
# 如果想讓這里的re.I起作用,寫成flags=re.I即可。
print(re.split('a', '1A1a2A3', flags=re.I))  # ['1', '1', '2', '3']

8、escape

說明:
re.escape對字符串里面的特殊字符串進行轉(zhuǎn)義。

語法:
escape(pattern)

舉例:

print(re.escape('www.dxy.cn')) # www\.dxy\.cn

9、正則

“(?P<name>…)”:分組,并將其命名為<name>。

“(?P=name)”:引用別名為<name>的分組匹配到的串。

10、前項(否定)界定中的特殊

正則中常用的前項界定(?<=exp)和前項否定界定(?<!exp)在 python 中會報錯:look-behind requires fixed-width pattern,原因是 python 中前項界定的表達式必須是定長的,例如

(?<=aaa)   # 正確

(?<=aaa|bbb) # 正確

(?<=aaa|bb) # 錯誤

(?<=\d+)   # 錯誤

(?<=\d{3})  # 正確

以上所述是小編給大家介紹的Python正則表達式re模塊詳解整合,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!

相關(guān)文章

  • 深入了解python中的常見錯誤類型與解決

    深入了解python中的常見錯誤類型與解決

    在Python編程過程中,經(jīng)常會遇到各種錯誤,了解這些錯誤的類型以及如何處理它們是成為一位優(yōu)秀的Python開發(fā)者所必備的技能之一,下面就跟隨小編一起學習一下python中的常見錯誤類型吧
    2023-11-11
  • windows下python安裝小白入門教程

    windows下python安裝小白入門教程

    這篇文章主要為大家詳細介紹了windows下python安裝小白入門教程,文中安裝步驟介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2018-09-09
  • Pandas?Matplotlib保存圖形時坐標軸標簽太長導致顯示不全問題的解決

    Pandas?Matplotlib保存圖形時坐標軸標簽太長導致顯示不全問題的解決

    在使用matplotlib作圖的時候,有的時候會遇到畫圖時顯示不全和圖片保存時不完整的問題,這篇文章主要給大家介紹了關(guān)于Pandas?Matplotlib保存圖形時坐標軸標簽太長導致顯示不全問題的解決方法,需要的朋友可以參考下
    2022-06-06
  • Python網(wǎng)絡編程中urllib2模塊的用法總結(jié)

    Python網(wǎng)絡編程中urllib2模塊的用法總結(jié)

    使用urllib2模塊進行基于url的HTTP請求等操作大家也許都比較熟悉,這里我們再深入來了解一下urllib2針對HTTP的異常處理相關(guān)功能,一起來看一下Python網(wǎng)絡編程中urllib2模塊的用法總結(jié):
    2016-07-07
  • python編程的核心知識點總結(jié)

    python編程的核心知識點總結(jié)

    在本篇文章里小編給大家整理的是一篇關(guān)于python編程的核心知識點總結(jié)內(nèi)容,對此有興趣的朋友們可以學習參考下。
    2021-02-02
  • 詳解如何基于Pyecharts繪制常見的直角坐標系圖表

    詳解如何基于Pyecharts繪制常見的直角坐標系圖表

    pyecharts是基于前端可視化框架echarts的Python可視化庫,下面這篇文章主要給大家介紹了關(guān)于如何基于Pyecharts繪制常見的直角坐標系圖表的相關(guān)資料,文中通過實例代碼介紹的非常詳細,需要的朋友可以參考下
    2022-04-04
  • python?數(shù)據(jù)挖掘算法的過程詳解

    python?數(shù)據(jù)挖掘算法的過程詳解

    這篇文章主要介紹了python?數(shù)據(jù)挖掘算法,首先給大家介紹了數(shù)據(jù)挖掘的過程,基于sklearn主要的算法模型講解,給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2022-02-02
  • Python numpy和matlab的幾點差異介紹

    Python numpy和matlab的幾點差異介紹

    這篇文章主要介紹了Python numpy和matlab的幾點差異,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-07-07
  • Pythonr基于selenium如何實現(xiàn)不同商城的商品價格差異分析系統(tǒng)

    Pythonr基于selenium如何實現(xiàn)不同商城的商品價格差異分析系統(tǒng)

    這篇文章主要給大家介紹了關(guān)于Pythonr基于selenium如何實現(xiàn)不同商城的商品價格差異分析系統(tǒng)的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2022-03-03
  • Python中的json內(nèi)置庫詳解

    Python中的json內(nèi)置庫詳解

    這篇文章主要介紹了Python中的json內(nèi)置庫詳解,在學習做自動化測試的過程中,python 里有一個內(nèi)置的 json 庫,必須要學習好,json 是用于存儲和交換數(shù)據(jù)的語法,是一種輕量級的數(shù)據(jù)交換式使用場景,需要的朋友可以參考下
    2023-08-08

最新評論