一篇文章帶你入門Python正則表達(dá)式
Python3 正則表達(dá)式
正則表達(dá)式是一個(gè)特殊的字符序列,它能幫助你方便的檢查一個(gè)字符串是否與某種模式匹配。本文主要闡述re包中的主要函數(shù)。
在闡述re包中的函數(shù)之前,我們首先看議案正則表達(dá)式的模式,即使用特殊的語(yǔ)法來(lái)表示一個(gè)正則表達(dá)式。
1.match函數(shù)
- re.match 嘗試從字符串的起始位置匹配一個(gè)模式,如果不是起始位置匹配成功的話,match()就返回none。
- 函數(shù)用法:re.match(pattern, string, flags=0)
- pattern: 所要匹配的正則表達(dá)式string: 要匹配的字符串flags: 標(biāo)志位,用于控制正則表達(dá)式的匹配方式,如:是否區(qū)分大小寫,多行匹配等等。
- re.I 忽略大小寫
- re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依賴于當(dāng)前環(huán)境
- re.M 多行模式re.S 即為' . ‘并且包括換行符在內(nèi)的任意字符(' . '不包括換行符)
- re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依賴于 Unicode 字符屬性數(shù)據(jù)庫(kù)
- re.X 為了增加可讀性,忽略空格和' # '后面的注釋
匹配對(duì)象方法:
- group(num=0): 匹配的整個(gè)表達(dá)式的字符串,group() 可以一次輸入多個(gè)組號(hào),在這種情況下它將返回一個(gè)包含那些組所對(duì)應(yīng)值的元組。
- groups(): 返回一個(gè)包含所有小組字符串的元組,從 1 到 所含的小組號(hào)。
import re print(re.match("xixi", "xixi_haha_heihei").group())
xixi
line = 'Cats are smarter than dogs' b = re.match(r'(.*) are (.*?) .*', line, re.M|re.I) print(b.group()) # 返回所有 print(b.group(1)) # 返回第一組,即(.*)對(duì)應(yīng)的 print(b.group(2)) # 返回第二組,即(.*?)對(duì)應(yīng)的
Cats are smarter than dogs Cats smarter
2.search函數(shù)
re.search 掃描整個(gè)字符串并返回第一個(gè)成功的匹配。
函數(shù)用法:re.search(pattern, string, flags=0)
print(re.match('heihei', 'xixi_haha_heihei')) print(re.search('heihei', 'xixi_haha_heihei').group())
None heihei
line = 'Cats are smarter than dogs' b = re.search(r'(.*) are (.*?) .*', line, re.M|re.I) print(b.group()) # 返回所有 print(b.group(1)) # 返回第一組,即(.*)對(duì)應(yīng)的 print(b.group(2)) # 返回第二組,即(.*?)對(duì)應(yīng)的
Cats are smarter than dogs Cats smarter
search和match的區(qū)別
match只匹配字符串的開始,如果字符串開始不符合正則表達(dá)式,則匹配失敗,函數(shù)返回None;而search匹配整個(gè)字符串,直到找到一個(gè)匹配。
3. sub函數(shù)
re提供了re.sub來(lái)替換字符串中的匹配項(xiàng)。
函數(shù)用法:re.sub(pattern, repl, string, count=0, flags=0)
- pattern : 正則中的模式字符串。
- repl : 替換的字符串,也可為一個(gè)函數(shù)。
- string : 要被查找替換的原始字符串。
- count : 模式匹配后替換的最大次數(shù),默認(rèn) 0 表示替換所有的匹配。
- flags : 編譯時(shí)用的匹配模式,數(shù)字形式。
phone = '133-3333-3333 # this is a phone number' num = re.sub(r'#.*$', '', phone) print('phone num', num) # 移除注釋,找到以#開頭的。 num = re.sub(r'\D', '', phone) print('phone num', num) # 移除非數(shù)字內(nèi)容
phone num 133-3333-3333 phone num 13333333333
repl是函數(shù)的情況
def double(matched): value = int(matched.group('value')) return str(value * 2) s = 'A233Sfd34' print(re.sub('(?P<value>\d+)', double, s))
A466Sfd68
4.compile函數(shù)
compile 函數(shù)用于編譯正則表達(dá)式,生成一個(gè)正則表達(dá)式( Pattern )對(duì)象,供 match() 和 search() 這兩個(gè)函數(shù)使用。
函數(shù)使用:re.compile(pattern, flags)
pattern = re.compile(r'/d+') m = pattern.match('ones123412') print(m)
None
5.findall
在字符串中找到正則表達(dá)式所匹配的所有子串,并返回一個(gè)列表,如果沒有找到匹配的,則返回空列表。
注意:match和search是匹配一次,但是findall是匹配所有。
函數(shù)使用:findall(string, pos, endpos)
- string 待匹配的字符串。
- pos 可選參數(shù),指定字符串的起始位置,默認(rèn)為 0。
- endpos 可選參數(shù),指定字符串的結(jié)束位置,默認(rèn)為字符串的長(zhǎng)度。
pattern = re.compile(r'\d+') result1 = pattern.findall('xixixix 123 heihiehei 456') result2 = pattern.findall('xixixix 123 heihiehei 456', 0, 15) print(result1) print(result2)
['123', '456'] ['123']
6.finditer
和 findall 類似,在字符串中找到正則表達(dá)式所匹配的所有子串,并把它們作為一個(gè)迭代器返回。
ittt = re.finditer(r'\d+', '12dsfasdf123asdf534') for ttt in ittt: print(ttt.group())
12 123 534
7.split
split 方法按照能夠匹配的子串將字符串分割后返回列表。
函數(shù)使用:
re.split(pattern, string, maxsplit=0, flags=0)
- pattern: 匹配的正則表達(dá)式
- string: 要匹配的字符串。
- maxsplit: 分隔次數(shù),maxsplit=1 分隔一次,默認(rèn)為 0,不限制次數(shù)。
- flags: 標(biāo)志位,用于控制正則表達(dá)式的匹配方式,
print(re.split('\W+', 'xxixix, xixixi, hehiehei')) print(re.split('(\W+)', ' xxixix, xixixi, hehiehei'))
['xxixix', 'xixixi', 'hehiehei'] ['', ' ', 'xxixix', ', ', 'xixixi', ', ', 'hehiehei']
總結(jié)
本篇文章就到這里了,希望能夠給你帶來(lái)幫助,也希望您能夠多多關(guān)注腳本之家的更多內(nèi)容!
相關(guān)文章
python?selenium中Excel數(shù)據(jù)維護(hù)指南
這篇文章主要給大家介紹了關(guān)于python?selenium中Excel數(shù)據(jù)維護(hù)的相關(guān)資料,文中通過實(shí)例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2022-03-03pandas.loc 選取指定列進(jìn)行操作的實(shí)例
今天小編就為大家分享一篇pandas.loc 選取指定列進(jìn)行操作的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來(lái)看看吧2018-05-05Python Word文件自動(dòng)化實(shí)戰(zhàn)之簡(jiǎn)歷篩選
本文將利用Python自動(dòng)化做一個(gè)具有實(shí)操性的小練習(xí),即通過讀取簡(jiǎn)歷來(lái)篩選出符合招聘條件的簡(jiǎn)歷。文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2022-05-05Python2和Python3中@abstractmethod使用方法
這篇文章主要介紹了Python2和Python3中@abstractmethod使用方法,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-02-02pytorch模型的定義、修改、讀取、斷點(diǎn)續(xù)訓(xùn)深入解析
模型定義是深度學(xué)習(xí)中重要的一環(huán),PyTorch提供了強(qiáng)大而靈活的工具和函數(shù),使我們能夠輕松定義各種類型的深度學(xué)習(xí)模型,通過深入理解模型定義的原理和應(yīng)用,我們能夠更好地理解和設(shè)計(jì)自己的模型,從而提升深度學(xué)習(xí)任務(wù)的性能和效果2024-03-03Python selenium模擬手動(dòng)操作實(shí)現(xiàn)無(wú)人值守刷積分功能
這篇文章主要介紹了Python selenium模擬手動(dòng)操作達(dá)到無(wú)人值守刷積分目的,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-05-05Python自動(dòng)化運(yùn)維_文件內(nèi)容差異對(duì)比分析
下面小編就為大家分享一篇Python自動(dòng)化運(yùn)維_文件內(nèi)容差異對(duì)比分析,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來(lái)看看吧2017-12-12