python正則表達(dá)式及使用正則表達(dá)式的例子
正則表達(dá)式
正則表達(dá)用來匹配字符串
正則表達(dá)式匹配過程
- 依次拿出表達(dá)式和文本中的字符串進(jìn)行比價
- 如果每個字符都能匹配,則匹配成功;一旦有匹配不成功的字符,則匹配失敗
- 如果有量詞和邊界,則匹配過程稍微有些不同
正則表達(dá)式語法規(guī)則
語法 |
說明 |
表達(dá)式實例 |
匹配字符串 |
字符 |
|||
. | 匹配除換行"\n"外的任意字符串 | abc | abc |
\ | 轉(zhuǎn)義字符,使后一個字符改變原來的意思 | a\\c | a\c |
[...] | 字符集,對應(yīng)的位置可以是字符集中任意字符,字符集中的字符可以逐個列出,也可以給出范圍,如[abc]或[a-c]。第一個字符如果是^則表示取反,如[^abc]表示不是abc中的其他字符。所有的特殊的字符在字符集中都失去其原有的特殊含義。在字符集中使用^、]或-,可以使用轉(zhuǎn)義字符匹配它們 | a[bcd]e |
abe ace ade |
預(yù)定義字符集 |
|||
\d | 數(shù)字:[0-9] | a\dc | a1c |
\D | 非數(shù)字:[^0-9] | a\Dc | abc |
\s | 空白字符:[<空格>\t\r\n\f\v] | a\sc | a c |
\S | 非空白字符:[^\s] | a\Sc | abc |
\w | 單詞字符:[a-zA-z0-9_] | a\wc | abc |
\W | 非單詞字符:[^\w] | a\Wc | a c |
數(shù)量詞 |
|||
* | 匹配一個字符串0或無限次 | abc* |
ab abc abccc |
+ | 匹配一個字符串1次或無限次 | abc+ |
abc abccc |
? | 匹配一個字符串0次或1次 |
abc? |
ab abc |
{m} | 匹配一個字符串m次 | abc{2} | abcc |
{m,n} | 匹配一個字符串m到n次 | abc{2,3} |
abcc abccc |
邊界匹配 |
|||
^ | 匹配字符串開頭 | ^abc | abc |
$ | 匹配字符串末尾 | abc$ | abc |
\A | 匹配字符串開始 | \Aabc | abc |
\Z | 匹配字符串結(jié)束,如果是存在換行,只匹配到換行前的結(jié)束字符串 | abc\Z | abc |
\b | 匹配一個單詞邊界,也就是指單詞和空格間的位置。例如, 'er\b' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。 | ||
\B | 匹配非單詞邊界。'er\B' 能匹配 "verb" 中的 'er',但不能匹配 "never" 中的 'er'。 | ||
邏輯分組 |
|||
| | 匹配|表達(dá)式左右的任意一個 | abc|def |
abc def |
(...) | 作為分組,每遇到一個(,分組編號加1,使用分組的好處是匹配的子串會保存到一個子組,便于以后使用 | (abc){2} | abcabc |
(?P<name>...) | 分組除原有編號外,再加一個別名 | (?P<id>abc){2} | abcabc |
\<number> | 引用編號為number的分組匹配到的字符串 | (\d)ab\1 |
1ab1 5ab5 |
(?P=name) | 應(yīng)用別名為name的分組匹配到的字符串 | (?P<id>abc)ee(?P=name) | abceeabc |
特殊構(gòu)造(不分組) |
|||
(?:...) | (...)的不分組版本,用于|或后接數(shù)量詞 | (?:abc){2} | abcabc |
(?iLmsux) | iLmsux中的每個字符代表正則表達(dá)式的一種匹配模式,只能用在正則表達(dá)式開頭,可選多個 | (?i)abc | AbC |
(?#...) | 將#后面的字符當(dāng)做注釋忽略 | abc(?#comment)def | abcdef |
(?=...) | 之后的字符串表達(dá)式需要匹配才能成功,不消耗字符串內(nèi)容 | a(?=\d) | 后面是數(shù)字的a |
(?!...) | 之后的字符串表達(dá)式需要不匹配才能成功,不消耗字符串內(nèi)容 | a(?!\d) | 后面不是數(shù)字的a |
(?<=...) | 之前的字符串表達(dá)式需要匹配才能成功,不消耗字符串內(nèi)容 | (?<=\d)a |
前面是數(shù)字的a |
(?<!...) | 之前的字符串表達(dá)式需要不匹配才能成功,不消耗字符串內(nèi)容 | (?<!\d)a | 前面不是數(shù)字的a |
(?(id/name)yes_ pattern|no_parttern) |
如果匹配到分組為id或別名name的字符串成功匹配,則需要匹配yes_pattern 不成功,怎需要匹配no_pattern |
(\d)abc(?(1)\d|def) |
1abc3 abcdef |
貪婪模式和非貪婪模式
貪婪模式是盡可能多的匹配字符串,python默認(rèn)為貪婪模式,非貪婪模式盡可能少的匹配字符串,在正則表達(dá)式后面加個?表示非貪婪模式。例如:字符串a(chǎn)bcccb,貪婪模式正則表達(dá)式為ab.*c,非貪婪模式的正則表達(dá)式為ab.*?c,貪婪模式結(jié)果為abccc,非貪婪模式結(jié)果為abc,再比如字符串a(chǎn)bbb,貪婪模式正則表達(dá)式為ab?,非貪婪模式正則表達(dá)為ab??,貪婪模式結(jié)果為ab,非貪婪結(jié)果為a。
python的re模塊
re模塊的方法:
1.compile(pattern[,flag]):對正則表達(dá)式pattern進(jìn)行編譯,編譯后比直接查找速度快
2.match(patter,string[,flag]):從字符串string的開始就匹配,若匹配成功,則返回匹配對象,否則返回None(None對象沒有g(shù)roup()和groups()方法,不判斷直接調(diào)用這兩個方法,則會出現(xiàn)異常)
3.search(pattern,string[,flag]):從字符串中查找,若匹配成功,則返回匹配對象,否則返回None
4.findall(pattern,string[,flag]):在字符串 string 中查找正則表達(dá)式模式 pattern 的所有(非重復(fù))出現(xiàn);返回一個匹配對象的列表
5.finditer(pattern,string[, flags])b 和 findall()相同,但返回的不是列表而是迭代器;對于每個匹配,該迭代器返回一個匹配對象
6.split(pattern,string, max=0) 根據(jù)正則表達(dá)式 pattern 中的分隔符把字符 string 分割為一個列表,返回成功匹配的列表,最多分割 max 次(默認(rèn)是分割所有匹配的地方)
7.sub(pattern, repl, string, max=0) 把字符串 string 中所有匹配正則表達(dá)式 pattern 的地方替換成字符串 repl,如果 max 的值沒有給出, 則對所有匹配的地方進(jìn)行替換
匹配對象的方法和屬性:
- string:匹配時所使用的文本
- re:匹配時使用的pattern對象
- group(num=0) 返回全部匹配對象(或指定編號是 num 的子組)
- groups() 返回一個包含全部匹配的子組的元組(如果沒有成功匹配,就返回一個空元組)
參數(shù)flag:
re.I | 使匹配對大小寫不敏感 |
re.L | 做本地化識別(locale-aware)匹配 |
re.M | 多行匹配,影響 ^ 和 $ |
re.S | 使 . 匹配包括換行在內(nèi)的所有字符 |
re.U | 根據(jù)Unicode字符集解析字符。這個標(biāo)志影響 \w, \W, \b, \B. |
re.X | 該標(biāo)志通過給予你更靈活的格式以便你將正則表達(dá)式寫得更易于理解。 |
python使用正則表達(dá)式的例子
>>> import re >>> pattern = re.compile(r'foo') >>> res1 = re.search(pattern,'foo') >>> res1.group() # 返回的是匹配對象,需要調(diào)用group()方法,顯示所有的匹配對象 'foo' >>> res1.groups()# 因為沒有子組(即正則表達(dá)式中沒有分組),返回空元組 () >>> res2 = re.findall(pattern,'foobbfoo') >>> res2 # 直接返回的是一個列表,包含所有匹配的字符 ['foo', 'foo'] >>> pattern2 = re.compile(r'(\d+)aa') >>> res3 = re.search(pattern2,'bb32aa') >>> res3.group() # 返回所有的匹配的對象 '32aa' >>> res3.groups() # 對比res1的groups(),正則里有分組,返回匹配到的分組 ('32',) >>> res4 = re.findall(pattern2,'bb32aacc5aacc') >>> res4 # 對比res2,返回一個列表,但只包含所匹配分組里面的字符, ['32', '5']
總結(jié)
以上所述是小編給大家介紹的python正則表達(dá)式及使用正則表達(dá)式的例子,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復(fù)大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
- Python正則表達(dá)式學(xué)習(xí)小例子
- python正則表達(dá)式實例代碼
- Python編程快速上手——正則表達(dá)式查找功能案例分析
- python 正則表達(dá)式參數(shù)替換實例詳解
- python正則表達(dá)式匹配IP代碼實例
- python 正則表達(dá)式貪婪模式與非貪婪模式原理、用法實例分析
- Python 正則表達(dá)式爬蟲使用案例解析
- Python正則表達(dá)式實現(xiàn)簡易計算器功能示例
- python正則表達(dá)式匹配[]中間為任意字符的實例
- python 使用正則表達(dá)式按照多個空格分割字符的實例
- Python爬蟲之正則表達(dá)式基本用法實例分析
- python 用正則表達(dá)式篩選文本信息的實例
- Python3使用正則表達(dá)式爬取內(nèi)涵段子示例
- python的re正則表達(dá)式實例代碼
- python里使用正則表達(dá)式的組嵌套實例詳解
- 學(xué)會Python正則表達(dá)式,就看這20個例子(腳本之家修正版)
相關(guān)文章
Python實現(xiàn)模擬分割大文件及多線程處理的方法
這篇文章主要介紹了Python實現(xiàn)模擬分割大文件及多線程處理的方法,涉及Python文件讀取、分割及多線程相關(guān)操作技巧,需要的朋友可以參考下2017-10-10解決python3 json數(shù)據(jù)包含中文的讀寫問題
今天小編就為大家分享一篇解決python3 json數(shù)據(jù)包含中文的讀寫問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-05-05關(guān)于Python內(nèi)存分配時的小秘密分享
這篇文章主要給大家分享介紹了關(guān)于Python內(nèi)存分配時的小秘密,文中通過示例代碼介紹的非常詳細(xì),對大家學(xué)習(xí)或者使用Python具有一定的參考學(xué)習(xí)價值,需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧2019-09-09pytorch 在網(wǎng)絡(luò)中添加可訓(xùn)練參數(shù),修改預(yù)訓(xùn)練權(quán)重文件的方法
今天小編就為大家分享一篇pytorch 在網(wǎng)絡(luò)中添加可訓(xùn)練參數(shù),修改預(yù)訓(xùn)練權(quán)重文件的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-08-08mac下給python3安裝requests庫和scrapy庫的實例
今天小編就為大家分享一篇mac下給python3安裝requests庫和scrapy庫的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-06-06Python實現(xiàn)在PyPI上發(fā)布自定義軟件包的方法詳解
在Python中我們經(jīng)常使用pip來安裝第三方Python軟件包,其實我們每個人都可以免費地將自己寫的Python包發(fā)布到PyPI上。本文我們就將詳細(xì)介紹如何發(fā)布測試包,需要的可以參考一下2022-06-06