Python中使用正則表達(dá)式及正則表達(dá)式匹配規(guī)則詳解
1 導(dǎo)庫
import re
2 使用模板
re_pattern = re.compile(pattern, flags=0) result = re.findall(re_pattern,string)
3 說明
參數(shù) | 描述 |
pattern | 匹配的正則表達(dá)式,如 r'abc' 可用來匹配abc |
flags | 可選,標(biāo)志位,控制匹配方式,可選值: re.I 忽略大小寫 re.L 表示特殊字符集\w \W \b \B \s \S,依賴于當(dāng)前環(huán)境 re.M 多行模式 re.S 包括換行符在內(nèi)的任意字符 re.U 根據(jù)Unicode字符集解析字符 re.X 為了增加可讀性,忽略空格和#后面的注釋 re.A 根據(jù)ASCII碼解析字符 |
string | 待匹配字符串 |
方法 | 描述 |
compile | 編譯正則表達(dá)式,生成一個正則表達(dá)式(Pattern)對象 |
findall | 全文匹配,匹配結(jié)果以列表形式返回 |
4 示例
以下代碼用來在字符串 str 中匹配符合如下規(guī)則的字符串:
中英文括號開頭+1個大寫字母+1個或無限個數(shù)字+0個或1個字符“.”+0個或1個字符“/”+0個或無限個數(shù)字+中英文括號結(jié)尾
# 導(dǎo)庫 import re # 待處理字符串 str = '小分裂細(xì)胞型(彌漫性)非霍奇金淋巴瘤(M96720/3)(Y97.1)(Y77)(yyy)' # 設(shè)定匹配規(guī)則,編譯 re_str = re.compile(r'[(|(][A-Z][0-9]+[.]?[/]?[0-9]*[)|)]', re.S) # 匹配 ans = re.findall(re_str,str) # 打印 print(ans)
在字符串 str 中的匹配結(jié)果如下,可見有三個字符串符合匹配規(guī)則:
5 正則表達(dá)式匹配規(guī)則
語法 | 描述 | 正則表達(dá)式示例 | 對應(yīng)可匹配字符串示例 |
一般字符 | 匹配自身 | abc | abc |
元字符 | |||
. | 除了換行符之外的任意單個字符 | a.c | abc |
* | 匹配前面一個字符0或無限次 | ab* | a abbb |
+ | 匹配前面一個字符1次或無限次 | ab+ | ab abbb |
? | 匹配前面一個字符0次或1次 | ab? | a ab |
\ | 轉(zhuǎn)義符,使后面一個字符保持原來的意思 | a\.b | a.b |
[] | 字符集,里面的字符可以是任意數(shù)量個字符,也可以是一個范圍,比如可以是[abc]或者[a-c],均表示匹配abc中的一個字符。同時,可以將第一個字符設(shè)為^,用來表示取反,如[^abc]表示除了abc以外的字符。 注意,所有的特殊字符在[]內(nèi)都失去其原有的特殊含義,如[.]僅表示匹配字符.而不是匹配任意字符了,當(dāng)然,如果要使用]、-或^三個字符,仍需要使用轉(zhuǎn)義字符\ | [abc] [a-c] | a b c |
{m} | m是一個非負(fù)整數(shù),表示匹配前一個字符m次 | abc{2} | abcc |
{m,n} | m和n都是非負(fù)整數(shù),且m≤n,表示最少匹配m次且最多匹配n次 | ab{2,4}c | abbc |
| | 邏輯或,匹配左右表達(dá)式中的任意一個。具有“短路”特點,先匹配左側(cè)表達(dá)式,再匹配右側(cè)表達(dá)式。建議用()括起來,否則會作用于整個正則表達(dá)式 | abc|123 | abc 123 |
() | 括號,將表達(dá)式括起來作為一個分組。分組表達(dá)式是一個整體 | a(bc)?d | ad abcd |
定位符 | |||
^ | 匹配字符串的開頭字符 | ^abc | abc |
$ | 匹配字符串的結(jié)尾字符 | abc$ | abc |
\b | 匹配一個單詞的邊界 如\bab表示匹配字符串a(chǎn)b且ab前面要是空格 如ab\b表示匹配字符串a(chǎn)b且ab后面要是空格 | \bab | 可以匹配到abc中的ab 無法匹配到cab中的ab |
\B | 匹配非邊界 | \Bab | 可以匹配到cab中的ab 無法匹配到abc中的ab |
預(yù)定義字符集 | |||
\d | 匹配數(shù)字,等價于[0-9] | a\dc | a1c |
\D | 匹配非數(shù)字,等價于[^\d] | a\Dc | abc |
\s | 匹配空白字符,包括空格、制表符、換頁符等 | a\sc | a c |
\S | 匹配非空白字符,等價于[^\s] | a\Sc | abc |
\w | 匹配字母數(shù)字下劃線,等價于[a-zA-Z0-9_] | a\wc | a_c |
\W | 匹配非字母數(shù)字下劃線,等價于[^\w] | a\Wc | a c |
到此這篇關(guān)于Python中使用正則表達(dá)式以及正則表達(dá)式匹配規(guī)則的文章就介紹到這了,更多相關(guān)Python正則表達(dá)式匹配規(guī)則內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
詳解用python -m http.server搭一個簡易的本地局域網(wǎng)
這篇文章主要介紹了詳解用python -m http.server搭一個簡易的本地局域網(wǎng),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-09-09pytorch獲取模型某一層參數(shù)名及參數(shù)值方式
今天小編就為大家分享一篇pytorch獲取模型某一層參數(shù)名及參數(shù)值方式,具有很好的價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-12-12教你漂亮打印Pandas DataFrames和Series
在今天的文章中,我們將探討如何配置所需的pandas選項,這些選項將使我們能夠“漂亮地打印” pandas DataFrames,需要的朋友可以參考下2021-05-05python數(shù)據(jù)類型可變不可變知識點總結(jié)
在本篇文章里小編給各位整理的是關(guān)于python數(shù)據(jù)類型可變不可變知識點總結(jié),需要的朋友們可以學(xué)習(xí)下。2020-03-03