一文掌握Python正則表達(dá)式
正則表達(dá)式,又稱(chēng)規(guī)則表達(dá)式(Regular Expression),是使用單個(gè)字符串來(lái)描述、匹配某個(gè)句法規(guī)則的字符串,常被用來(lái)檢索、替換那些符合某個(gè)模式(規(guī)則)的文本。最初的正則表達(dá)式出現(xiàn)于理論計(jì)算機(jī)科學(xué)的自動(dòng)控制理論和形式化語(yǔ)言理論中。
安裝 Python 解釋器/anaconda。
安裝好 jupyter lab。
re 模塊的使用
匹配方法的使用
re.match 嘗試從字符串的起始位置匹配一個(gè)模式,如果不是起始位置匹配成功的話,match()就返回 none。
# 導(dǎo)入 re 模塊
import re
print(re.match('www', 'www.huawei.com').span()) # 在起始位置匹配
print(re.match('com', 'www.huawei.com')) # 不在起始位置匹配輸出: (0, 3)
None
re.search 掃描整個(gè)字符串并返回第一個(gè)成功的匹配。
import re
print(re.search('www', 'www.huawei.com').span()) # 在起始位置匹配
print(re.search('com', 'www.huawei.com').span()) # 不在起始位置匹配輸出: (0, 3)
(11, 14)
compile 方法的使用
re.compile 函數(shù)用于編譯正則表達(dá)式,生成一個(gè)正則表達(dá)式( Pattern )對(duì)象,供 match() 和 search() 這兩個(gè)函數(shù)使用。
pattern = re.compile(r'\d+') # 用于匹配至少一個(gè)數(shù)字
n = pattern.match('one12twothree34four') # 查找頭部,沒(méi)有匹配
print(n) # 從'e'的位置開(kāi)始匹配,沒(méi)有匹配
m = pattern.search('one12twothree34four')
print(m)
print(m.group())輸出: None
12
re 模塊其他方法的使用
re.sub 用于替換字符串中的匹配項(xiàng):
phone = "2021-0101-000 # 這是一個(gè)電話號(hào)碼"
# 刪除字符串中的 Python 注釋
num = re.sub(r'#.*$', "", phone)
print("電話號(hào)碼是: ", num) # 刪除非數(shù)字(-)的字符串
num = re.sub(r'\D', "", phone)
print("電話號(hào)碼是 : ", num)
輸出:
電話號(hào)碼是: 2021-0101-000
電話號(hào)碼是 : 20210101000正則表達(dá)式基礎(chǔ)
匹配數(shù)字
使用正則表達(dá)式來(lái)匹配數(shù)字:
# 匹配文本中的所有數(shù)字
str_ = "996.ICU 指工作 996、生病 ICU,也就是工作從早上 9 點(diǎn)上班到晚上 9 點(diǎn)下班,每周工作 6 天, 生病了就住進(jìn) ICU"
num1 = re.findall(r'\d+', str_) # 使用\d 匹配數(shù)字,+表示匹配多次
print(num1)
num2 = re.findall(r'[0-9]{1,3}', str_) # 正則表達(dá)式不唯一,可以使用[]指定匹配元素的范圍 {}指定次數(shù)
print(num2)輸出: ['996', '996', '9', '9', '6']
['996', '996', '9', '9', '6']
匹配字符
使用\w 可以匹配數(shù)字字母下劃線:
匹配符號(hào)
# 匹配文本中的所有符號(hào) s6 = re.findall(r'\W+', str_) print(s6)
到此這篇關(guān)于Python正則表達(dá)式的文章就介紹到這了,更多相關(guān)Python正則表達(dá)式內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
深入解析Python中函數(shù)的參數(shù)與作用域
這篇文章主要介紹了Python中函數(shù)的參數(shù)與作用域,是Python入門(mén)學(xué)習(xí)中的基礎(chǔ)知識(shí),需要的朋友可以參考下2016-03-03
caffe的python接口之手寫(xiě)數(shù)字識(shí)別mnist實(shí)例
這篇文章主要為大家介紹了caffe的python接口之手寫(xiě)數(shù)字識(shí)別mnist實(shí)例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-06-06
PyTorch實(shí)現(xiàn)手寫(xiě)數(shù)字的識(shí)別入門(mén)小白教程
這篇文章主要介紹了python實(shí)現(xiàn)手寫(xiě)數(shù)字識(shí)別,非常適合小白入門(mén)學(xué)習(xí),本文通過(guò)實(shí)例圖文相結(jié)合給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2022-06-06
pytorch-autograde-計(jì)算圖的特點(diǎn)說(shuō)明
這篇文章主要介紹了pytorch-autograde-計(jì)算圖的特點(diǎn),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-05-05
anaconda升級(jí)sklearn版本的實(shí)現(xiàn)方法
這篇文章主要介紹了anaconda升級(jí)sklearn版本的實(shí)現(xiàn)方法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-02-02
Python遠(yuǎn)程方法調(diào)用實(shí)現(xiàn)過(guò)程解析
這篇文章主要介紹了Python遠(yuǎn)程方法調(diào)用實(shí)現(xiàn)過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-07-07
python自動(dòng)翻譯實(shí)現(xiàn)方法
這篇文章主要介紹了python自動(dòng)翻譯實(shí)現(xiàn)方法,涉及Python調(diào)用百度接口及數(shù)據(jù)庫(kù)操作的相關(guān)技巧,需要的朋友可以參考下2016-05-05
Python處理中文標(biāo)點(diǎn)符號(hào)大集合
中文文本中可能出現(xiàn)的標(biāo)點(diǎn)符號(hào)來(lái)源比較復(fù)雜,通過(guò)匹配等手段對(duì)他們處理的時(shí)候需要格外小心,防止遺漏,下面小編給大家?guī)?lái)了Python處理中文標(biāo)點(diǎn)符號(hào)大集合,感興趣的朋友跟隨腳本之家小編一起看看吧2018-05-05

