快捷導(dǎo)航

python正則表達式用法超詳細(xì)講解大全

更新時間：2022年10月10日 09:16:11 作者：YZL40514131

正則表達式是一種用來匹配字符串的強有力的武器,利用字符來匹配字符的思想,基于顯示規(guī)則進行模式匹配,可以高效組合成不同樣式的字符串,下面這篇文章主要給大家介紹了關(guān)于python正則表達式用法超詳細(xì)講解的相關(guān)資料,需要的朋友可以參考下

一、re.compile 函數(shù)

作用：compile 函數(shù)用于編譯正則表達式，生成一個正則表達式（ Pattern ）對象，供 match() 和 search() 這兩個函數(shù)使用。

案例：如何判斷是正規(guī)的手機號

phone='''
weref234
16888888888
as13423423
weq
435435
15812312312e
afa15812312316
13111111111
'''

pattern=re.compile(r'1[3-9]\d{9}')  	#todo 編譯正則表達式之后得到一個編譯對象

result=pattern.search(phone)   			#todo search只會返回第一個匹配的結(jié)果，如果沒有匹配成功返回None
print(result)                   		#todo <re.Match object; span=(10, 21), match='15812312312'>

打印結(jié)果：

<re.Match object; span=(10, 21), match=‘16888888888’>
16888888888
(10, 21)

??????特別注意1

result=pattern.search(phone)：search匹配成功返回的是Match對象；search只會返回第一個匹配的結(jié)果，如果沒有匹配成功則返回None
result.group()：返回第一個匹配結(jié)果
result.span()：返回第一個匹配結(jié)果的下標(biāo)，為什么是（10，21）吶？
weref234：從0開始，4結(jié)束后還包含了換行符’/n’2個字符，所以從10開始，不包含21，前閉后開的原則

??????特別注意2

match函數(shù)：match匹配成功返回的是Match對象；作用用來匹配第一個注意是第一個字符的，這里的第一個是在被搜索的這串字符的第一個索引上的；如果第一個字符不匹配，則返回None

phone='''
weref234
16888888888
as13423423
weq
435435
15812312312e
afa15812312316
13111111111
'''

pattern=re.compile(r'1[3-9]\d{9}')     #todo 編譯正則表達式之后得到一個編譯對象
result2=pattern.match(phone)
print(result2)

打印結(jié)果為None，因為第一個字符為w開頭，所以匹配不到

phone1="17812312345aaa"
pattern=re.compile(r'1[3-9]\d{9}')     #todo 編譯正則表達式之后得到一個編譯對象

result2=pattern.match(phone1)   #todo match函數(shù)是從第一個字符開始匹配(從w開始匹配)，如果第一個字符不匹配，則返回None
print(result2)
print(result2.group())   #todo 返回第一個匹配結(jié)果
print(result2.span())    #todo 返回第一個匹配結(jié)果的下標(biāo)

打印結(jié)果：

<re.Match object; span=(0, 11), match=‘17812312345’>
17812312345
(0, 11)

二、正則表達式

表示字符

.：匹配任意單個字符（不包括換行符）
[]：匹配字符集，區(qū)間中的集合，可匹配其中任意一個字符
\d：匹配數(shù)字，即0-9，可以表示為[0-9]、
\s：匹配空白字符，即空格
\S：匹配非空白字符，
\w：匹配單詞字符，即a-z、A-Z、0-9、_
\W：匹配非單詞字符

import re
#.匹配任意單個字符（不包括換行符）
one='123a'
res=re.match('.',one)
print(res.group())

#[]：匹配字符集，區(qū)間中的集合，可匹配其中任意一個字符
two='8'
res1=re.match('[0-9]',two)   #匹配1-9之間的數(shù)字
print(res1.group())

res2=re.match('[0,1,8,9]',two)  #匹配0、1、8、9之間的數(shù)字
print(res2.group())

two_2='Hello Python'
print(re.match('[hH]',two_2).group())    #匹配小寫或大寫H

#\d：匹配數(shù)字，即0-9，可以表示為[0-9]
three='天空1號發(fā)射成功'
print(re.match('天空\d',three).group())
print(re.search('\d',three).group())

表示數(shù)字

*：匹配前一個字符出現(xiàn)0次或者無限次，即可有可無
+：匹配前一個字符出現(xiàn)1次或者無限次，即至少有1次
?：匹配前一個字符出現(xiàn)1次或者0次，即要么有1次，要么沒有
{m}：匹配前一個字符出現(xiàn)m次
{m，}：匹配前一個字符至少出現(xiàn)m次
{m，n}：匹配前一個字符出現(xiàn)從m到n次

需求1：匹配一個字符串第一個字母是大寫，后面的字母必須是小寫或者沒有

print(re.match('[A-Z][a-z]*','Mn').group())
print(re.match('[A-Z][a-z]*','Msdfsg').group())
print(re.match('[A-Z][a-z][a-z]','Msdfs').group())

Mn
Msdfsg
Msd

需求2 匹配一個變量名，

print(re.match(r'[a-zA-Z_]+[\w]*','name1').group())
print(re.match(r'[a-zA-Z_]+[\w]*','_name1').group())
print(re.match(r'[a-zA-Z_]+[\w]*','2_name1'))

name1
_name1
None

需求3：匹配0-99之間的任意一個數(shù)字

print(re.match('[0-9]?[0-9]','88').group())
print(re.match('[0-9]?[0-9]','8').group())
print(re.match('[0-9]?[0-9]','08').group())
print(re.match('[0-9]?[0-9]','888').group())

88
8
08
88

需求4：匹配密碼（8-20位，可以是大小寫的字母、數(shù)字、下劃線）

print(re.match('[a-zA-Z0-9_]{8,20}','12345678').group())
print(re.match('[a-zA-Z0-9_]{8}','12345678').group())

12345678
12345678

匹配邊界

^：表示以什么開頭
$：表示以什么結(jié)尾
\b：表示匹配單詞的邊界
|：或者

需求5：匹配163的郵箱地址，郵箱的用戶名包含6~18個字符，可以是數(shù)字、字母、下劃線、但是必須以字母開頭，.com結(jié)尾

emails='''
    awhaldc@163.com
asdasdfddasdfascvdfgbdfgdsds@163.com
afa_@163.com
awhaldc666@163.comax
q112dsdasdas@163.com
aaaa_____@qq.com
aaaa____@qq.com
'''
print(re.search('^[a-zA-Z][\w]{5,17}@163\.com$',emails,re.MULTILINE).group())

q112dsdasdas@163.com

需求6：匹配單詞的邊界

print(re.search(r'.*\bbeijing\b','I Love beijing too'))
print(re.search(r'.*\bbeijing\b','I Love beijing1 too'))

print(re.search(r'.*beijing','I Love beijing too'))

I Love beijing
None
I Love beijing

三、re模塊的高級用法

re.findall(pattern,string)

1、findall：pattern在string里所有的非重復(fù)匹配，返回一個迭代器iterator保存了匹配對象

需求7：匹配所有符合以下條件的郵箱

163的郵箱地址，

郵箱的用戶名包含6~18個字符，

可以是數(shù)字、字母、下劃線、

但是必須以字母開頭，

.com結(jié)尾

import re

emails='''
awhaldc@163.com
asdasdfddasdfascvdfgbdfgdsds@163.com
afa_@163.com
112dsdasdas@163.com
aaaa_____@126.com
aaaa____@163.com
'''

#findall：pattern在string里所有的非重復(fù)匹配，返回一個迭代器iterator保存了匹配對象
list=re.findall(r'(^[a-zA-Z][\w]{5,17}@(163|126).com$)',emails,re.MULTILINE)

print(list)
for email in list:
    print(email[0])

[(‘awhaldc@163.com’, ‘163’), (‘aaaa_____@126.com’, ‘126’), (‘aaaa____@163.com’, ‘163’)]
awhaldc@163.com
aaaa_____@126.com
aaaa____@163.com

2、sub：將匹配到的字符串，再次進行操作

需求8：匹配一個數(shù)字，把匹配的數(shù)字進行家1，返回

def add(result):    #result是一個匹配對象
    str_num=result.group()
    num=int(str_num)+1
    return str(num)


print(re.sub(r'\d+',add,'a=111'))

a=112

3、split：切割匹配成功的字符串

line='hello,world,china.'
print(re.split(r'\W+',line))

[‘hello’, ‘world’, ‘china’, ‘’]

需求9：以冒號或者空格，切割字符串

print(re.split(r':| ','info:kobe 18 beijing'))

[‘info’, ‘kobe’, ‘18’, ‘beijing’]

四、貪婪和非貪婪模式

什么是貪婪模式？
python里數(shù)量詞默認(rèn)是貪婪的，總是嘗試匹配盡可能多的字符
什么是非貪婪模式？
與貪婪模式相反，總是嘗試匹配盡可能少的字符，可以使用、？、+、{m,n}加上?,使貪婪模式變?yōu)榉秦澙纺Ｊ?

需求9：非貪婪模式，需求：把電話和電話的描述信息盡可能的分開，只能用正則表達式

line2='this is my phone:188-1111-6666'
#非貪婪模式，需求：把電話和電話的描述信息盡可能的分開，只能用正則表達式
result=re.match(r'(.+?)(\d+-\d+-\d+)',line2)
print(result.group(1))
print(result.group(2))

this is my phone:
188-1111-6666

總結(jié)

到此這篇關(guān)于python正則表達式用法超詳細(xì)講解的文章就介紹到這了,更多相關(guān)python正則表達式用法內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

相關(guān)文章

opencv 分類白天與夜景視頻的方法
最近有個數(shù)據(jù)需要分類處理，是一批含有白天跟夜晚的視頻數(shù)據(jù)，需要進行區(qū)分開來，本文就來實現(xiàn)，感興趣的可以了解一下
2021-06-06
這篇文章主要介紹了Python?面向?qū)ο缶幊淘斀獾南嚓P(guān)資料,需要的朋友可以參考下
2022-12-12

Python如何求取逆序數(shù)

這篇文章主要介紹了Python如何求取逆序數(shù)問題，具有很好的參考價值，希望大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教

2022-12-12

Python基于回溯法子集樹模板實現(xiàn)8皇后問題

這篇文章主要介紹了Python基于回溯法子集樹模板實現(xiàn)8皇后問題,簡單說明了8皇后問題的原理并結(jié)合實例形式分析了Python回溯法子集樹模板解決8皇后問題的具體實現(xiàn)技巧,需要的朋友可以參考下

2017-09-09

Python基礎(chǔ)教程之異常處理詳解

Python的異常處理能力是很強大的,它有很多內(nèi)置異常,可向用戶準(zhǔn)確反饋出錯信息,下面這篇文章主要給大家介紹了關(guān)于Python基礎(chǔ)教程之異常處理的相關(guān)資料,文中通過實例代碼介紹的非常詳細(xì),需要的朋友可以參考下

2023-04-04

Python實現(xiàn)識別手寫數(shù)字 Python圖片讀入與處理

這篇文章主要為大家詳細(xì)介紹了Python實現(xiàn)識別手寫數(shù)字，Python圖片的讀入與處理，具有一定的參考價值，感興趣的小伙伴們可以參考一下

2018-01-01

Python就將所有的英文單詞首字母變成大寫

這篇文章主要給大家介紹了關(guān)于Python就將所有的英文單詞首字母變成大寫的相關(guān)資料，文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

2021-02-02

python利用遞歸方法實現(xiàn)求集合的冪集

這篇文章主要給大家介紹了關(guān)于python利用遞歸方法實現(xiàn)求集合的冪集的相關(guān)資料，文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

2020-09-09

Python paramiko使用方法代碼匯總

這篇文章主要介紹了Python paramiko使用方法代碼匯總,文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下

2020-11-11

Django與FastAPI的選擇區(qū)別深入剖析

這篇文章主要為大家介紹了Django與FastAPI的選擇區(qū)別深入剖析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪

2023-12-12

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python正則表達式用法超詳細(xì)講解大全

目錄

一、re.compile 函數(shù)

二、正則表達式

表示字符

表示數(shù)字

匹配邊界

三、re模塊的高級用法

1、findall：pattern在string里所有的非重復(fù)匹配，返回一個迭代器iterator保存了匹配對象

2、sub：將匹配到的字符串，再次進行操作

3、split：切割匹配成功的字符串

四、貪婪和非貪婪模式

總結(jié)

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python正則表達式用法超詳細(xì)講解大全

目錄

一、re.compile 函數(shù)

二、正則表達式

表示字符

表示數(shù)字

匹配邊界

三、re模塊的高級用法

1、findall：pattern在string里所有的非重復(fù)匹配，返回一個迭代器iterator保存了匹配對象

2、sub：將匹配到的字符串，再次進行操作

3、split：切割匹配成功的字符串

四、貪婪和非貪婪模式

總結(jié)

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

一、re.compile 函數(shù)

二、正則表達式

三、re模塊的高級用法

1、findall：pattern在string里所有的非重復(fù)匹配，返回一個迭代器iterator保存了匹配對象

2、sub：將匹配到的字符串，再次進行操作

3、split：切割匹配成功的字符串

四、貪婪和非貪婪模式