欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

一篇文章徹底搞懂python正則表達(dá)式

 更新時(shí)間:2021年09月02日 11:23:56   作者:小朱小朱絕不服輸  
正則表達(dá)式是一個(gè)特殊的字符序列,它能幫助你方便的檢查一個(gè)字符串是否與某種模式匹配,Python 自1.5版本起增加了re模塊,這篇文章主要給大家介紹了如何通過一篇文章徹底搞懂python正則表達(dá)式的相關(guān)資料,需要的朋友可以參考下

前言

有時(shí)候字符串匹配解決不了問題,這個(gè)時(shí)候就需要正則表達(dá)式來處理。因?yàn)槊恳淮纹ヅ洌ū热缯乙允裁撮_頭的,以什么結(jié)尾的字符串要寫好多個(gè)函數(shù))都要單獨(dú)完成,我們可以給它制定一個(gè)規(guī)則。

主要應(yīng)用:爬蟲的時(shí)候需要爬取各種信息,使用正則表達(dá)式可以很方便的處理需要的數(shù)據(jù)。

1. 正則表達(dá)式的基本概念

  1. 使用單個(gè)字符串來描述匹配一系列符合某個(gè)語法規(guī)則的字符串。
  2. 是對(duì)字符串操作的一種邏輯公式。
  3. 應(yīng)用場景:處理文本和數(shù)據(jù)。
  4. 正則表達(dá)式過程:依次拿出表達(dá)式和文本中的字符比較,如果每一個(gè)字符都能匹配,則匹配成功,否則失敗。

2. python的正則表達(dá)式re模塊

import re

匹配過程:r'imooc'是原字符串,先生成Pattern對(duì)象,從頭開始找,得到一個(gè)Match(或Search等)實(shí)例,最后有一個(gè)匹配結(jié)果。

# 用find和startswith找字符串
str1 = 'imooc python'
print(str1.find('11'))
-1
print(str1.find('imooc'))
0
print(str1.startswith('imooc'))
True

使用正則表達(dá)式:

import re
pa = re.compile(r'imooc')   #  compile生成一個(gè)pattern對(duì)象,r'imooc'讀原字符串,否則需要轉(zhuǎn)義
ma = pa.match(str1)  # 匹配不到返回為None,返回一個(gè)對(duì)象
print(ma)

<re.Match object; span=(0, 5), match='imooc'>

print(ma.group())  # 返回一個(gè)字符串或字符串組成的元組ma.groups()
imooc

print(ma.span())  # 返回所在字符串的位置
print(ma.string)  # 返回原字符串
print(ma.re)     # 返回實(shí)例

(0, 5)
imooc python
re.compile('imooc')
# 匹配大小寫,后面加上大寫
pa = re.compile(r'imooc', re.I)
print(pa)

re.compile('imooc', re.IGNORECASE)

ma = pa.match('imooc python')
print(ma.group())

imooc
ma = pa.match('Imooc python')
print(ma.group())

Imooc
# 如果只有一個(gè),可以直接生成一個(gè)match對(duì)象,也可以達(dá)到同樣的效果
ma = re.match(r'imooc', str1)
print(ma)
print(ma.group())

<re.Match object; span=(0, 5), match='imooc'>
imooc

3. 正則表達(dá)式語法

基本語法:適用于多種語言。

(1)匹配單個(gè)字符

1)'.' 的匹配,可以匹配除了\n外所有字符

ma = re.match(r'a', 'a')
print(ma.group())

ma = re.match(r'a', 'b')
print(type(ma))  # 再調(diào)ma.group()則報(bào)錯(cuò)

a
<class 'NoneType'>

# 用.匹配字符
ma = re.match(r'.', 'b')
print(ma.group())

ma = re.match(r'.', '0')
print(ma.group())

b
0

# 匹配{}中的字符
ma = re.match(r'{.}', '{0}')
print(ma.group())
ma = re.match(r'{..}', '{01}')
print(ma.group())

{0}
{01}

2)[…]匹配字符集

# []匹配字符集
ma = re.match(r'{[abc]}', '{a}')
print(ma.group())
ma = re.match(r'{[abc]]}', 'vvxyksv9kd')  # 匹配不到,則報(bào)錯(cuò)
print(ma.group())
ma = re.match(r'{[a-z]]}', 'vvxyksv9kd')
print(ma.group()) # 匹配a-z中任意一個(gè)字符

{a}
vvxyksv9kd

ma = re.match(r'{[a-zA-Z]}', '{A}')
print(ma.group())

{A}

ma = re.match(r'{[a-zA-Z0-9]}', '{0}')
print(ma.group())

{0}

3) \w 匹配a-zA-Z0-9, \W匹配非單詞字符

ma = re.match(r'{[\w]}', '{A}')
print(ma.group())

ma = re.match(r'{[\w]}', '{ }')
print(ma.group())  # 匹配不到

ma = re.match(r'{[\W]}', '{ }')
print(ma.group())

{A}
{ }

4)字符集[]匹配

ma = re.match(r'[[\w]]', '[a]')
print(ma.group())  # 匹配不到

# 匹配[]需要加轉(zhuǎn)義\
ma = re.match(r'\[[\w]\]', '[a]')
print(ma.group())
[a]

(2)匹配多個(gè)字符

1) *匹配

ma = re.match(r'[A-Z][a-z]', 'Aa')
print(ma.group())

ma = re.match(r'[A-Z][a-z]', 'A')
print(ma.group()) # 匹配不到

ma = re.match(r'[A-Z][a-z]*', 'Aa')
print(ma.group())

ma = re.match(r'[A-Z][a-z]*', 'Aagfagsagaha')
print(ma.group())

ma = re.match(r'[A-Z][a-z]*', 'Aa123')
print(ma.group())

Aa
A
Aagfagsagaha
Aa

2)+匹配

# 匹配下劃線或字符開頭的無限次
ma = re.match(r'[_a-zA-Z]+[_\w]*', '10')
print(ma.group())   # 匹配不到
ma = re.match(r'[_a-zA-Z]+[_\w]*', '_hte10')
print(ma.group())

_hte10

3)?匹配

# 匹配0-99,01則不對(duì)
 ma = re.match(r'[1-9]?[0-9]', '90')
print(ma.group())

ma = re.match(r'[1-9]?[0-9]', '9')
print(ma.group())

ma = re.match(r'[1-9]?[0-9]', '09')
print(ma.group())  # 只匹配到0

90
9
0

4){m} / {mn}匹配

# 匹配郵箱,匹配6次
ma = re.match(r'[a-zA-Z0-9]{6}', 'abc123')
print(ma.group())

abc123
ma = re.match(r'[a-zA-Z0-9]{6}', 'abc12')
print(ma.group()) # 少一個(gè)則匹配不到

ma = re.match(r'[a-zA-Z0-9]{6}', 'abc1234')
print(ma.group()) # 多則匹配前6個(gè)

abc123

ma = re.match(r'[a-zA-Z0-9]{6}@163.com', 'abc123@163.com')
print(ma.group())

abc123@163.com

# 匹配6-10位的郵箱
ma = re.match(r'[a-zA-Z0-9]{6, 10}@163.com', 'abc123@163.com')
print(ma.group())

4)*? /+? /??匹配 (盡可能少匹配)

ma = re.match(r'[0-9][a-z]*', '1abc')
print(ma.group())

ma = re.match(r'[0-9][a-z]*?', '1abc')
print(ma.group())  # 只匹配1

1abc
1

ma = re.match(r'[0-9][a-z]+?', '1abc')
print(ma.group()) # 只匹配一次

1a

(3)邊界匹配

ma = re.match(r'[\w]{4,10}@163.com', 'imooc@163.com')
print(ma.group())

imooc@163.com

ma = re.match(r'[\w]{4,10}@163.com', 'imooc@163.comabc')  # 后面加上abc,match從頭開始匹配,則可以找到
print(ma.group())

imooc@163.com

ma = re.match(r'[\w]{4,10}@163.com&', 'imooc@163.comabc')
print(ma.group())  # 匹配不到
ma = re.match(r'^[\w]{4,10}@163.com&', 'imooc@163.comabc')
print(ma.group())  # 匹配不到
ma = re.match(r'^[\w]{4,10}@163.com&', 'imooc@163.com')
print(ma.group())  # 加上^和$,限制開頭結(jié)尾

imooc@163.com
# 指定開頭結(jié)尾
ma = re.match(r'\Aimooc[\w]*', 'imoocpython')
print(ma.group())
ma = re.match(r'\Aimooc[\w]*', 'iimoocpython')
print(ma.group())  # 匹配不到

imoocpython

(4)分組匹配

這里不再舉例。

4. re模塊相關(guān)方法使用

以上舉例都是match,從頭到尾匹配,查找子串就不合適了

# 在一個(gè)字符串中查找匹配
1:search(pattern, string, flags=0)

# 找到匹配,返回所有匹配部分的列表
2:findall(pattern, string, flags=0)

# 將字符串中匹配正則表達(dá)式得部分替換為其它,repl可以替換函數(shù)
3:sub(pattern, repl, string, count=0, flags=0)

# 根據(jù)匹配分割字符串,返回分割字符串組成的列表
4:split(pattern, string, maxsplit=0, flags=0)
# search
import re
str1 = 'imooc videonum = 1000'
print(str1.find('1000'))  # 數(shù)字改變則失效

17

info = re.search(r'\d+', str1)
print(info.group())

1000

str1 = 'imooc videonum = 10000'
info = re.search(r'\d+', str1)
print(info.group())

10000
# findall
# 當(dāng)有多個(gè)數(shù)字時(shí)

str2 = 'a=100, b=200, c=300'
info = re.search(r'\d+', str2)
print(info.group())

100

info = re.findall(r'\d+', str2)
print(info.group())

[100, 200, 300]
# sub 替換
str3 = 'imooc videonum = 1000'
info = re.sub(r'\d+', '1001', str3)
print(info)

imooc videonum = 1001
# split
# 分割
str3 = 'imooc:C C++ Java'
print(re.split(r':| ', str4))

[imooc, C, C, Java]

以上即為python中的正則表達(dá)式的一些知識(shí)總結(jié)。

總結(jié)

到此這篇關(guān)于python正則表達(dá)式的文章就介紹到這了,更多相關(guān)python正則表達(dá)式內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Django框架下在視圖中使用模版的方法

    Django框架下在視圖中使用模版的方法

    這篇文章主要介紹了Django框架下在視圖中使用模版的方法,Django是Python豐富多彩的眾框架中最有人氣的一個(gè),需要的朋友可以參考下
    2015-07-07
  • Apache如何部署django項(xiàng)目

    Apache如何部署django項(xiàng)目

    這篇文章主要介紹了Apache如何部署django項(xiàng)目,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧
    2017-05-05
  • python使用yaml 管理selenium元素的示例

    python使用yaml 管理selenium元素的示例

    這篇文章主要介紹了python使用yaml 管理selenium元素的示例,幫助大家更好的理解和學(xué)習(xí)python,感興趣的朋友可以了解下
    2020-12-12
  • pandas實(shí)現(xiàn)將日期轉(zhuǎn)換成timestamp

    pandas實(shí)現(xiàn)將日期轉(zhuǎn)換成timestamp

    今天小編就為大家分享一篇pandas實(shí)現(xiàn)將日期轉(zhuǎn)換成timestamp,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2019-12-12
  • Python的numpy選擇特定行列的方法

    Python的numpy選擇特定行列的方法

    這篇文章主要介紹了Python的numpy選擇特定行列的方法,有時(shí)需要抽取矩陣中特定行的特定列,比如,需要抽取矩陣x的0,1行的0,3列,結(jié)果為矩陣域,需要的朋友可以參考下
    2023-08-08
  • Python實(shí)現(xiàn)淘寶秒殺功能的示例代碼

    Python實(shí)現(xiàn)淘寶秒殺功能的示例代碼

    這篇文章主要介紹了Python實(shí)現(xiàn)淘寶秒殺功能,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2021-01-01
  • Transpose 數(shù)組行列轉(zhuǎn)置的限制方式

    Transpose 數(shù)組行列轉(zhuǎn)置的限制方式

    今天小編就為大家分享一篇Transpose 數(shù)組行列轉(zhuǎn)置的限制方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2020-02-02
  • python實(shí)現(xiàn)簡單登陸系統(tǒng)

    python實(shí)現(xiàn)簡單登陸系統(tǒng)

    這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)簡單登陸系統(tǒng),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-10-10
  • pygame實(shí)現(xiàn)滑塊接小球游戲

    pygame實(shí)現(xiàn)滑塊接小球游戲

    這篇文章主要為大家詳細(xì)介紹了pygame實(shí)現(xiàn)滑塊接小球游戲,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2021-06-06
  • Python實(shí)現(xiàn)加解密,編碼解碼和進(jìn)制轉(zhuǎn)換(最全版)

    Python實(shí)現(xiàn)加解密,編碼解碼和進(jìn)制轉(zhuǎn)換(最全版)

    這篇文章主要為大家詳細(xì)介紹了Python實(shí)現(xiàn)加解密、編碼解碼、進(jìn)制轉(zhuǎn)換、字符串轉(zhuǎn)換的最全版操作方法,文中的示例代碼講解詳細(xì),大家可以收藏一下
    2023-01-01

最新評(píng)論