python正則表達(dá)中的re庫(kù)常用方法總結(jié)
元字符 :

預(yù)定義字符集:

我進(jìn)行組合一些復(fù)雜的正則表達(dá)式的時(shí)候是為了快捷去晚上找一些現(xiàn)成的模式,然后再自己進(jìn)行修改,變成符合自己需要的一些正則表達(dá)式。
import re
# 正則表達(dá)式中的一些使用的符號(hào)
# 匹配出現(xiàn)符合條件的 0 次的或者是 多次
str1 = 'qwertyuio1ui3oo467j398k'
# 關(guān)鍵詞: * 下面的句子就是進(jìn)行匹配 零次 或者是 多次(多個(gè)字符) 符合是數(shù)字的意思
pattern = re.compile(r'\d*')
res = re.findall(pattern, str1)
print(res)
""""
顯示的結(jié)果:
['', '', '', '', '', '', '', '', '', '1', '', '', '3', '', '', '467', '', '398', '', '']
"""
# 關(guān)鍵詞: + 匹配一次或者是多次的結(jié)果
pattern = re.compile(r'\d+')
res = re.findall(pattern, str1)
print(res)
"""
顯示結(jié)果:
['1', '3', '467', '398']
"""
# 關(guān)鍵詞: ? 匹配0次或者是1次的結(jié)果
pattern = re.compile(r'\d?')
res = re.findall(pattern, str1)
print(res)
"""
['', '', '', '', '', '', '', '', '', '1',
'', '', '3', '', '', '4', '6', '7', '',
'3', '9', '8', '', '']
"""
# {m}精確匹配m次 (比如寫進(jìn)去的3,那么他就是匹配到是3個(gè)數(shù)字字符串的所有小字符串)
pattern = re.compile(r'\d{3}')
res = re.findall(pattern, str1)
print(res)
# 結(jié)果:['467', '398']
# {m, n} 最少匹配m次,最多匹配n次
# 記住在{}里面是不能隨便加上空格的?
pattern = re.compile(r'\d{1,3}')
res = re.findall(pattern, str1)
print(res)
# 結(jié)果:['1', '3', '467', '398']match()函數(shù)只檢測(cè) 目標(biāo)字符(串) 是不是在string的開始位置匹配,search()會(huì)掃描整個(gè)string查找匹配, match()只有在0位置匹配成功才會(huì)有返回,如果不是開始位置匹配成功,match()就會(huì)返回None
代碼解釋:
import re
m = re.match('lsp','hhttlsp')
if m is not None:
print(m.group())
else:
print('noneFine')
顯示結(jié)果:
noneFine
n = re.search('lsp','hhttlsp')
if n is not None:
print(n.group())
else:
print(noneFine')
顯示結(jié)果:
lsp
import re
n = re.search('lsp','hhttlsp')
if n:
print(n.group())
else:
print('noneFine')
# 顯示結(jié)果:
# lsp
m = re.match('lsp','hhttlsp')
if m:
print(m.group())
else:
print('noneFine')
# 顯示結(jié)果:
# noneFinepython的re庫(kù)有兩個(gè)函數(shù)/方法用于實(shí)現(xiàn)搜索和替換功能: sub()和subn().兩者幾乎一樣,都是將某字符串中所有匹配正則表達(dá)式的部分進(jìn)行某種形式的替換.用來(lái)替換的部分通常是一個(gè)字符串,但它也可能是一個(gè)函數(shù),該函數(shù)返回一個(gè)用來(lái)替換的字符串.subn()和 sub()一樣,但subn()還返回一個(gè)表示替換的總數(shù),替換后的字符串和表示替換總數(shù)的數(shù)字一起作為一個(gè)擁有兩個(gè)元素的元組返回.
# 可以使用sub()方法來(lái)進(jìn)行查詢和替換,sub方法的格式為: # sub(replacement, string[, count=0]) # replacement是被替換成的文本 # string是需要被替換的文本 # count是一個(gè)可選參數(shù),指最大被替換的數(shù)量 # 下面進(jìn)行將所有的數(shù)字給進(jìn)行替換掉 pattern = re.compile(r'\d') res = re.sub(pattern, '替換掉的數(shù)字 ',str1) print(res) # 下文結(jié)果,為了方便大家看到換了多少個(gè)數(shù)字,我使用了換行將字符串給換行看出有幾次換了數(shù)字 """ qwertyuio替換掉的數(shù)字 ui替換掉的數(shù)字 oo替換掉的數(shù)字 替換掉的數(shù)字 替換掉的數(shù)字 j替換掉的數(shù)字 替換掉的數(shù)字 替換掉的數(shù)字 k """
# 加上顯示修改了多少次
res = re.subn(pattern, '替換掉的數(shù)字 ',str1)
print(res)
"""
結(jié)果:
('qwertyuio替換掉的數(shù)字
ui替換掉的數(shù)字
oo替換掉的數(shù)字
替換掉的數(shù)字
替換掉的數(shù)字
j替換掉的數(shù)字
替換掉的數(shù)字
替換掉的數(shù)字
k', 8)
"""re.split(pattern, string, maxsplit=0, flags=0),如果匹配成功,則返回一個(gè)列表,否則返回原string列表;
- 第1個(gè)參數(shù):正則表達(dá)式
- 第2個(gè)參數(shù):要匹配查找的原始字符串;
- 第3個(gè)參數(shù):可選參數(shù),表示最大的拆分次數(shù),默認(rèn)為0,表示全部分割;
- 第4個(gè)參數(shù):可選參數(shù),標(biāo)志位,用于控制正則表達(dá)式的匹配方式,如:是否區(qū)分大小寫,多行匹配等等;
特別注意: 此方法并不是完全匹配。它僅僅決定在字符串開始的位置是否匹配。所以當(dāng)pattern結(jié)束時(shí)若還有剩余字符,仍然成功。若想進(jìn)行完全匹配,可以在表達(dá)式末尾加上邊界匹配符'$'
str2 = '自然語(yǔ)言處理123機(jī)器學(xué)習(xí)456深度學(xué)習(xí)' pattern = re.compile(r'\d+') res = re.split(pattern, str2) print(res) # 結(jié)果: # ['自然語(yǔ)言處理', '機(jī)器學(xué)習(xí)', '深度學(xué)習(xí)']
Python的re模塊是第一個(gè)提出解決方案的模塊:命名捕獲組和命名后向引用。(?P <name> group)將組的匹配捕獲到后向引用“名稱”中。
str2 = '自然語(yǔ)言處理123機(jī)器學(xué)習(xí)456深度學(xué)習(xí)'
pattern = re.compile(r'(?P<dota>\d+)(?P<lsp>\D+)')
m = re.search(pattern, str2)
print(m.group('lsp'))
# 結(jié)果為:
# 機(jī)器學(xué)習(xí)str2 = '自然語(yǔ)言處理123機(jī)器學(xué)習(xí)456深度學(xué)習(xí)'
pattern = re.compile(r'(?P<dota>\d+)(?P<lsp>\D+)')
m = re.search(pattern, str2)
print(m.group('dota'))
# 結(jié)果為:
# 123進(jìn)行號(hào)碼的篩選,小嘗試:
# 篩選號(hào)碼 str3 = 'number 132-3209-*******' pattern = re.compile(r'(\d\d\d-\d\d)') res = re.search(pattern, str3) print(res.group()) # 顯示結(jié)果: # 132-32
全部代碼:
# -*- coding:utf-8 -*-
# @Author : DaFuChen
# @File : demo1.py
# @software: PyCharm
import re
# 正則表達(dá)式中的一些使用的符號(hào)
# 匹配出現(xiàn)符合條件的 0 次的或者是 多次
str1 = 'qwertyuio1ui3oo467j398k'
# 關(guān)鍵詞: * 下面的句子就是進(jìn)行匹配 零次 或者是 多次(多個(gè)字符) 符合是數(shù)字的意思
pattern = re.compile(r'\d*')
res = re.findall(pattern, str1)
print(res)
""""
顯示的結(jié)果:
['', '', '', '', '', '', '', '', '', '1', '', '', '3', '', '', '467', '', '398', '', '']
"""
# 關(guān)鍵詞: + 匹配一次或者是多次的結(jié)果
pattern = re.compile(r'\d+')
res = re.findall(pattern, str1)
print(res)
"""
顯示結(jié)果:
['1', '3', '467', '398']
"""
# 關(guān)鍵詞: ? 匹配0次或者是1次的結(jié)果
pattern = re.compile(r'\d?')
res = re.findall(pattern, str1)
print(res)
"""
['', '', '', '', '', '', '', '', '', '1',
'', '', '3', '', '', '4', '6', '7', '',
'3', '9', '8', '', '']
"""
# {m}精確匹配m次 (比如寫進(jìn)去的3,那么他就是匹配到是3個(gè)數(shù)字字符串的所有小字符串)
pattern = re.compile(r'\d{3}')
res = re.findall(pattern, str1)
print(res)
# 結(jié)果:['467', '398']
# {m, n} 最少匹配m次,最多匹配n次
# 記住在{}里面是不能隨便加上空格的?
pattern = re.compile(r'\d{1,3}')
res = re.findall(pattern, str1)
print(res)
# 結(jié)果:['1', '3', '467', '398']
import re
n = re.search('lsp','hhttlsp')
if n:
print(n.group())
else:
print('noneFine')
# 顯示結(jié)果:
# lsp
m = re.match('lsp','hhttlsp')
if m:
print(m.group())
else:
print('noneFine')
# 顯示結(jié)果:
# noneFine
# 可以使用sub()方法來(lái)進(jìn)行查詢和替換,sub方法的格式為:
# sub(replacement, string[, count=0])
# replacement是被替換成的文本
# string是需要被替換的文本
# count是一個(gè)可選參數(shù),指最大被替換的數(shù)量
# 下面進(jìn)行將所有的數(shù)字給進(jìn)行替換掉
pattern = re.compile(r'\d')
res = re.sub(pattern, '替換掉的數(shù)字 ',str1)
print(res)
# 下文結(jié)果,為了方便大家看到換了多少個(gè)數(shù)字,我使用了換行將字符串給換行看出有幾次換了數(shù)字
"""
qwertyuio替換掉的數(shù)字
ui替換掉的數(shù)字
oo替換掉的數(shù)字
替換掉的數(shù)字
替換掉的數(shù)字
j替換掉的數(shù)字
替換掉的數(shù)字
替換掉的數(shù)字 k
"""
# 加上顯示修改了多少次
res = re.subn(pattern, '替換掉的數(shù)字 ',str1)
print(res)
"""
結(jié)果:
('qwertyuio替換掉的數(shù)字
ui替換掉的數(shù)字
oo替換掉的數(shù)字
替換掉的數(shù)字
替換掉的數(shù)字
j替換掉的數(shù)字
替換掉的數(shù)字
替換掉的數(shù)字
k', 8)
"""
str2 = '自然語(yǔ)言處理123機(jī)器學(xué)習(xí)456深度學(xué)習(xí)'
pattern = re.compile(r'\d+')
res = re.split(pattern, str2)
print(res)
# 結(jié)果:
# ['自然語(yǔ)言處理', '機(jī)器學(xué)習(xí)', '深度學(xué)習(xí)']
str2 = '自然語(yǔ)言處理123機(jī)器學(xué)習(xí)456深度學(xué)習(xí)'
pattern = re.compile(r'(?P<dota>\d+)(?P<lsp>\D+)')
m = re.search(pattern, str2)
print(m.group('dota'))
# 結(jié)果為:
# 123
# 篩選號(hào)碼
str3 = 'number 132-3209-*******'
pattern = re.compile(r'(\d\d\d-\d\d)')
res = re.search(pattern, str3)
print(res.group())
# 顯示結(jié)果:
# 132-32到此這篇關(guān)于python正則表達(dá)中的re庫(kù)常用方法總結(jié)的文章就介紹到這了,更多相關(guān)python re庫(kù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Pandas進(jìn)行文本數(shù)據(jù)處理的全面指南
在數(shù)據(jù)分析中,文本數(shù)據(jù)是常見(jiàn)的數(shù)據(jù)類型之一,本文將詳細(xì)介紹 Pandas 中的文本處理功能,并通過(guò)實(shí)際代碼示例展示如何使用它們,希望對(duì)大家有一定的幫助2025-05-05
Python?time模塊之時(shí)間戳與結(jié)構(gòu)化時(shí)間的使用
這篇文章主要為大家詳細(xì)介紹了Python中的time模塊以及如何利用time模塊實(shí)現(xiàn)時(shí)間戳與結(jié)構(gòu)化時(shí)間,文中的示例代碼講解詳細(xì),需要的可以參考一下2022-06-06
一文搞懂???????python可迭代對(duì)象,迭代器,生成器,協(xié)程
這篇文章主要介紹了一文搞懂???????python可迭代對(duì)象,迭代器,生成器,協(xié)程,微博吱嘎部分圍繞主題展開詳細(xì)介紹,需要的小伙伴可以參考一下2022-05-05
python使用正則表達(dá)式來(lái)獲取文件名的前綴方法
今天小編就為大家分享一篇python使用正則表達(dá)式來(lái)獲取文件名的前綴方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-10-10
Django中使用pillow實(shí)現(xiàn)登錄驗(yàn)證碼功能(帶刷新驗(yàn)證碼功能)
這篇文章主要介紹了Django中使用pillow實(shí)現(xiàn)登錄驗(yàn)證碼功能(帶刷新驗(yàn)證碼功能),本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-04-04
基于Python實(shí)現(xiàn)Excel轉(zhuǎn)Markdown表格
Markdown(也簡(jiǎn)稱md)作為一種輕量級(jí)標(biāo)記語(yǔ)言,因其易寫易讀,效果美觀大方,不僅被眾多網(wǎng)站使用,也是程序員們做筆記、寫文檔的首選。本文將利用Python實(shí)現(xiàn)Excel轉(zhuǎn)Markdown表格,感興趣的可以了解一下2022-04-04

