Python正則表達(dá)式re.sub()用法詳解

更新時(shí)間：2022年09月29日 10:25:41 作者：IT之一小佬

re.sub用于替換字符串中的匹配項(xiàng),下面這篇文章主要給大家介紹了關(guān)于Python正則表達(dá)式re.sub()用法的相關(guān)資料,文中通過(guò)實(shí)例代碼以及圖文介紹的非常詳細(xì),需要的朋友可以參考下

def sub(pattern, repl, string, count=0, flags=0):
    """Return the string obtained by replacing the leftmost
    non-overlapping occurrences of the pattern in string by the
    replacement repl.  repl can be either a string or a callable;
    if a string, backslash escapes in it are processed.  If it is
    a callable, it's passed the Match object and must return
    a replacement string to be used."""
    return _compile(pattern, flags).sub(repl, string, count)

從源碼中看出re.sub()函數(shù)共有5個(gè)參數(shù)：

pattern：表示正則中的模式字符串；
repl：表示要替換的字符串（即匹配到pattern后替換為repl），也可以是個(gè)函數(shù)；
string：表示要被處理（查找替換）的原始字符串；
count：可選參數(shù)，表示要替換的最大次數(shù)，而且必須是非負(fù)整數(shù)，該參數(shù)默認(rèn)為0，即所有的匹配都會(huì)替換；
flags：可選參數(shù)，表示編譯時(shí)用的匹配模式（如忽略大小寫(xiě)、多行模式等），數(shù)字形式，默認(rèn)為0。

re.sub()：匹配替換為選擇的文本。

1.匹配單個(gè)數(shù)字或字母

示例代碼：【只匹配單一數(shù)字】

import re
s = "您好，歡迎來(lái)到我的博客：https://blog.csdn.net/weixin_44799217,,,###,,,我的郵箱是：535646343@qq.com. Today is 2021/12/21. It is a wonderful DAY!"
#  只匹配單一數(shù)字
ret = re.sub(r'[0-9]', "*", s)
print(ret)

運(yùn)行結(jié)果：

re.sub(r'[0-9]', '*', s) 這句話(huà)表示只匹配單一數(shù)字，并將每一個(gè)數(shù)字替換為一個(gè)星號(hào) 。

示例代碼：【只匹配單一字母】

import re
 
s = "您好，歡迎來(lái)到我的博客：https://blog.csdn.net/weixin_44799217,,,###,,,我的郵箱是：535646343@qq.com. Today is 2021/12/21. It is a wonderful DAY!"
 
#  只匹配單一字母
ret = re.sub(r'[a-z]', "*", s)
print(ret)
ret = re.sub(r'[A-Z]', "*", s)
print(ret)
ret = re.sub(r'[a-zA-Z]', "*", s)
print(ret)
ret = re.sub(r'[A-z]', "*", s)
print(ret)

運(yùn)行結(jié)果：

re.sub(r'[a-z]', '*', s) 表示只匹配單一小寫(xiě)字母，并將每一個(gè)小寫(xiě)字母替換為一個(gè)星號(hào) 。re.sub(r'[A-Z]', '*', s) 表示只匹配單一大寫(xiě)字母，并將每一個(gè)大寫(xiě)字母替換為一個(gè)星號(hào) 。re.sub(r'[A-Za-z]', '*', s) 這句話(huà)則表示只匹配單一字母，并將每一個(gè)字母替換為一個(gè)星號(hào) 。

示例代碼：【匹配單一數(shù)字和字母】

import re
 
s = "您好，歡迎來(lái)到我的博客：https://blog.csdn.net/weixin_44799217,,,###,,,我的郵箱是：535646343@qq.com. Today is 2021/12/21. It is a wonderful DAY!"
 
#  匹配單一數(shù)字和字母
ret = re.sub(r'[0-9a-z]', "*", s)
print(ret)
ret = re.sub(r'[0-9A-Z]', "*", s)
print(ret)
ret = re.sub(r'[0-9a-zA-Z]', "*", s)
print(ret)
ret = re.sub(r'[0-9A-z]', "*", s)
print(ret)

運(yùn)行結(jié)果：

re.sub(r'[0-9A-Z]', '*', s) 表示只匹配單一數(shù)字和大寫(xiě)字母，并將每一個(gè)數(shù)字和大寫(xiě)字母替換為一個(gè)星號(hào) 。
re.sub(r'[0-9a-z]', '*', s) 表示只匹配單一數(shù)字和小寫(xiě)字母，并將每一個(gè)數(shù)字和小寫(xiě)字母替換為一個(gè)星號(hào) 。
re.sub(r'[0-9A-Za-z]', '*', s) 表示只匹配單一數(shù)字和字母，并將每一個(gè)數(shù)字和字母替換為一個(gè)星號(hào) 。

2.匹配多個(gè)數(shù)字或字母

注意：這里的所說(shuō)的多個(gè)指的是大于等于一個(gè)。

示例代碼：【匹配多個(gè)數(shù)字】

import re
 
s = "您好，歡迎來(lái)到我的博客：https://blog.csdn.net/weixin_44799217,,,###,,,我的郵箱是：535646343@qq.com. Today is 2021/12/21. It is a wonderful DAY!"
 
#  匹配多個(gè)數(shù)字
ret = re.sub(r'[0-9]+', "*", s)
print(ret)

運(yùn)行結(jié)果：

re.sub(r'[0-9]+', '*', s) 表示匹配多個(gè)連續(xù)的數(shù)字，并將多個(gè)連續(xù)的數(shù)字替換為一個(gè)星號(hào) 。

示例代碼：【匹配多個(gè)字母】

import re
 
s = "您好，歡迎來(lái)到我的博客：https://blog.csdn.net/weixin_44799217,,,###,,,我的郵箱是：535646343@qq.com. Today is 2021/12/21. It is a wonderful DAY!"
 
#  匹配多個(gè)字母
ret = re.sub(r'[a-z]+', "*", s)
print(ret)
ret = re.sub(r'[A-Z]+', "*", s)
print(ret)
ret = re.sub(r'[a-zA-Z]+', "*", s)
print(ret)

運(yùn)行結(jié)果：

re.sub(r'[a-z]+', '*', s) 表示匹配多個(gè)連續(xù)的小寫(xiě)字母，并將多個(gè)連續(xù)的小寫(xiě)字母替換為一個(gè)星號(hào) 。
re.sub(r'[A-Z]+', '*', s) 表示匹配多個(gè)連續(xù)的大寫(xiě)字母，并將多個(gè)連續(xù)的大寫(xiě)字母替換為一個(gè)星號(hào) 。
re.sub(r'[A-Za-z]+', '*', s) 表示匹配多個(gè)連續(xù)的字母，并將多個(gè)連續(xù)的字母替換為一個(gè)星號(hào) 。

示例代碼：【匹配多個(gè)連續(xù)數(shù)字和字母】

import re
 
s = "您好，歡迎來(lái)到我的博客：https://blog.csdn.net/weixin_44799217,,,###,,,我的郵箱是：535646343@qq.com. Today is 2021/12/21. It is a wonderful DAY!"
 
#  匹配多個(gè)數(shù)字和字母
ret = re.sub(r'[0-9a-zA-Z]+', "*", s)
print(ret)

運(yùn)行結(jié)果：

re.sub(r'[0-9A-Za-z]+', '*', s) 表示匹配多個(gè)連續(xù)的數(shù)字和字母，并將多個(gè)連續(xù)的數(shù)字、連續(xù)的字母、連續(xù)的數(shù)字和字母替換為一個(gè)星號(hào) 。

3.匹配其他

示例代碼：【匹配非數(shù)字】

import re
 
s = "您好，歡迎來(lái)到我的博客：https://blog.csdn.net/weixin_44799217,,,###,,,我的郵箱是：535646343@qq.com. Today is 2021/12/21. It is a wonderful DAY!"
 
#  匹配非數(shù)字
ret = re.sub(r'[^0-9]', "*", s)
print(ret)
ret = re.sub(r'[^0-9]+', "*", s)
print(ret)

運(yùn)行結(jié)果：

re.sub(r'[^0-9]', '*', s) 表示匹配單個(gè)非數(shù)字，并將單個(gè)非數(shù)字替換為一個(gè)星號(hào) 。
re.sub(r'[^0-9]+', '*', s) 表示匹配多個(gè)連續(xù)的非數(shù)字，并將多個(gè)連續(xù)的非數(shù)字替換為一個(gè)星號(hào) 。

示例代碼：【匹配非字母】

import re
 
s = "您好，歡迎來(lái)到我的博客：https://blog.csdn.net/weixin_44799217,,,###,,,我的郵箱是：535646343@qq.com. Today is 2021/12/21. It is a wonderful DAY!"
 
#  匹配非字母
ret = re.sub(r'[^a-z]', "*", s)
print(ret)
ret = re.sub(r'[^A-Z]', "*", s)
print(ret)
ret = re.sub(r'[^a-zA-Z]', "*", s)
print(ret)
ret = re.sub(r'[^a-z]+', "*", s)
print(ret)
ret = re.sub(r'[^A-Z]+', "*", s)
print(ret)
ret = re.sub(r'[^a-zA-Z]+', "*", s)
print(ret)

運(yùn)行結(jié)果：

re.sub(r'[^a-z]', '*', s) 表示匹配單個(gè)非小寫(xiě)字母，并將單個(gè)非小寫(xiě)字母替換為一個(gè)星號(hào) 。
re.sub(r'[^A-Z]', '*', s) 表示匹配單個(gè)非大寫(xiě)字母，并將單個(gè)非大寫(xiě)字母替換為一個(gè)星號(hào) 。
re.sub(r'[^A-Za-z]', '*', s) 表示匹配單個(gè)非字母，并將單個(gè)非字母替換為一個(gè)星號(hào) 。
re.sub(r'[^a-z]+', '*', s) 表示匹配多個(gè)連續(xù)的非小寫(xiě)字母，并將多個(gè)連續(xù)的非小寫(xiě)字母替換為一個(gè)星號(hào) 。
re.sub(r'[^A-Z]+', '*', s) 表示匹配多個(gè)連續(xù)的非大寫(xiě)字母，并將多個(gè)連續(xù)的非大寫(xiě)字母替換為一個(gè)星號(hào) 。
re.sub(r'[^A-Za-z]+', '*', s)表示匹配多個(gè)連續(xù)的非字母，并將多個(gè)連續(xù)的非字母替換為一個(gè)星號(hào) 。

示例代碼：【匹配非數(shù)字和非字母】

import re
 
s = "您好，歡迎來(lái)到我的博客：https://blog.csdn.net/weixin_44799217,,,###,,,我的郵箱是：535646343@qq.com. Today is 2021/12/21. It is a wonderful DAY!"
 
#  匹配非數(shù)字和非字母
ret = re.sub(r'[^0-9a-zA-Z]', "*", s)
print(ret)
ret = re.sub(r'[^0-9a-zA-Z]+', "*", s)
print(ret)

運(yùn)行結(jié)果：

re.sub(r'[^0-9A-Za-z]', '*', s) 表示匹配單個(gè)非數(shù)字和非字母，并將單個(gè)非數(shù)字和非字母替換為一個(gè)星號(hào) 。
re.sub(r'[^0-9A-Za-z]+', '*', s) 表示匹配多個(gè)連續(xù)的非數(shù)字和非字母，并將多個(gè)連續(xù)的非數(shù)字和非字母替換為一個(gè)星號(hào) 。

示例代碼：【匹配固定形式】【只保留字母和空格，將 repl 設(shè)置為空字符即可】

import re
 
s = "您好，歡迎來(lái)到我的博客：https://blog.csdn.net/weixin_44799217,,,###,,,我的郵箱是：535646343@qq.com. Today is 2021/12/21. It is a wonderful DAY!"
 
#  匹配固定形式
ret = re.sub(r'[^a-z ]', " ", s)
print(ret)
ret = re.sub(r'[^a-z ]+', " ", s)
print(ret)
ret = re.sub(r'[^a-zA-Z ]', " ", s)
print(ret)
ret = re.sub(r'[^a-zA-Z ]+', " ", s)
print(ret)

運(yùn)行結(jié)果：

示例代碼：【去除以 @ 開(kāi)頭的英文單詞】

import re
 
s = "您好，歡迎來(lái)到我的博客：https://blog.csdn.net/weixin_44799217,,,###,,,我的郵箱是：535646343@qq.com. Today is 2021/12/21. It is a wonderful DAY!"
 
#  去除以 @ 開(kāi)頭的英文單詞
ret = re.sub(r'@[a-zA-Z ]+', " ", s)
print(ret)

運(yùn)行結(jié)果：

示例代碼：【去除原始字符串中的URL】

import re
 
s = "您好，歡迎來(lái)到我的博客：https://blog.csdn.net/weixin_44799217,,,###,,,我的郵箱是：535646343@qq.com. Today is 2021/12/21. It is a wonderful DAY!"
 
#  d.去除原始字符串中的URL
ret = re.sub(r'https[:.]+\S+', "", s)
print(ret)

運(yùn)行結(jié)果：

示例代碼：【匹配到的所有空格使用“+”來(lái)替換】

import re
 
s = "Long live the people's Republic of China"
ret = re.sub("\s", "+", s)
print(ret)
 
ret2 = re.sub("\s", "+", s, 3)  # 通過(guò)count參數(shù)控制替換的次數(shù)
print(ret2)

運(yùn)行結(jié)果：