這里可以看出，·re· 下面有很多立即可以使用的函數(shù)，然后 re.compile 下面有很多同名的函數(shù)。直接在 ·re· 模塊下的是官方提供方便使用的函數(shù)，通過 re.compile 來使用是最正統(tǒng)的方式。所以，接下來的內(nèi)容，我基本上智慧使用 re.compile 及其下的方法來實現(xiàn)。

re.compile 函數(shù)

compile 函數(shù)用于編譯正則表達式，生成一個正則表達式（Pattern）對象，供 match() 和 search() 以及其它函數(shù)使用。

語法：

re.compile(pattern[, flags])

pattern: 一個字符串形式的正則表達式
flags 可選，表示匹配模式，比如忽略大小寫，多行模式等，具體參數(shù)為：
- re.I 忽略大小寫
- re.L 多行模式
- re.S 即為 '.' 并且包括換行符在內(nèi)的任意字符（'.' 不包括換行符）
- re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依賴 Unicode 字符屬性數(shù)據(jù)庫
- re.X 為了增加可讀性，忽略空格和 ‘#’ 后面的注釋

示例：查找字符串中的所有數(shù)字

import re

s = 'runoob 123 google 456'
result1 = re.findall(r'\d+', s)

pattern = re.compile(r'\d+') # 查找數(shù)字
result2 = pattern.findall(s)
result3 = pattern.findall(s, 0, 20)


print(result1)
print(result2)
print(result3)


"""
output:
[‘123'， ‘456']
[‘123'， ‘456']
[‘123'， ‘45']
"""

學(xué)習(xí)模板

接下來我們要逐漸學(xué)習(xí)正則表達的內(nèi)容，這些內(nèi)容是非常有趣的！Interesting and Excited！

這里給出一個接下來會一直使用的示例模板，這個模板是這篇博客最重要的東西了，之后的內(nèi)容都會基于它進行擴展。所以，請好好理解它。

import re

# 需要進行搜索或者匹配的文本
text = """I love you yesterday and today."""

# 正則表達式
regexp = r'love'


# 編譯（對正則表達式進行編譯獲取 Pattern Object）
pattern = re.compile(regexp)

# 搜索
m = pattern.search(text)
if m:
    print("匹配對象: ", m)
    print("匹配的字符串: ", m.group())
    print("匹配的開始位置: ", m.start())
    print("匹配的結(jié)束位置: ", m.end())
    print("匹配位置的元組: ", m.span())
else:
    print("No match!")

# 替換
new_text = pattern.sub("hate", text)
print(new_text)

在這里插入圖片描述

注意： 正則表達式 regexp 在開始前會使用 r 前綴，這樣做的目的是為了避免在正則表達式中大量使用轉(zhuǎn)義字符，破壞了整體的可讀性。

Python 的正則表達式包含了很多非常易用的方法，但是這里我并不會過多介紹它們。我們會一直使用上面這種模式，因為那些易用的方法只是對它的一種封裝，學(xué)習(xí)使用這種基本的方式自然就會其它的了。

匹配對象可以獲取有關(guān)正則表達式的信息，它最重要的方法和屬性是：

方法/屬性	目的
group()	返回正則匹配的字符串
start()	返回匹配的開始位置
end()	返回匹配的結(jié)束位置
span()	返回包含匹配 (start, end) 位置的元組

到此這篇關(guān)于淺談Python的正則表達式的文章就介紹到這了,更多相關(guān)Python正則表達式內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: