Python 正則表達式 re.match/re.search/re.sub的使用解析

更新時間：2019年07月22日 21:41:22 作者：AIHGF

今天小編就為大家分享一篇Python 正則表達式 re.match/re.search/re.sub的使用解析，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

From Python正則表達式

re.match(pattern, string, flags=0)

嘗試從字符串起始位置匹配一個模式；如果不是起始位置匹配成功，則 re.match() 返回none.

匹配成功，re.match() 返回一個匹配的對象，否則返回None.

pattern - 匹配的正則表達式

string - 要匹配的字符串

flags - 標志位，控制正則表達式的匹配方式，如，是否區(qū)分大小寫，多行匹配等.

e.g.

#!/usr/bin/python
# -*- coding: UTF-8 -*- 

import re
print(re.match('www', 'www.runoob.com').span()) # 在起始位置匹配
print(re.match('com', 'www.runoob.com'))  # 不在起始位置匹配

output:
(0, 3)
None

re.search(pattern, string, flags=0)

掃描整個字符串并返回第一個成功的匹配.

匹配成功, re.search()返回一個匹配的對象，否則返回None.

e.g.

#!/usr/bin/python
# -*- coding: UTF-8 -*- 

import re
print(re.search('www', 'www.runoob.com').span()) # 在起始位置匹配
print(re.search('com', 'www.runoob.com').span()) # 不在起始位置匹配

output:
(0, 3)
(11, 14)

re.match() 只匹配字符串的開始，如果字符串開始不符合正則表達式，則匹配失敗，函數(shù)返回None；

re.search() 匹配整個字符串，直到找到一個匹配.

re.sub(pattern, repl, string, count=0, flags=0)

替換字符串中的匹配項.

pattern - 正則中的模式字符串

repl - 替換的字符串，也可為一個函數(shù)

string - 要被查找替換的原始字符串

count - 模式匹配后替換的最大次數(shù)，默認 0 表示替換所有的匹配

e.g.

#!/usr/bin/python
# -*- coding: UTF-8 -*-

import re

phone = "2004-959-559

# 刪除字符串中的 Python注釋 
num = re.sub(r'#.*$', "", phone)
print "電話號碼是: ", num

# 刪除非數(shù)字(-)的字符串 
num = re.sub(r'\D', "", phone)
print "電話號碼是 : ", num

output:
電話號碼是: 2004-959-559 
電話號碼是 : 2004959559

正則表達式模式

模式	描述
^	匹配字符串的開頭
$	匹配字符串的末尾
.	匹配任意字符，除了換行符，當re.DOTALL標記被指定時，則可以匹配包括換行符的任意字符
[…]	用來表示一組字符,單獨列出：[amk] 匹配 ‘a(chǎn)'，'m'或'k'
[^…]	不在[]中的字符：[^abc] 匹配除了a,b,c之外的字符
re*	匹配0個或多個的表達式
re+	匹配1個或多個的表達式
re?	匹配0個或1個由前面的正則表達式定義的片段，非貪婪方式
re{ n}
re{ n,}	精確匹配n個前面表達式
re{ n, m}	匹配 n 到 m 次由前面的正則表達式定義的片段，貪婪方式
aIb	匹配a或b
(re)	G匹配括號內(nèi)的表達式，也表示一個組
(?imx)	正則表達式包含三種可選標志：i, m, 或 x, 只影響括號中的區(qū)域
(?-imx)	正則表達式關(guān)閉 i, m, 或 x 可選標志, 只影響括號中的區(qū)域
(?: re)	類似 (…), 但是不表示一個組
(?imx: re)	在括號中使用i, m, 或 x 可選標志
(?-imx: re)	在括號中不使用i, m, 或 x 可選標志
(?#…)	注釋
(?= re)	前向肯定界定符. 如果所含正則表達式，以 … 表示，在當前位置成功匹配時成功，否則失敗. 但一旦所含表達式已經(jīng)嘗試，匹配引擎根本沒有提高；模式的剩余部分還要嘗試界定符的右邊.
(?! re)	前向否定界定符. 與肯定界定符相反；當所含表達式不能在字符串當前位置匹配時成功
(?> re)	匹配的獨立模式，省去回溯
\w	匹配字母數(shù)字及下劃線
\W	匹配非字母數(shù)字及下劃線
\s	匹配任意空白字符，等價于 [\t\n\r\f]
\S	匹配任意非空字符
\d	匹配任意數(shù)字，等價于 [0-9].
\D	匹配任意非數(shù)字
\A	匹配字符串開始
\Z	匹配字符串結(jié)束，如果是存在換行，只匹配到換行前的結(jié)束字符串
\z	匹配字符串結(jié)束
\G	匹配最后匹配完成的位置
\b	匹配一個單詞邊界，也就是指單詞和空格間的位置.例如， ‘er\b' 可以匹配”never” 中的 ‘er'，但不能匹配 “verb” 中的 ‘er'.
\B	匹配非單詞邊界. ‘er\B' 能匹配 “verb” 中的 ‘er'，但不能匹配 “never” 中的 ‘er'.
\n, \t, 等.	匹配一個換行符。匹配一個制表符, 等
\1…\9	匹配第n個分組的內(nèi)容.
\10	匹配第n個分組的內(nèi)容，如果它經(jīng)匹配. 否則指的是八進制字符碼的表達式.

正則表達式實例

實例	描述
python	匹配 “python”
[Pp]ython	匹配 “Python” 或 “python”
rub[ye]	匹配 “ruby” 或 “rube”
[aeiou]	匹配中括號內(nèi)的任意一個字母
[0-9]	匹配任何數(shù)字，類似于 [0123456789]
[a-z]	匹配任何小寫字母
[A-Z]	匹配任何大寫字母
[a-zA-Z0-9]	匹配任何字母及數(shù)字
[^aeiou]	除了aeiou字母以外的所有字符
[^0-9]	匹配除了數(shù)字外的字符
.	匹配除 “\n” 之外的任何單個字符。要匹配包括 ‘\n' 在內(nèi)的任何字符，請使用象 ‘[.\n]' 的模式.
\d	匹配一個數(shù)字字符, 等價于 [0-9].
\D	匹配一個非數(shù)字字符, 等價于 [^0-9].
\s	匹配任何空白字符，包括空格、制表符、換頁符等等, 等價于 [ \f\n\r\t\v].
\S	匹配任何非空白字符, 等價于 [^ \f\n\r\t\v].
\w	匹配包括下劃線的任何單詞字符, 等價于'[A-Za-z0-9_]'.
\W	匹配任何非單詞字符, 等價于 ‘[^A-Za-z0-9_]'.