腳本之家服務(wù)器常用軟件

快捷導(dǎo)航

軟件下載

android MAC 驅(qū)動(dòng)下載字體下載 DLL

源碼下載

PHP ASP.NET ASP JSP

軟件編程

C# JAVA C 語言 Delphi Android

網(wǎng)絡(luò)編程

PHP ASP.NET ASP JavaScript

在線工具

CSS格式化 JS格式化 Html轉(zhuǎn)化為Js

數(shù)據(jù)庫

MYSQL MSSQL oracle DB2 MARIADB

CMS

PHPCMS DEDECMS 帝國CMS WordPress

常用工具

PHP開發(fā)工具 python Photoshop 必備軟件

一篇文章帶你入門Python正則表達(dá)式

更新時(shí)間：2021年10月19日 17:11:44 作者：古杜且偲

這篇文章主要介紹了Python中正則表達(dá)式的詳細(xì)教程,正則表達(dá)式是Python學(xué)習(xí)進(jìn)階當(dāng)中的重要內(nèi)容,需要的朋友可以參考下

Python3 正則表達(dá)式

正則表達(dá)式是一個(gè)特殊的字符序列，它能幫助你方便的檢查一個(gè)字符串是否與某種模式匹配。本文主要闡述re包中的主要函數(shù)。

在闡述re包中的函數(shù)之前，我們首先看議案正則表達(dá)式的模式，即使用特殊的語法來表示一個(gè)正則表達(dá)式。

Image Name

1.match函數(shù)

re.match 嘗試從字符串的起始位置匹配一個(gè)模式，如果不是起始位置匹配成功的話，match()就返回none。
函數(shù)用法：re.match(pattern, string, flags=0)
pattern: 所要匹配的正則表達(dá)式string: 要匹配的字符串flags: 標(biāo)志位，用于控制正則表達(dá)式的匹配方式，如：是否區(qū)分大小寫，多行匹配等等。
- re.I 忽略大小寫
- re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依賴于當(dāng)前環(huán)境
- re.M 多行模式re.S 即為' . ‘并且包括換行符在內(nèi)的任意字符（' . '不包括換行符）
- re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依賴于 Unicode 字符屬性數(shù)據(jù)庫
- re.X 為了增加可讀性，忽略空格和' # '后面的注釋

匹配對象方法：

group(num=0): 匹配的整個(gè)表達(dá)式的字符串，group() 可以一次輸入多個(gè)組號(hào)，在這種情況下它將返回一個(gè)包含那些組所對應(yīng)值的元組。
groups(): 返回一個(gè)包含所有小組字符串的元組，從 1 到所含的小組號(hào)。

import re
print(re.match("xixi", "xixi_haha_heihei").group())

xixi

line = 'Cats are smarter than dogs'
b = re.match(r'(.*) are (.*?) .*', line, re.M|re.I)

print(b.group()) # 返回所有
print(b.group(1)) # 返回第一組，即(.*)對應(yīng)的
print(b.group(2)) # 返回第二組，即(.*?)對應(yīng)的

Cats are smarter than dogs
Cats
smarter

2.search函數(shù)

re.search 掃描整個(gè)字符串并返回第一個(gè)成功的匹配。

函數(shù)用法：re.search(pattern, string, flags=0)

print(re.match('heihei', 'xixi_haha_heihei'))
print(re.search('heihei', 'xixi_haha_heihei').group())

None
heihei

line = 'Cats are smarter than dogs'
b = re.search(r'(.*) are (.*?) .*', line, re.M|re.I)

print(b.group()) # 返回所有
print(b.group(1)) # 返回第一組，即(.*)對應(yīng)的
print(b.group(2)) # 返回第二組，即(.*?)對應(yīng)的

Cats are smarter than dogs
Cats
smarter

search和match的區(qū)別

match只匹配字符串的開始，如果字符串開始不符合正則表達(dá)式，則匹配失敗，函數(shù)返回None；而search匹配整個(gè)字符串，直到找到一個(gè)匹配。

3. sub函數(shù)

re提供了re.sub來替換字符串中的匹配項(xiàng)。
函數(shù)用法：re.sub(pattern, repl, string, count=0, flags=0)

pattern : 正則中的模式字符串。
repl : 替換的字符串，也可為一個(gè)函數(shù)。
string : 要被查找替換的原始字符串。
count : 模式匹配后替換的最大次數(shù)，默認(rèn) 0 表示替換所有的匹配。
flags : 編譯時(shí)用的匹配模式，數(shù)字形式。

phone = '133-3333-3333  # this is a phone number'

num = re.sub(r'#.*$', '', phone)
print('phone num', num)
# 移除注釋，找到以#開頭的。

num = re.sub(r'\D', '', phone)
print('phone num', num)
# 移除非數(shù)字內(nèi)容

phone num 133-3333-3333  
phone num 13333333333

repl是函數(shù)的情況

def double(matched):
    value = int(matched.group('value'))
    return str(value * 2)

s = 'A233Sfd34'
print(re.sub('(?P<value>\d+)', double, s))

A466Sfd68

4.compile函數(shù)

compile 函數(shù)用于編譯正則表達(dá)式，生成一個(gè)正則表達(dá)式（ Pattern ）對象，供 match() 和 search() 這兩個(gè)函數(shù)使用。
函數(shù)使用：re.compile(pattern, flags)

pattern = re.compile(r'/d+')
m = pattern.match('ones123412')
print(m)

None

5.findall

在字符串中找到正則表達(dá)式所匹配的所有子串，并返回一個(gè)列表，如果沒有找到匹配的，則返回空列表。
注意：match和search是匹配一次，但是findall是匹配所有。

函數(shù)使用：findall(string, pos, endpos)

string 待匹配的字符串。
pos 可選參數(shù)，指定字符串的起始位置，默認(rèn)為 0。
endpos 可選參數(shù)，指定字符串的結(jié)束位置，默認(rèn)為字符串的長度。

pattern = re.compile(r'\d+')
result1 = pattern.findall('xixixix 123 heihiehei 456')
result2 = pattern.findall('xixixix 123 heihiehei 456', 0, 15)

print(result1)
print(result2)

['123', '456']
['123']

6.finditer

和 findall 類似，在字符串中找到正則表達(dá)式所匹配的所有子串，并把它們作為一個(gè)迭代器返回。

ittt = re.finditer(r'\d+', '12dsfasdf123asdf534')
for ttt in ittt:
    print(ttt.group())

12
123
534

7.split

split 方法按照能夠匹配的子串將字符串分割后返回列表。

函數(shù)使用：

re.split(pattern, string, maxsplit=0, flags=0)

pattern：匹配的正則表達(dá)式
string：要匹配的字符串。
maxsplit：分隔次數(shù)，maxsplit=1 分隔一次，默認(rèn)為 0，不限制次數(shù)。
flags：標(biāo)志位，用于控制正則表達(dá)式的匹配方式，

print(re.split('\W+', 'xxixix, xixixi, hehiehei'))
print(re.split('(\W+)', ' xxixix, xixixi, hehiehei'))

['xxixix', 'xixixi', 'hehiehei']
['', ' ', 'xxixix', ', ', 'xixixi', ', ', 'hehiehei']

總結(jié)

本篇文章就到這里了，希望能夠給你帶來幫助，也希望您能夠多多關(guān)注腳本之家的更多內(nèi)容！

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片