欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python如何通過正則匹配指定字符開頭與結(jié)束提取中間內(nèi)容

 更新時間:2023年02月20日 14:58:59   作者:weixin_43890704  
這篇文章主要介紹了python通過正則匹配指定字符開頭與結(jié)束提取中間內(nèi)容的操作方法,本文結(jié)合實例代碼給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下

一、提取包含始末字符

1、起始字符串固定

a = re.findall('起始字符串.*結(jié)束字符串',str)

2、起始字符串不固定(即從首字符串提取到固定的字符串結(jié)束),用^指定從首字符串開始

a = re.findall('^.*結(jié)束字符串',str)

二、不包含始末字符串

#方法1
a = re.findall('(?<=始字符串).*?(?=末字符串)',str)
#方法2
a = re.findall('始字符串(.*?)末字符串',str)

在 re.findall()的方法中 '始字符串.末字符串’ 可以匹配到相同的值直到最后一個值;如果參數(shù)為 '始字符串.?末字符串’則只匹配到第一個值。其實使用.*和.+都能提取特定始末字符串中間的內(nèi)容,下面順便說下兩者的區(qū)別。

三、.*和.+正則提取的區(qū)別

.:匹配任意字符
*:匹配0個或多個字符
?:非貪婪模式,在符合的條件下,盡可能少的匹配(盡可能短的匹配)

str2 = "aabab"
a = re.findall('a.*?b',str2)	#結(jié)果:['aab', 'ab']
b = re.findall('a.+?b',str2)	#結(jié)果:['aab']

.?:匹配aab和ab ,因為可以匹配0個字符,所以可以匹配得到ab
.+?:匹配aab,因為+必須a和b中間至少有一個字符,所以排除了ab

四、起始有無^的區(qū)別

str2 = "aabab"
c = re.findall('.*',str2)	#結(jié)果:['aabab', '']
d = re.findall('^.*',str2)	#結(jié)果:['aabab']

五、pandas對具體列的內(nèi)容通過正則表達式進行數(shù)據(jù)提取

1.使用前要確保該列的類型統(tǒng)一,str或者float格式,最好事先通過astype強制轉(zhuǎn)換一下

2.df[‘新列名’]=df[‘提取的列名’].str.extract(‘正則表達式’, expand = True)

六、遇到的報錯

報錯:pattern contains no capture groups
(翻譯:模式不包含捕獲組)
解決:根據(jù)docs ,您需要為 str.extract 指定一個捕獲組(即括號)好,提取。

參考文章:

https://www.cnblogs.com/ZhangHT97/p/13427325.html
https://www.cnblogs.com/YouJeffrey/p/15209895.html

https://blog.csdn.net/dudu3332/article/details/111555572 

到此這篇關(guān)于python通過正則匹配指定字符開頭與結(jié)束提取中間內(nèi)容的文章就介紹到這了,更多相關(guān)python正則匹配提取中間內(nèi)容內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python利用內(nèi)置庫實現(xiàn)數(shù)據(jù)的加密與校驗

    Python利用內(nèi)置庫實現(xiàn)數(shù)據(jù)的加密與校驗

    這篇文章主要為大家詳細介紹了如何使用Python內(nèi)置庫實現(xiàn)數(shù)據(jù)的加密和校驗,為開發(fā)者提供全方位的數(shù)據(jù)安全解決方案,感興趣的小伙伴可以跟隨小編一起學習一下
    2023-12-12
  • Python logging日志模塊 配置文件方式

    Python logging日志模塊 配置文件方式

    這篇文章主要介紹了Python logging日志模塊 配置文件方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-07-07
  • python使用自定義user-agent抓取網(wǎng)頁的方法

    python使用自定義user-agent抓取網(wǎng)頁的方法

    這篇文章主要介紹了python使用自定義user-agent抓取網(wǎng)頁的方法,涉及Python使用urllib2模塊操作網(wǎng)頁的技巧,需要的朋友可以參考下
    2015-04-04
  • python實現(xiàn)年會抽獎程序

    python實現(xiàn)年會抽獎程序

    這篇文章主要為大家詳細介紹了python實現(xiàn)年會抽獎程序,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2019-01-01
  • 最新評論