在python中使用正則表達(dá)式查找可嵌套字符串組
在網(wǎng)上看到一個(gè)小需求,需要用正則表達(dá)式來(lái)處理。原需求如下:
找出文本中包含”因?yàn)椤浴钡木渥樱⒁詢蓚€(gè)詞為中心對(duì)齊輸出前后3個(gè)字,中間全輸出,如果“因?yàn)椤焙汀八浴敝虚g還存在“因?yàn)椤薄八浴?,也要找出?lái),另算一行,輸出格式為:
行號(hào) 前面3個(gè)字 *因?yàn)? 全部 &所以& 后面3個(gè)字(標(biāo)點(diǎn)符號(hào)算一個(gè)字)
2 還不是 *因?yàn)? 這里好, &所以& 沒(méi)有人
實(shí)現(xiàn)方法如下:
#encoding:utf-8 import os import re def getPairStriList(filename): pairStrList = [] textFile = open(filename, 'r') pattern = re.compile(u'.{3}\u56e0\u4e3a.*\u6240\u4ee5.{3}') #u'\u56e0\u4e3a和u'\u6240\u4ee5'分別為“因?yàn)椤焙汀八浴钡膗tf8碼 for line in textFile: utfLine = line.decode('utf8') result = pattern.search(utfLine) while result: resultStr = result.group() pairStrList.append(resultStr) result = pattern.search(resultStr,2,len(resultStr)-2) #對(duì)每個(gè)字符串進(jìn)行格式轉(zhuǎn)換和拼接 for i in range(len(pairStrList)): pairStrList[i] = pairStrList[i][:3] + pairStrList[i][3:5].replace(u'\u56e0\u4e3a',u' *\u56e0\u4e3a* ',1) + pairStrList[i][5:] pairStrList[i] = pairStrList[i][:len(pairStrList[i])-5] + pairStrList[i][len(pairStrList[i])-5:].replace(u'\u6240\u4ee5',u' &\u6240\u4ee5& ',1) pairStrList[i] = str(i+1) + ' ' + pairStrList[i] return pairStrList if __name__ == '__main__': pairStrList = getPairStriList('test.txt') for str in pairStrList: print str
PS:下面看下python里使用正則表達(dá)式的組嵌套
由于組本身是一個(gè)完整的正則表達(dá)式,所以可以將組嵌套在其他組中,以構(gòu)建更復(fù)雜的表達(dá)式。下面的例子,就是進(jìn)行組嵌套的例子:
#python 3.6 #蔡軍生 #http://blog.csdn.net/caimouse/article/details/51749579 # import re def test_patterns(text, patterns): """Given source text and a list of patterns, look for matches for each pattern within the text and print them to stdout. """ # Look for each pattern in the text and print the results for pattern, desc in patterns: print('{!r} ({})\n'.format(pattern, desc)) print(' {!r}'.format(text)) for match in re.finditer(pattern, text): s = match.start() e = match.end() prefix = ' ' * (s) print( ' {}{!r}{} '.format(prefix, text[s:e], ' ' * (len(text) - e)), end=' ', ) print(match.groups()) if match.groupdict(): print('{}{}'.format( ' ' * (len(text) - s), match.groupdict()), ) print() return
例子:
#python 3.6 #蔡軍生 #http://blog.csdn.net/caimouse/article/details/51749579 # from re_test_patterns_groups import test_patterns test_patterns( 'abbaabbba', [(r'a((a*)(b*))', 'a followed by 0-n a and 0-n b')], )
結(jié)果輸出如下:
'a((a*)(b*))' (a followed by 0-n a and 0-n b) 'abbaabbba' 'abb' ('bb', '', 'bb') 'aabbb' ('abbb', 'a', 'bbb') 'a' ('', '', '')
總結(jié)
以上所述是小編給大家介紹的在python中使用正則表達(dá)式查找可嵌套字符串組,希望對(duì)大家有所幫助,如果大家有任何疑問(wèn)請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!
相關(guān)文章
pycharm在調(diào)試python時(shí)執(zhí)行其他語(yǔ)句的方法
今天小編就為大家分享一篇pycharm在調(diào)試python時(shí)執(zhí)行其他語(yǔ)句的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-11-11使用?Flask、Celery?和?Python?實(shí)現(xiàn)每月定時(shí)任務(wù)的步驟
下面給大家分享使用?Flask、Celery?和?Python?實(shí)現(xiàn)每月定時(shí)任務(wù)的步驟,本文分步驟結(jié)合腳本給大家介紹的非常詳細(xì),感興趣的朋友跟隨小編一起看看吧2024-08-08Python裝飾器如何實(shí)現(xiàn)修復(fù)過(guò)程解析
這篇文章主要介紹了Python裝飾器如何實(shí)現(xiàn)修復(fù)過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-09-09python用tkinter實(shí)現(xiàn)一個(gè)簡(jiǎn)易能進(jìn)行隨機(jī)點(diǎn)名的界面
這篇文章主要介紹了python用tkinter實(shí)現(xiàn)一個(gè)簡(jiǎn)易能進(jìn)行隨機(jī)點(diǎn)名的界面,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-09-09python內(nèi)存占用過(guò)多問(wèn)題以及其解決方案
Python是一種高級(jí)編程語(yǔ)言,被廣泛應(yīng)用于各種領(lǐng)域,包括網(wǎng)站開(kāi)發(fā)、數(shù)據(jù)分析、人工智能等,這篇文章主要給大家介紹了關(guān)于python內(nèi)存占用過(guò)多問(wèn)題以及其解決方案的相關(guān)資料,需要的朋友可以參考下2024-08-08詳解pandas中MultiIndex和對(duì)象實(shí)際索引不一致問(wèn)題
這篇文章主要介紹了詳解pandas中MultiIndex和對(duì)象實(shí)際索引不一致問(wèn)題,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07Pygame游戲開(kāi)發(fā)之太空射擊實(shí)戰(zhàn)入門(mén)篇
相信大多數(shù)8090后都玩過(guò)太空射擊游戲,在過(guò)去游戲不多的年代太空射擊自然屬于經(jīng)典好玩的一款了,今天我們來(lái)自己動(dòng)手實(shí)現(xiàn)它,在編寫(xiě)學(xué)習(xí)中回顧過(guò)往展望未來(lái),下面開(kāi)始入門(mén)篇2022-08-08Pycharm新建模板默認(rèn)添加個(gè)人信息的實(shí)例
今天小編就為大家分享一篇Pycharm新建模板默認(rèn)添加個(gè)人信息的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-07-07Django表單提交后實(shí)現(xiàn)獲取相同name的不同value值
這篇文章主要介紹了Django表單提交后實(shí)現(xiàn)獲取相同name的不同value值,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-05-05