欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

在python中使用正則表達式查找可嵌套字符串組

 更新時間:2017年10月24日 08:35:50   投稿:mrr  
這篇文章主要介紹了在python中使用正則表達式查找可嵌套字符串組的相關(guān)資料,需要的朋友可以參考下

在網(wǎng)上看到一個小需求,需要用正則表達式來處理。原需求如下:

找出文本中包含”因為……所以”的句子,并以兩個詞為中心對齊輸出前后3個字,中間全輸出,如果“因為”和“所以”中間還存在“因為”“所以”,也要找出來,另算一行,輸出格式為:

行號 前面3個字 *因為* 全部 &所以& 后面3個字(標(biāo)點符號算一個字)

2 還不是 *因為* 這里好, &所以& 沒有人

實現(xiàn)方法如下:

#encoding:utf-8
import os
import re
def getPairStriList(filename):
  pairStrList = []
  textFile = open(filename, 'r')
  pattern = re.compile(u'.{3}\u56e0\u4e3a.*\u6240\u4ee5.{3}') #u'\u56e0\u4e3a和u'\u6240\u4ee5'分別為“因為”和“所以”的utf8碼
  for line in textFile:
    utfLine = line.decode('utf8')
    result = pattern.search(utfLine)
    while result:
      resultStr = result.group()
      pairStrList.append(resultStr)
      result = pattern.search(resultStr,2,len(resultStr)-2)
  #對每個字符串進行格式轉(zhuǎn)換和拼接  
  for i in range(len(pairStrList)):
    pairStrList[i] = pairStrList[i][:3] + pairStrList[i][3:5].replace(u'\u56e0\u4e3a',u' *\u56e0\u4e3a* ',1) + pairStrList[i][5:]
    pairStrList[i] = pairStrList[i][:len(pairStrList[i])-5] + pairStrList[i][len(pairStrList[i])-5:].replace(u'\u6240\u4ee5',u' &\u6240\u4ee5& ',1)
    pairStrList[i] = str(i+1) + ' ' + pairStrList[i]
  return pairStrList
  if __name__ == '__main__':
  pairStrList = getPairStriList('test.txt')
  for str in pairStrList:
    print str

PS:下面看下python里使用正則表達式的組嵌套

由于組本身是一個完整的正則表達式,所以可以將組嵌套在其他組中,以構(gòu)建更復(fù)雜的表達式。下面的例子,就是進行組嵌套的例子:

#python 3.6 
#蔡軍生  
#http://blog.csdn.net/caimouse/article/details/51749579 
# 
import re 
def test_patterns(text, patterns): 
  """Given source text and a list of patterns, look for 
  matches for each pattern within the text and print 
  them to stdout. 
  """ 
  # Look for each pattern in the text and print the results 
  for pattern, desc in patterns: 
    print('{!r} ({})\n'.format(pattern, desc)) 
    print(' {!r}'.format(text)) 
    for match in re.finditer(pattern, text): 
      s = match.start() 
      e = match.end() 
      prefix = ' ' * (s) 
      print( 
        ' {}{!r}{} '.format(prefix, 
                   text[s:e], 
                   ' ' * (len(text) - e)), 
        end=' ', 
      ) 
      print(match.groups()) 
      if match.groupdict(): 
        print('{}{}'.format( 
          ' ' * (len(text) - s), 
          match.groupdict()), 
        ) 
    print() 
  return 

例子:

#python 3.6 
#蔡軍生  
#http://blog.csdn.net/caimouse/article/details/51749579 
# 
from re_test_patterns_groups import test_patterns 
test_patterns( 
  'abbaabbba', 
  [(r'a((a*)(b*))', 'a followed by 0-n a and 0-n b')], 
) 

結(jié)果輸出如下:

'a((a*)(b*))' (a followed by 0-n a and 0-n b)
 'abbaabbba'
 'abb'    ('bb', '', 'bb')
   'aabbb'  ('abbb', 'a', 'bbb')
     'a' ('', '', '')

總結(jié)

以上所述是小編給大家介紹的在python中使用正則表達式查找可嵌套字符串組,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復(fù)大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!

相關(guān)文章

  • pycharm在調(diào)試python時執(zhí)行其他語句的方法

    pycharm在調(diào)試python時執(zhí)行其他語句的方法

    今天小編就為大家分享一篇pycharm在調(diào)試python時執(zhí)行其他語句的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-11-11
  • 使用?Flask、Celery?和?Python?實現(xiàn)每月定時任務(wù)的步驟

    使用?Flask、Celery?和?Python?實現(xiàn)每月定時任務(wù)的步驟

    下面給大家分享使用?Flask、Celery?和?Python?實現(xiàn)每月定時任務(wù)的步驟,本文分步驟結(jié)合腳本給大家介紹的非常詳細,感興趣的朋友跟隨小編一起看看吧
    2024-08-08
  • python爬取一組小姐姐圖片實例

    python爬取一組小姐姐圖片實例

    大家好,本篇文章主要講的是python爬取一組小姐姐圖片實例,感興趣的同學(xué)趕快來看一看吧,對你有幫助的話記得收藏一下
    2022-01-01
  • Python裝飾器如何實現(xiàn)修復(fù)過程解析

    Python裝飾器如何實現(xiàn)修復(fù)過程解析

    這篇文章主要介紹了Python裝飾器如何實現(xiàn)修復(fù)過程解析,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2020-09-09
  • python用tkinter實現(xiàn)一個簡易能進行隨機點名的界面

    python用tkinter實現(xiàn)一個簡易能進行隨機點名的界面

    這篇文章主要介紹了python用tkinter實現(xiàn)一個簡易能進行隨機點名的界面,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-09-09
  • python內(nèi)存占用過多問題以及其解決方案

    python內(nèi)存占用過多問題以及其解決方案

    Python是一種高級編程語言,被廣泛應(yīng)用于各種領(lǐng)域,包括網(wǎng)站開發(fā)、數(shù)據(jù)分析、人工智能等,這篇文章主要給大家介紹了關(guān)于python內(nèi)存占用過多問題以及其解決方案的相關(guān)資料,需要的朋友可以參考下
    2024-08-08
  • 詳解pandas中MultiIndex和對象實際索引不一致問題

    詳解pandas中MultiIndex和對象實際索引不一致問題

    這篇文章主要介紹了詳解pandas中MultiIndex和對象實際索引不一致問題,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-07-07
  • Pygame游戲開發(fā)之太空射擊實戰(zhàn)入門篇

    Pygame游戲開發(fā)之太空射擊實戰(zhàn)入門篇

    相信大多數(shù)8090后都玩過太空射擊游戲,在過去游戲不多的年代太空射擊自然屬于經(jīng)典好玩的一款了,今天我們來自己動手實現(xiàn)它,在編寫學(xué)習(xí)中回顧過往展望未來,下面開始入門篇
    2022-08-08
  • Pycharm新建模板默認添加個人信息的實例

    Pycharm新建模板默認添加個人信息的實例

    今天小編就為大家分享一篇Pycharm新建模板默認添加個人信息的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-07-07
  • Django表單提交后實現(xiàn)獲取相同name的不同value值

    Django表單提交后實現(xiàn)獲取相同name的不同value值

    這篇文章主要介紹了Django表單提交后實現(xiàn)獲取相同name的不同value值,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-05-05

最新評論