利用正則表達(dá)式將字符串分組示例代碼
前言
最近工作中遇到一個問題,需求是碰到'122333<<<<'這種字符串,要將其連貫的部分取出,得出['1', '22', '333', '<<<<']這樣的列表,能想到的常規(guī)辦法,遍歷字符串,后一個與前一個逐個比較,這樣真的很麻煩!又想到了另外兩種方法,話不多說了,來一起看看詳細(xì)的示例代碼:
一、實際上可以借助itertools模塊的groupby()方法來處理:
import itertools Str = '122333<<<<' Lst = [] for key,group in itertools.groupby(s): Lst.append(list(group)) print map(lambda x: ''.join(x), Lst)
上面的處理,還是比較有技巧,也能得到想要的輸出結(jié)果
['1', '22', '333', '<<<<']
二、但更酷點,更技巧處理方式是用正則表達(dá)式來處理:
import re Str = '122333<<<<' Lst = [] Pat = re.compile(r'((.)\2*)') Rst = [x[0] for x in re.findall(Pat, Str)] print Rst
備注:
1. (.) # .匹配任意字符;(.)做分組,方便后面反向引用
2. \2* # \2對里面括號的反向引用;*代表是0個到多個;
3. ((.)\2*) # 連起來就是任意一個或多個字符組成的分組;
4. (.)\1* # 這種方式則可以取出唯一的值['1', '2', '3', '<'];同樣非常方便
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作能帶來一定的幫助,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。
相關(guān)文章
用JavaScript實現(xiàn)全局替換,解決$等特殊符號的難題[
用JavaScript實現(xiàn)全局替換,解決$等特殊符號的難題[...2006-12-12jQuery如何用正則表達(dá)式驗證手機(jī)號、身份證號、中文名稱
這篇文章主要介紹了jQuery如何用正則表達(dá)式驗證手機(jī)號、身份證號、中文名稱 的相關(guān)資料,需要的朋友可以參考下2016-06-06JavaScript 正則表達(dá)式使用詳細(xì)參數(shù)
正則表達(dá)式(regular expression)對象包含一個正則表達(dá)式模式(pattern)。它具有用正則表達(dá)式模式去匹 配或代替一個串(string)中特定字符(或字符集合)的屬性(properties)和方法(methods)。2008-03-03