使用Python去除字符串中某個字符的多種實現(xiàn)方式比較
1、如何去掉字符串中不需要的字符?
實際案例:
(1)過濾掉用戶輸入前后多余的空白字符:' nick2008@gmail.com '
(2)過濾某windows下編輯文本中的'\r':'hello world\r\n'
(3)去掉文本中的unicode組合符號(調(diào)音):u'ní hǎo, chī fàn'(或 èěéēàǎā)
解決方案;
方法1:字符串strip(),lstrip(),rstrip()方法去掉字符串兩端字符。
方法2:刪除單個固定位置的字符,可以使用切片+拼接的方式。
方法3:字符串的replace()替換方法或正則表達式re.sub()刪除任意位置字符。(通用)
方法4:字符串translate()方法,可以同時刪除多種不同字符。
2、代碼演示
# 方法1:strip類的方法 # 去掉字符串兩端的字符 s = ' abc 123 ' ''' str.strip方法介紹: strip([chars]) -> string or unicode chars不指定默認情況下去掉空白字符(空格,\n,\t,\r) ''' # 去掉兩端空白,但保留了中間的空白 print(s.strip()) # 只去掉左端的空白 print(s.lstrip()) # 只去掉右端的空白 print(s.rstrip()) s2 = '---abc+++' # 去掉s2中的加減 print(s2.strip('-+')) # 方法2:刪除固定位置字符,切片+拼接 s3 = 'abc:123' # 只刪除固定位置的冒號 s4 = s3[0:3] + s3[4:] print(s4) # 方法3: ''' 因為第1種方法不能刪除中間的某些字符,只能在兩端進行刪除, 第3種就能完成刪除中間某些字符的事情。 ''' s5 = '\tabc\t123\txyz' # 清除s5中的所有\(zhòng)t,可以使用字符串替換replace, # 但是這種方式只能替換一種 print(s5.replace('\t', '')) s6 = '\tabc\t123\txyz\ropq\r' import re # 去除s6中的\t和\r print(re.sub('[\t\r]', '', s6)) # 方法4: ''' str.translate方法介紹: S.translate(table) -> string table如果是None不做任何映射,如果存在就是一個字符映射到另一個字符上去的表; ''' s7 = 'abc1230323xyz' # 現(xiàn)在對s7字符串進行加密,加密規(guī)則是將其中a全部替換成x, # b替換成y,c替換成z,反過來將其中的xyz分別替換成abc # 構(gòu)建映射表 make = str.maketrans('abcxyz', 'xyzabc') print(make) # 對s7字符串進行加密轉(zhuǎn)換 print(s7.translate(make)) s8 = 'abc\refg\n2342\t' # 刪除s8中\(zhòng)r,\n,\t,構(gòu)建映射表str_trans str_trans = str.maketrans('', '', '\t\r\n') print(s8.translate(str_trans)) # 去掉音標(biāo)符號 u = u'nǐ hǎo, chī fàn' import unicodedata, sys # 將原始輸入標(biāo)準(zhǔn)化為分解形式字符 a = unicodedata.normalize('NFD', u) ''' 使用dict.fromkeys() 方法構(gòu)造一個字典,每個Unicode和音調(diào)作為鍵,對應(yīng)的值全部為None sys.maxunicode : 給出最大Unicode代碼點的值的整數(shù),即1114111(十六進制的0x10FFFF)。 unicodedata.combining:將分配給字符chr的規(guī)范組合類作為整數(shù)返回。如果未定義組合類,則返回0 這樣我們就成功將所有組合類的值全部設(shè)置為None ''' cmb_chrs = dict.fromkeys(c for c in range(sys.maxunicode) if unicodedata.combining(chr(c))) # 調(diào)用translate函數(shù)刪除所有音調(diào) print(a.translate(cmb_chrs))
總結(jié)
到此這篇關(guān)于使用Python去除字符串中某個字符的多種實現(xiàn)方式比較的文章就介紹到這了,更多相關(guān)Python去除字符串中字符內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python 去除txt文本中的空格、數(shù)字、特定字母等方法
今天小編就為大家分享一篇python 去除txt文本中的空格、數(shù)字、特定字母等方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-07-07對python中的 os.mkdir和os.mkdirs詳解
今天小編就為大家分享一篇對python中的 os.mkdir和os.mkdirs詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-10-10解決Pyinstaller 打包exe文件 取消dos窗口(黑框框)的問題
今天小編就為大家分享一篇解決Pyinstaller 打包exe文件 取消dos窗口(黑框框)的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-06-06