一行Python代碼過(guò)濾標(biāo)點(diǎn)符號(hào)等特殊字符
很多時(shí)候我們需要過(guò)濾掉標(biāo)點(diǎn)符號(hào)等特殊字符,網(wǎng)上雖然有一堆的方法,但是都沒(méi)有找到一個(gè)非常滿意的,有些過(guò)濾不了中文的標(biāo)點(diǎn)符號(hào),有些過(guò)濾不了英文的標(biāo)點(diǎn)符號(hào),有些過(guò)濾不全。
最后通過(guò)查看正則表達(dá)式文檔,發(fā)現(xiàn)一個(gè)高效的辦法,一行代碼就能搞定:
def replace_all_blank(value): """ 去除value中的所有非字母內(nèi)容,包括標(biāo)點(diǎn)符號(hào)、空格、換行、下劃線等 :param value: 需要處理的內(nèi)容 :return: 返回處理后的內(nèi)容 """ # \W 表示匹配非數(shù)字字母下劃線 result = re.sub('\W+', '', value).replace("_", '') print(result) return result
其中用到了 Python 的 re 模塊, re 模塊里面包含了所有的正則表達(dá)式的應(yīng)用。代碼里面有幾個(gè)點(diǎn):
\W
測(cè)試一下:
replace_all_blank("Powe, on;the 2333, 。哈哈 !!看看可以嗎?一行代碼就可以了!^_^")
輸出結(jié)果:
Poweonthe2333哈哈看看可以嗎一行代碼就可以了
一行代碼搞定!Perfect!
最后推薦大家官網(wǎng) re 模塊的正則表達(dá)式文檔地址:
https://docs.python.org/zh-cn/3.6/library/re.html
知識(shí)點(diǎn)擴(kuò)展:
python過(guò)濾中英文標(biāo)點(diǎn)符號(hào)
import re # 過(guò)濾不了\\ \ 中文()還有———— r1 = u'[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~]+'#用戶也可以在此進(jìn)行自定義過(guò)濾字符 # 者中規(guī)則也過(guò)濾不完全 r2 = "[\s+\.\!\/_,$%^*(+\"\']+|[+——!,。?、~@#¥%……&*()]+" # \\\可以過(guò)濾掉反向單杠和雙杠,/可以過(guò)濾掉正向單杠和雙杠,第一個(gè)中括號(hào)里放的是英文符號(hào),第二個(gè)中括號(hào)里放的是中文符號(hào),第二個(gè)中括號(hào)前不能少|(zhì),否則過(guò)濾不完全 r3 = "[.!//_,$&%^*()<>+\"'?@#-|:~{}]+|[——!\\\\,。=?、:“”‘'《》【】¥……()]+" # 去掉括號(hào)和括號(hào)內(nèi)的所有內(nèi)容 r4 = "\\【.*?】+|\\《.*?》+|\\#.*?#+|[.!/_,$&%^*()<>+""'?@|:~{}#]+|[——!\\\,。=?、:“”‘'¥……()《》【】]" text = "\崔蕓,\\我愛(ài)=+你!【我//""們】~————結(jié)/婚'吧::!這.!!_#??()個(gè)‘'“”¥$主|意()不錯(cuò)......!" print(re.sub(r1, , '', text))
總結(jié)
以上所述是小編給大家介紹的一行代碼Python過(guò)濾標(biāo)點(diǎn)符號(hào)等特殊字符,希望對(duì)大家有所幫助,如果大家有任何疑問(wèn)請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!
如果你覺(jué)得本文對(duì)你有幫助,歡迎轉(zhuǎn)載,煩請(qǐng)注明出處,謝謝!
相關(guān)文章
pytorch加載自己的圖片數(shù)據(jù)集的2種方法詳解
數(shù)據(jù)預(yù)處理在解決深度學(xué)習(xí)問(wèn)題的過(guò)程中,往往需要花費(fèi)大量的時(shí)間和精力,下面這篇文章主要給大家介紹了關(guān)于pytorch加載自己的圖片數(shù)據(jù)集的2種方法,文中通過(guò)示例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-06-06Python高階函數(shù)與裝飾器函數(shù)的深入講解
這篇文章主要給大家介紹了關(guān)于Python高階函數(shù)與裝飾器函數(shù)的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-11-11pycharm 實(shí)現(xiàn)顯示project 選項(xiàng)卡的方法
今天小編就為大家分享一篇pycharm 實(shí)現(xiàn)顯示project 選項(xiàng)卡的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-01-01如何在PyCharm中配置使用Anaconda環(huán)境
這篇文章主要介紹了如何在PyCharm中配置使用Anaconda環(huán)境,圖文講解寫(xiě)的非常詳細(xì)簡(jiǎn)單易懂,還不會(huì)的小伙伴快來(lái)看看吧2023-03-03如何實(shí)現(xiàn)Python調(diào)用Golang代碼詳解
這篇文章主要介紹了如何實(shí)現(xiàn)Python調(diào)用Golang代碼,Python和Golang都是當(dāng)下非常流行的編程語(yǔ)言,在實(shí)際開(kāi)發(fā)中,我們可能會(huì)遇到需要將Python和Golang進(jìn)行組合使用的場(chǎng)景,感興趣想要詳細(xì)了解可以參考下文2023-05-05python實(shí)現(xiàn)單鏈表中刪除倒數(shù)第K個(gè)節(jié)點(diǎn)的方法
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)單鏈表中刪除倒數(shù)第K個(gè)節(jié)點(diǎn)的方法,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-09-09