一行Python代碼過濾標(biāo)點(diǎn)符號等特殊字符
很多時候我們需要過濾掉標(biāo)點(diǎn)符號等特殊字符,網(wǎng)上雖然有一堆的方法,但是都沒有找到一個非常滿意的,有些過濾不了中文的標(biāo)點(diǎn)符號,有些過濾不了英文的標(biāo)點(diǎn)符號,有些過濾不全。
最后通過查看正則表達(dá)式文檔,發(fā)現(xiàn)一個高效的辦法,一行代碼就能搞定:
def replace_all_blank(value): """ 去除value中的所有非字母內(nèi)容,包括標(biāo)點(diǎn)符號、空格、換行、下劃線等 :param value: 需要處理的內(nèi)容 :return: 返回處理后的內(nèi)容 """ # \W 表示匹配非數(shù)字字母下劃線 result = re.sub('\W+', '', value).replace("_", '') print(result) return result
其中用到了 Python 的 re 模塊, re 模塊里面包含了所有的正則表達(dá)式的應(yīng)用。代碼里面有幾個點(diǎn):
\W
測試一下:
replace_all_blank("Powe, on;the 2333, 。哈哈 ?。】纯纯梢詥??一行代碼就可以了!^_^")
輸出結(jié)果:
Poweonthe2333哈哈看看可以嗎一行代碼就可以了
一行代碼搞定!Perfect!
最后推薦大家官網(wǎng) re 模塊的正則表達(dá)式文檔地址:
https://docs.python.org/zh-cn/3.6/library/re.html
知識點(diǎn)擴(kuò)展:
python過濾中英文標(biāo)點(diǎn)符號
import re # 過濾不了\\ \ 中文()還有———— r1 = u'[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~]+'#用戶也可以在此進(jìn)行自定義過濾字符 # 者中規(guī)則也過濾不完全 r2 = "[\s+\.\!\/_,$%^*(+\"\']+|[+——!,。?、~@#¥%……&*()]+" # \\\可以過濾掉反向單杠和雙杠,/可以過濾掉正向單杠和雙杠,第一個中括號里放的是英文符號,第二個中括號里放的是中文符號,第二個中括號前不能少|(zhì),否則過濾不完全 r3 = "[.!//_,$&%^*()<>+\"'?@#-|:~{}]+|[——!\\\\,。=?、:“”‘'《》【】¥……()]+" # 去掉括號和括號內(nèi)的所有內(nèi)容 r4 = "\\【.*?】+|\\《.*?》+|\\#.*?#+|[.!/_,$&%^*()<>+""'?@|:~{}#]+|[——!\\\,。=?、:“”‘'¥……()《》【】]" text = "\崔蕓,\\我愛=+你!【我//""們】~————結(jié)/婚'吧::!這.!!_#??()個‘'“”¥$主|意()不錯......!" print(re.sub(r1, , '', text))
總結(jié)
以上所述是小編給大家介紹的一行代碼Python過濾標(biāo)點(diǎn)符號等特殊字符,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復(fù)大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
如果你覺得本文對你有幫助,歡迎轉(zhuǎn)載,煩請注明出處,謝謝!
相關(guān)文章
pytorch加載自己的圖片數(shù)據(jù)集的2種方法詳解
數(shù)據(jù)預(yù)處理在解決深度學(xué)習(xí)問題的過程中,往往需要花費(fèi)大量的時間和精力,下面這篇文章主要給大家介紹了關(guān)于pytorch加載自己的圖片數(shù)據(jù)集的2種方法,文中通過示例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-06-06Python高階函數(shù)與裝飾器函數(shù)的深入講解
這篇文章主要給大家介紹了關(guān)于Python高階函數(shù)與裝飾器函數(shù)的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-11-11pycharm 實現(xiàn)顯示project 選項卡的方法
今天小編就為大家分享一篇pycharm 實現(xiàn)顯示project 選項卡的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-01-01如何在PyCharm中配置使用Anaconda環(huán)境
這篇文章主要介紹了如何在PyCharm中配置使用Anaconda環(huán)境,圖文講解寫的非常詳細(xì)簡單易懂,還不會的小伙伴快來看看吧2023-03-03如何實現(xiàn)Python調(diào)用Golang代碼詳解
這篇文章主要介紹了如何實現(xiàn)Python調(diào)用Golang代碼,Python和Golang都是當(dāng)下非常流行的編程語言,在實際開發(fā)中,我們可能會遇到需要將Python和Golang進(jìn)行組合使用的場景,感興趣想要詳細(xì)了解可以參考下文2023-05-05python實現(xiàn)單鏈表中刪除倒數(shù)第K個節(jié)點(diǎn)的方法
這篇文章主要為大家詳細(xì)介紹了python實現(xiàn)單鏈表中刪除倒數(shù)第K個節(jié)點(diǎn)的方法,具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-09-09