欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python輕松過濾處理臟話與特殊敏感詞匯

 更新時間:2022年07月26日 10:11:57   作者:Python 集中營  
我們開發(fā)的系統(tǒng)往往都離不開信息的處理,這些信息有的內(nèi)容非常敏感,就需要過濾掉不容許出現(xiàn),

python的其中一個強大之處就是它可以方便的集成很多的非標(biāo)準(zhǔn)庫,今天在GitHub上溜達(dá)又發(fā)現(xiàn)了一個臟話處理神器,導(dǎo)入better_profanity庫后,只需要幾行代碼就能搞定了,相當(dāng)nice!

使用pip的方式將better_profanity非標(biāo)準(zhǔn)庫安裝好,這個庫好像在清華大學(xué)的鏡像站中沒有,其他鏡像站不知道有沒有,于是下載時沒有使用鏡像站,默認(rèn)到官方去下載即可。

pip install better_profanity
# 將處理模塊直接導(dǎo)入到代碼塊中
from better_profanity import profanity

1、默認(rèn)臟話庫/敏感詞庫處理

默認(rèn)情況下就只能處理英文的臟話。

censored_text = profanity.censor("you are bitch")
print(censored_text)
# you are ****

可以看到其中bitch字符被認(rèn)為是臟話已經(jīng)處理成****字符了。

當(dāng)然,還可以將處理后的臟話字符換成別的字符代替,比如下面這樣處理。

censored_text = profanity.censor("you are bitch",'-')
print(censored_text)
# you are ----

這樣****就被替換成了----。

2、自定義過濾信息處理

bad_words = ['Python', 'Java', 'Scala']  # 自定義過濾詞匯
profanity.load_censor_words(bad_words)  # 加載自定義過濾詞匯
censored_text = profanity.censor("Python is very Good !")  # 執(zhí)行過濾
print(censored_text)
# **** is very Good !

可以發(fā)現(xiàn),想要過濾的python字符已經(jīng)成功過濾掉了。

3、contains_profanity函數(shù)

contains_profanity函數(shù)用來查看我們的語句中是否包含需要過濾的詞匯,如果包含則會返回True,否則返回False。

bad_words = ['bitch', 'Java', 'Scala']  # 自定義過濾詞匯
profanity.load_censor_words(bad_words)  # 加載自定義過濾詞匯
censored_text = profanity.contains_profanity("you are bitch")
print(censored_text)
# True

結(jié)果為True,表示包含需要過濾的詞匯信息。

4、load_censor_words_from_file函數(shù)

load_censor_words_from_file函數(shù)用于加載需要過濾詞匯的文件。

profanity.load_censor_words_from_file('/usr/load/bad_words.txt')

加載完詞匯文件之后,按照之前的邏輯處理即可。

詞匯文件的定義格式,按照每個詞匯獨占一行的形式進(jìn)行定義,文件格式使用.txt文本文檔即可。

# bitch
# bitches
# bitchin
# bitching
# blowjob
# blowjobs
# blue waffle

到此這篇關(guān)于python輕松過濾處理臟話與特殊敏感詞匯的文章就介紹到這了,更多相關(guān)python臟話處理內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python標(biāo)準(zhǔn)庫pickle的簡單使用

    Python標(biāo)準(zhǔn)庫pickle的簡單使用

    本文主要介紹了Python標(biāo)準(zhǔn)庫pickle的簡單使用,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2023-05-05
  • 詳解K-means算法在Python中的實現(xiàn)

    詳解K-means算法在Python中的實現(xiàn)

    這篇文章主要介紹了詳解K-means算法在Python中的實現(xiàn),具有一定借鑒價值,需要的朋友可以了解下。
    2017-12-12
  • 在python 中實現(xiàn)運行多條shell命令

    在python 中實現(xiàn)運行多條shell命令

    今天小編就為大家分享一篇在python 中實現(xiàn)運行多條shell命令,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-01-01
  • pygame實現(xiàn)貪吃蛇小游戲

    pygame實現(xiàn)貪吃蛇小游戲

    這篇文章主要為大家詳細(xì)介紹了pygame實現(xiàn)貪吃蛇小游戲,文中示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2022-01-01
  • Pygame游戲開發(fā)之太空射擊實戰(zhàn)敵人精靈篇

    Pygame游戲開發(fā)之太空射擊實戰(zhàn)敵人精靈篇

    相信大多數(shù)8090后都玩過太空射擊游戲,在過去游戲不多的年代太空射擊自然屬于經(jīng)典好玩的一款了,今天我們來自己動手實現(xiàn)它,在編寫學(xué)習(xí)中回顧過往展望未來,下面開始講解敵人精靈的使用
    2022-08-08
  • python區(qū)塊鏈簡易版交易完善挖礦獎勵示例

    python區(qū)塊鏈簡易版交易完善挖礦獎勵示例

    這篇文章主要介紹了python區(qū)塊鏈簡易版交易完善挖礦獎勵示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2022-05-05
  • python在windows下創(chuàng)建隱藏窗口子進(jìn)程的方法

    python在windows下創(chuàng)建隱藏窗口子進(jìn)程的方法

    這篇文章主要介紹了python在windows下創(chuàng)建隱藏窗口子進(jìn)程的方法,涉及Python使用subprocess模塊操作進(jìn)程的相關(guān)技巧,需要的朋友可以參考下
    2015-06-06
  • 用python編寫一個圖片拼接工具

    用python編寫一個圖片拼接工具

    大家好,本篇文章主要講的是用python編寫一個圖片拼接工具,感興趣的同學(xué)趕快來看一看吧,對你有幫助的話記得收藏一下
    2022-01-01
  • PHP基于phpqrcode類庫生成二維碼過程解析

    PHP基于phpqrcode類庫生成二維碼過程解析

    這篇文章主要介紹了PHP基于phpqrcode類庫生成二維碼過程解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2020-05-05
  • Python機器學(xué)習(xí)入門(三)之Python數(shù)據(jù)準(zhǔn)備

    Python機器學(xué)習(xí)入門(三)之Python數(shù)據(jù)準(zhǔn)備

    這篇文章主要介紹了Python機器學(xué)習(xí)入門知識,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2021-08-08

最新評論