python去除拼音聲調(diào)字母,替換為字母的方法
第一種方法
import sys import unicodedata s = "Lǐ Zhōu Wú" remap = { # ord返回ascii值 ord('\t'): '', ord('\f'): '', ord('\r'): None } # 去除\t, \f, \r a = s.translate(remap) ''' 通過使用dict.fromkeys() 方法構(gòu)造一個字典,每個Unicode 和音符作為鍵,對于的值全部為None 然后使用unicodedata.normalize() 將原始輸入標準化為分解形式字符 sys.maxunicode : 給出最大Unicode代碼點的值的整數(shù),即1114111(十六進制的0x10FFFF)。 unicodedata.combining:將分配給字符chr的規(guī)范組合類作為整數(shù)返回。 如果未定義組合類,則返回0。 ''' cmb_chrs = dict.fromkeys(c for c in range(sys.maxunicode) if unicodedata.combining(chr(c))) #此部分建議拆分開來理解 b = unicodedata.normalize('NFD', a) ''' 調(diào)用translate 函數(shù)刪除所有重音符 ''' print(b.translate(cmb_chrs))
第二種方法 (推薦)
import unicodedata mystr='Lǐ Zhōu Wú' unicodedata.normalize('NFKD', mystr).encode('ascii','ignore')
以上這篇python去除拼音聲調(diào)字母,替換為字母的方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python實現(xiàn)PDF文字識別提取并寫入CSV文件
這篇文章主要是和大家分享一個Python實現(xiàn)PDF文字識別與提取并寫入?CSV文件的腳本。文中的示例代碼講解詳細,感興趣的小伙伴可以了解一下2022-03-03Python實現(xiàn)二分法查找及優(yōu)化的示例詳解
二分查找法(Binary?Search)是一種在有序數(shù)組中查找某一特定元素的算法,在本文中,我們將使用?Python?實現(xiàn)二分查找算法,并深入探討算法的原理和實現(xiàn)細節(jié),感興趣的可以了解一下2023-04-04解決jupyter notebook顯示不全出現(xiàn)框框或者亂碼問題
這篇文章主要介紹了解決jupyter notebook顯示不全出現(xiàn)框框或者亂碼問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-04-04Python數(shù)據(jù)庫sqlite3圖文實例詳解
SQLite是一個進程內(nèi)的庫,實現(xiàn)了自給自足的、無服務(wù)器的、零配置的、事務(wù)性的SQL數(shù)據(jù)庫引擎,下面這篇文章主要給大家介紹了關(guān)于Python數(shù)據(jù)庫sqlite3的相關(guān)資料,需要的朋友可以參考下2022-09-09Python之tkinter列表框Listbox與滾動條Scrollbar解讀
這篇文章主要介紹了Python之tkinter列表框Listbox與滾動條Scrollbar解讀,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2023-05-05詳解Python3 中hasattr()、getattr()、setattr()、delattr()函數(shù)及示例代碼數(shù)
本文通過示例代碼給大家詳細介紹了Python3 中hasattr()、getattr()、setattr()、delattr()函數(shù),非常不錯,具有參考借鑒價值,需要的朋友參考下吧2018-04-04Pycharm正版2022.2.2?官方翻譯插件更新tkk失敗不能用問題及解決方案
這篇文章主要介紹了Pycharm正版2022.2.2?|?官方翻譯插件更新tkk失敗解決,?出現(xiàn)tkk問題的是這個翻譯插件,本教程只解決該翻譯插件不能用的問題,需要的朋友可以參考下2022-11-11用Python的繪圖庫(matplotlib)繪制小波能量譜
這篇文章主要介紹了用Python的繪圖庫(matplotlib)繪制小波能量譜,代碼簡單詳細,思路清晰,需要的朋友可以參考下2021-04-04