python如何實現(xiàn)全角半角的相互轉換
更新時間:2023年11月08日 09:34:20 作者:西奧斯
這篇文章主要介紹了python如何實現(xiàn)全角半角的相互轉換方式,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
轉換說明
全角半角轉換說明
有規(guī)律(不含空格):
- 全角字符unicode編碼從65281~65374 (十六進制 0xFF01 ~ 0xFF5E)
- 半角字符unicode編碼從33~126 (十六進制 0x21~ 0x7E)
特例
空格比較特殊,全角為 12288(0x3000),半角為 32(0x20)
# 正則直接把全角空格替換為半角空格 text2 = re.sub('\s+', ' ', str1)
除空格外,全角/半角按unicode編碼排序在順序上是對應的(半角 + 0x7e= 全角),所以可以直接通過用+-法來處理非空格數(shù)據(jù),對空格單獨處理。
注:
- 中文文字永遠是全角,只有英文字母、數(shù)字鍵、符號鍵才有全角半角的概念,
- 一個字母或數(shù)字占一個漢字的位置叫全角,占半個漢字的位置叫半角。
字符串整個替換
def strQ2B(ustring): """全角轉半角""" rstring = "" for uchar in ustring: inside_code = ord(uchar) print(inside_code) if inside_code == 12288: # 全角空格直接轉換 inside_code = 32 elif 65281 <= inside_code <= 65374: # 全角字符(除空格)根據(jù)關系轉化 inside_code -= 65248 rstring += unichr(inside_code) return rstring def strB2Q(ustring): """半角轉全角""" rstring = "" for uchar in ustring: inside_code = ord(uchar) if inside_code == 32: # 半角空格直接轉化 inside_code = 12288 elif 32 <= inside_code <= 126: # 半角字符(除空格)根據(jù)關系轉化 inside_code += 65248 rstring += unichr(inside_code) return rstring
總結
以上為個人經驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
Pytorch實現(xiàn)的手寫數(shù)字mnist識別功能完整示例
這篇文章主要介紹了Pytorch實現(xiàn)的手寫數(shù)字mnist識別功能,結合完整實例形式分析了Pytorch模塊手寫字識別具體步驟與相關實現(xiàn)技巧,需要的朋友可以參考下2019-12-12利用Python的tkinter模塊實現(xiàn)界面化的批量修改文件名
這篇文章主要介紹了利用Python的tkinter模塊實現(xiàn)界面化的批量修改文件名,用Python編寫過批量修改文件名的腳本程序,代碼很簡單,運行也比較快,詳細內容需要的小伙伴可以參考一下下面文章內容2022-08-08python中關于CIFAR10數(shù)據(jù)集的使用
這篇文章主要介紹了python中關于CIFAR10數(shù)據(jù)集的使用方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2023-02-02