python根據(jù)unicode判斷語言類型實例代碼
更新時間:2018年01月17日 11:23:52 作者:uestcyao
這篇文章主要介紹了python根據(jù)unicode判斷語言類型實例代碼,具有一定借鑒價值,需要的朋友可以參考下
本文實例主要實現(xiàn)的是python根據(jù)unicode判斷語言類型,具體如下。
實例代碼:
def is_chinese(uchar): """判斷一個unicode是否是漢字""" if uchar >= u'\u4e00' and uchar<=u'\u9fa5': return True else: return False def is_number(uchar): """判斷一個unicode是否是數(shù)字""" if uchar >= u'\u0030' and uchar<=u'\u0039': return True else: return False def is_alphabet(uchar): """判斷一個unicode是否是英文字母""" if (uchar >= u'\u0041' and uchar<=u'\u005a') or (uchar >= u'\u0061' and uchar<=u'\u007a'): return True else: return False def is_other(uchar): """判斷是否非漢字,數(shù)字和英文字符""" if not (is_chinese(uchar) or is_number(uchar) or is_alphabet(uchar)): return True else: return False def B2Q(uchar): """半角轉(zhuǎn)全角""" inside_code=ord(uchar) if inside_code<0x0020 or inside_code>0x7e: #不是半角字符就返回原來的字符 return uchar if inside_code==0x0020: #除了空格其他的全角半角的公式為:半角=全角-0xfee0 inside_code=0x3000 else: inside_code+=0xfee0 return unichr(inside_code) def Q2B(uchar): """全角轉(zhuǎn)半角""" inside_code=ord(uchar) if inside_code==0x3000: inside_code=0x0020 else: inside_code-=0xfee0 if inside_code<0x0020 or inside_code>0x7e: #轉(zhuǎn)完之后不是半角字符返回原來的字符 return uchar return unichr(inside_code) def stringQ2B(ustring): """把字符串全角轉(zhuǎn)半角""" return "".join([Q2B(uchar) for uchar in ustring]) def uniform(ustring): """格式化字符串,完成全角轉(zhuǎn)半角,大寫轉(zhuǎn)小寫的工作""" return stringQ2B(ustring).lower() def string2List(ustring): """將ustring按照中文,字母,數(shù)字分開""" retList=[] utmp=[] for uchar in ustring: if is_other(uchar): if len(utmp)==0: continue else: retList.append("".join(utmp)) utmp=[] else: utmp.append(uchar) if len(utmp)!=0: retList.append("".join(utmp)) return retList
總結(jié)
以上就是本文關(guān)于python根據(jù)unicode判斷語言類型實例代碼的全部內(nèi)容,希望對大家有所幫助。感興趣的朋友可以繼續(xù)參閱本站其他相關(guān)專題,如有不足之處,歡迎留言指出。感謝朋友們對本站的支持!
相關(guān)文章
使用Python構(gòu)造hive insert語句說明
這篇文章主要介紹了使用Python構(gòu)造hive insert語句說明,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-06-06Python實現(xiàn)處理apiDoc轉(zhuǎn)swagger的方法詳解
這篇文章主要為大家詳細介紹了Python實現(xiàn)處理apiDoc轉(zhuǎn)swagger的方法,文中的示例代碼講解詳細,具有一定的學習價值,感興趣的小伙伴可以了解一下2023-02-02淺談Pycharm調(diào)用同級目錄下的py腳本bug
今天小編就為大家分享一篇淺談Pycharm調(diào)用同級目錄下的py腳本bug,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-12-12transform python環(huán)境快速配置方法
經(jīng)常在數(shù)據(jù)開發(fā)中需要搞udf,最近發(fā)現(xiàn)transform更加方便易用,但是經(jīng)常會涉及到集群python版本不一、包不全或者部分機器上沒有安裝python。這篇文章主要介紹了transform python環(huán)境快速配置方法,需要的朋友可以參考下2018-09-09python代碼檢查工具pylint 讓你的python更規(guī)范
遇到一個新的問題,總是離不開3W原則(What,Why,hoW),下面是對python代碼靜態(tài)檢測工具pylint的學習2012-09-09