Python正則表達式如何匹配中文
更新時間:2020年05月27日 10:03:01 作者:百里希文
這篇文章主要介紹了Python正則表達式如何匹配中文,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
用 '[\u4e00-\u9fa5]‘ 匹配中文
在字符串中匹配中文
示例:
匹配字符串中的第一個中文字符
匹配字符串中的第一個連續(xù)的中文片段
匹配字符串中的所有中文字符
注:要確保正則字符和匹配文本是 unicode 范圍內的編碼。
其他 擴充 范圍
幾個主要非英文語系字符范圍: 2E80~33FFh:中日韓符號區(qū)。收容康熙字典部首、中日韓輔助部首、注音符號、日本假名、韓文音符,中日韓的符號、標點、帶圈或帶括符文數字、月份,以及日本的假名組合、單位、年號、月份、日期、時間等。 3400~4DFFh:中日韓認同表意文字擴充A區(qū),總計收容6,582個中日韓漢字。 4E00~9FFFh:中日韓認同表意文字區(qū),總計收容20,902個中日韓漢字。 A000~A4FFh:彝族文字區(qū),收容中國南方彝族文字和字根。 AC00~D7FFh:韓文拼音組合字區(qū),收容以韓文音符拼成的文字。 F900~FAFFh:中日韓兼容表意文字區(qū),總計收容302個中日韓漢字。 FB00~FFFDh:文字表現形式區(qū),收容組合拉丁文字、希伯來文、阿拉伯文、中日韓直式標點、小符號、半角符號、全角符號等。
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
相關文章
BeautifulSoup中find和find_all的使用詳解
這篇文章主要介紹了BeautifulSoup中find和find_all的使用詳解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2020-12-12python用pyinstaller封裝exe雙擊后瘋狂閃退解決辦法
本文主要介紹了python用pyinstaller封裝exe雙擊后瘋狂閃退解決辦法,文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2021-11-11Python利用matplotlib實現動態(tài)可視化詳解
Python中的數據可視化是指原始數據的圖形表示,以更好地可視化、理解和推理,Python提供了各種庫,包含用于可視化數據的不同特性,下面我們就來看看如何利用matplotlib實現動態(tài)可視化吧2023-08-08