欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python處理unicode字符的方法詳解

 更新時(shí)間:2023年08月11日 09:45:10   作者:微小冷  
這篇文章主要介紹了Python處理unicode字符的方法詳解,unicodedata中定義了所有Unicode字符的字符屬性,主要包含兩個(gè)功能,其一是根據(jù)名字查找字符;其二是給定字符查找其對應(yīng)的信息,需要的朋友可以參考下

編碼與查找

unicodedata 中定義了所有 Unicode 字符的字符屬性,主要包含兩個(gè)功能,其一是根據(jù)名字查找字符;其二是給定字符查找其對應(yīng)的信息。

前者有一個(gè)函數(shù)

  • lookup(name) 通過 name 查找字符并返回。

后者由四個(gè)函數(shù),形參均為 chr[, default] ,其中 char 未待查找字符, default 為找到的字符未定義輸出值時(shí)的默認(rèn)輸出

函數(shù)返回值
namechr的字符串名稱
decimal轉(zhuǎn)為數(shù)值
digit轉(zhuǎn)為整數(shù)
numeric轉(zhuǎn)為浮點(diǎn)數(shù)

上面這些函數(shù),如果沒找到,則報(bào) ValueError 錯(cuò)誤,示例如下

>>> unicodedata.name('1')
'DIGIT ONE'
>>> unicodedata.decimal('1')
1
>>> unicodedata.digit('1')
1
>>> unicodedata.numeric('1')
1.0

分類

unicode 字符總共分為下面這些類別,通過調(diào)用 category(chr) 可以查看字符 chr 所屬的unicode分類。

unicode 收集了幾乎人類歷史上出現(xiàn)的所有符號,所以字符數(shù)目相當(dāng)多。其中,漢字屬于 Lo 。

標(biāo)志含義解釋字符數(shù)舉例
LlLetter, Lowercase小寫字母2233
LuLetter, Uppercase大寫字母1831
LmLetter, Modifier修飾字母397
LtLetter, Titlecase標(biāo)題字母31
LCLetter, Cased0
LoLetter, Other其他字母17273
McMark, Spacing Combining452
MeMark, Enclosing封閉標(biāo)記13
MnMark, Nonspacing非空格標(biāo)記1985
NdNumber, Decimal Digit十進(jìn)制數(shù)字6800
NlNumber, Letter數(shù)字字母236
NoNumber, Other其他數(shù)字915¼
PcPunctuation, Connector連接符10
PdPunctuation, Dash破折號26
PsPunctuation, Open左括號79
PePunctuation, Close右括號77
PfPunctuation, Final quote右引號10
PiPunctuation, Initial quote左引號12
PoPunctuation, Other其他標(biāo)點(diǎn)628
ScSymbol, Currency貨幣符號63$
SkSymbol, Modifier修飾符125?
SmSymbol, Math數(shù)學(xué)符號948?
SoSymbol, Other其他符號6634?
ZlSeparator, Line換行符1U+2028
ZpSeparator, Paragraph分段符1U+2029
ZsSeparator, Space空格17
CcOther, Control控制字符65
CfOther, Format格式字符170
CnOther, Not Assigned0
CoOther, Private Use6
CsOther, Surrogate6

下面實(shí)踐一下

>>> unicodedata.category('A')
'Lu'
>>> unicodedata.category('a')
'Ll'
>>> unicodedata.category('啊')
'Lo'
>>> unicodedata.category('?')
'Sm'

文字方向

由于不同文字的書寫順序是不同的,所以字符的應(yīng)用場景會受到文字的影響。有一些字符具有較強(qiáng)的方向感,比如英語字母從左向右,而阿拉伯字母則是從右向左的。

bidirectional 可以查詢字符文字的方向,

>>> unicodedata.bidirectional('>')
'ON'
>>> unicodedata.bidirectional('\u06A0')
'AL'
>>> unicodedata.bidirectional('啊')
'L'
類型標(biāo)志說明
強(qiáng)L從左向右
強(qiáng)R從右向左
強(qiáng)AL阿拉伯式從右向左
EN歐洲數(shù)字
ES歐洲數(shù)字分隔符
ET歐洲數(shù)字終結(jié)符
AN阿拉伯?dāng)?shù)字
CS數(shù)字分隔符
MSN非空標(biāo)記
BN邊界符號
中立B段落分隔符
中立S制表符
中立WS空格
中立ON其他中立字符
顯式LRELeft-to-Right Embedding
顯式LROLeft-to-Right Override
顯式RLERight-to-Left Embedding
顯式RLORight-to-Left Override
顯式PDFPop Directional Format
顯式LRILeft-to-Right Isolate
顯式RLIRight-to-Left Isolate
顯式FSIFirst Strong Isolate
顯式PDIPop Directional Isolate

到此這篇關(guān)于Python處理unicode字符的方法詳解的文章就介紹到這了,更多相關(guān)Python處理unicode內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • python爬取天氣數(shù)據(jù)的實(shí)例詳解

    python爬取天氣數(shù)據(jù)的實(shí)例詳解

    在本篇文章里小編給大家整理的是一篇關(guān)于python爬取天氣數(shù)據(jù)的實(shí)例詳解內(nèi)容,有興趣的朋友們學(xué)習(xí)下。
    2020-11-11
  • Python socket連接中的粘包、精確傳輸問題實(shí)例分析

    Python socket連接中的粘包、精確傳輸問題實(shí)例分析

    這篇文章主要介紹了Python socket連接中的粘包、精確傳輸問題,結(jié)合實(shí)例形式分析了Python socket連接中的粘包、精確傳輸相關(guān)問題原因、解決方案與操作注意事項(xiàng),需要的朋友可以參考下
    2020-03-03
  • Pandas技巧分享之創(chuàng)建測試數(shù)據(jù)

    Pandas技巧分享之創(chuàng)建測試數(shù)據(jù)

    學(xué)習(xí)pandas的過程中,為了嘗試pandas提供的各類功能強(qiáng)大的函數(shù),常常需要花費(fèi)很多時(shí)間去創(chuàng)造測試數(shù)據(jù),本篇介紹了一些快速創(chuàng)建測試數(shù)據(jù)的方法,需要的可以參考一下
    2023-07-07
  • python讀取配置文件方式(ini、yaml、xml)

    python讀取配置文件方式(ini、yaml、xml)

    這篇文章主要介紹了python讀取配置文件方式(ini、yaml、xml),具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-04-04
  • Flask-Mail用法實(shí)例分析

    Flask-Mail用法實(shí)例分析

    這篇文章主要介紹了Flask-Mail用法,結(jié)合實(shí)例形式分析了Flask-Mail的安裝、配置參數(shù)及簡單使用技巧,需要的朋友可以參考下
    2018-07-07
  • Pytest實(shí)現(xiàn)setup和teardown的詳細(xì)使用詳解

    Pytest實(shí)現(xiàn)setup和teardown的詳細(xì)使用詳解

    這篇文章主要介紹了Pytest實(shí)現(xiàn)setup和teardown的詳細(xì)使用詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-04-04
  • 解決安裝和導(dǎo)入tensorflow、keras出錯(cuò)的問題

    解決安裝和導(dǎo)入tensorflow、keras出錯(cuò)的問題

    這篇文章主要介紹了解決安裝和導(dǎo)入tensorflow、keras出錯(cuò)的問題,具有很好的參考價(jià)值,希望對大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2024-01-01
  • Django中間件攔截未登錄url實(shí)例詳解

    Django中間件攔截未登錄url實(shí)例詳解

    在本篇文章里小編給各位整理了關(guān)于Django中間件攔截未登錄url的實(shí)例內(nèi)容以及相關(guān)知識點(diǎn),有需要的朋友們可以學(xué)習(xí)下。
    2019-09-09
  • Python字典中的值求和兩種方法

    Python字典中的值求和兩種方法

    在Python中字典是一種無序的數(shù)據(jù)結(jié)構(gòu),它由一系列鍵和對應(yīng)的值組成,有時(shí)候我們需要對字典中的鍵對應(yīng)的值進(jìn)行求和操作,這篇文章主要給大家介紹了關(guān)于Python字典中值求和兩種方法的相關(guān)資料,需要的朋友可以參考下
    2023-11-11
  • Python?文件處理之open()函數(shù)

    Python?文件處理之open()函數(shù)

    這篇文章主要介紹了Python?文件處理之open()函數(shù),在?Python?中使用文件的關(guān)鍵函數(shù)是?open()?函數(shù),關(guān)于其打開文件的不同方式需要的小伙伴可以參考下面詳細(xì)介紹
    2022-03-03

最新評論