欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

<var id="f1kv9"><rp id="f1kv9"></rp></var>

<sub id="f1kv9"></sub>

Python處理unicode字符的方法詳解

更新時(shí)間：2023年08月11日 09:45:10 作者：微小冷

這篇文章主要介紹了Python處理unicode字符的方法詳解,unicodedata中定義了所有Unicode字符的字符屬性，主要包含兩個(gè)功能，其一是根據(jù)名字查找字符；其二是給定字符查找其對(duì)應(yīng)的信息,需要的朋友可以參考下

目錄

編碼與查找
分類
文字方向

編碼與查找

unicodedata 中定義了所有 Unicode 字符的字符屬性，主要包含兩個(gè)功能，其一是根據(jù)名字查找字符；其二是給定字符查找其對(duì)應(yīng)的信息。

前者有一個(gè)函數(shù)

lookup(name) 通過(guò) name 查找字符并返回。

后者由四個(gè)函數(shù)，形參均為 chr[, default] ，其中 char 未待查找字符， default 為找到的字符未定義輸出值時(shí)的默認(rèn)輸出

函數(shù)	返回值
name	chr的字符串名稱
decimal	轉(zhuǎn)為數(shù)值
digit	轉(zhuǎn)為整數(shù)
numeric	轉(zhuǎn)為浮點(diǎn)數(shù)

上面這些函數(shù)，如果沒(méi)找到，則報(bào) ValueError 錯(cuò)誤，示例如下

>>> unicodedata.name('1')
'DIGIT ONE'
>>> unicodedata.decimal('1')
1
>>> unicodedata.digit('1')
1
>>> unicodedata.numeric('1')
1.0

分類

unicode 字符總共分為下面這些類別，通過(guò)調(diào)用 category(chr) 可以查看字符 chr 所屬的unicode分類。

unicode 收集了幾乎人類歷史上出現(xiàn)的所有符號(hào)，所以字符數(shù)目相當(dāng)多。其中，漢字屬于 Lo 。

標(biāo)志	含義	解釋	字符數(shù)	舉例
Ll	Letter, Lowercase	小寫(xiě)字母	2233
Lu	Letter, Uppercase	大寫(xiě)字母	1831
Lm	Letter, Modifier	修飾字母	397
Lt	Letter, Titlecase	標(biāo)題字母	31
LC	Letter, Cased		0
Lo	Letter, Other	其他字母	17273
Mc	Mark, Spacing Combining		452
Me	Mark, Enclosing	封閉標(biāo)記	13
Mn	Mark, Nonspacing	非空格標(biāo)記	1985
Nd	Number, Decimal Digit	十進(jìn)制數(shù)字	680	0
Nl	Number, Letter	數(shù)字字母	236	Ⅲ
No	Number, Other	其他數(shù)字	915	¼
Pc	Punctuation, Connector	連接符	10	﹍
Pd	Punctuation, Dash	破折號(hào)	26
Ps	Punctuation, Open	左括號(hào)	79
Pe	Punctuation, Close	右括號(hào)	77
Pf	Punctuation, Final quote	右引號(hào)	10
Pi	Punctuation, Initial quote	左引號(hào)	12
Po	Punctuation, Other	其他標(biāo)點(diǎn)	628
Sc	Symbol, Currency	貨幣符號(hào)	63	$
Sk	Symbol, Modifier	修飾符	125	?
Sm	Symbol, Math	數(shù)學(xué)符號(hào)	948	?
So	Symbol, Other	其他符號(hào)	6634	?
Zl	Separator, Line	換行符	1	U+2028
Zp	Separator, Paragraph	分段符	1	U+2029
Zs	Separator, Space	空格	17
Cc	Other, Control	控制字符	65
Cf	Other, Format	格式字符	170
Cn	Other, Not Assigned		0
Co	Other, Private Use		6
Cs	Other, Surrogate		6

下面實(shí)踐一下

>>> unicodedata.category('A')
'Lu'
>>> unicodedata.category('a')
'Ll'
>>> unicodedata.category('啊')
'Lo'
>>> unicodedata.category('?')
'Sm'

文字方向

由于不同文字的書(shū)寫(xiě)順序是不同的，所以字符的應(yīng)用場(chǎng)景會(huì)受到文字的影響。有一些字符具有較強(qiáng)的方向感，比如英語(yǔ)字母從左向右，而阿拉伯字母則是從右向左的。

bidirectional 可以查詢字符文字的方向，

>>> unicodedata.bidirectional('>')
'ON'
>>> unicodedata.bidirectional('\u06A0')
'AL'
>>> unicodedata.bidirectional('啊')
'L'

類型	標(biāo)志	說(shuō)明
強(qiáng)	L	從左向右
強(qiáng)	R	從右向左
強(qiáng)	AL	阿拉伯式從右向左
弱	EN	歐洲數(shù)字
弱	ES	歐洲數(shù)字分隔符
弱	ET	歐洲數(shù)字終結(jié)符
弱	AN	阿拉伯?dāng)?shù)字
弱	CS	數(shù)字分隔符
弱	MSN	非空標(biāo)記
弱	BN	邊界符號(hào)
中立	B	段落分隔符
中立	S	制表符
中立	WS	空格
中立	ON	其他中立字符
顯式	LRE	Left-to-Right Embedding
顯式	LRO	Left-to-Right Override
顯式	RLE	Right-to-Left Embedding
顯式	RLO	Right-to-Left Override
顯式	PDF	Pop Directional Format
顯式	LRI	Left-to-Right Isolate
顯式	RLI	Right-to-Left Isolate
顯式	FSI	First Strong Isolate
顯式	PDI	Pop Directional Isolate

到此這篇關(guān)于Python處理unicode字符的方法詳解的文章就介紹到這了,更多相關(guān)Python處理unicode內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

相關(guān)文章

python爬取天氣數(shù)據(jù)的實(shí)例詳解
在本篇文章里小編給大家整理的是一篇關(guān)于python爬取天氣數(shù)據(jù)的實(shí)例詳解內(nèi)容，有興趣的朋友們學(xué)習(xí)下。
2020-11-11
Python socket連接中的粘包、精確傳輸問(wèn)題實(shí)例分析
這篇文章主要介紹了Python socket連接中的粘包、精確傳輸問(wèn)題,結(jié)合實(shí)例形式分析了Python socket連接中的粘包、精確傳輸相關(guān)問(wèn)題原因、解決方案與操作注意事項(xiàng),需要的朋友可以參考下
2020-03-03
Pandas技巧分享之創(chuàng)建測(cè)試數(shù)據(jù)
學(xué)習(xí)pandas的過(guò)程中，為了嘗試pandas提供的各類功能強(qiáng)大的函數(shù)，常常需要花費(fèi)很多時(shí)間去創(chuàng)造測(cè)試數(shù)據(jù)，本篇介紹了一些快速創(chuàng)建測(cè)試數(shù)據(jù)的方法，需要的可以參考一下
2023-07-07
python讀取配置文件方式(ini、yaml、xml)
這篇文章主要介紹了python讀取配置文件方式(ini、yaml、xml)，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
2020-04-04
Flask-Mail用法實(shí)例分析
這篇文章主要介紹了Flask-Mail用法,結(jié)合實(shí)例形式分析了Flask-Mail的安裝、配置參數(shù)及簡(jiǎn)單使用技巧,需要的朋友可以參考下
2018-07-07
Pytest實(shí)現(xiàn)setup和teardown的詳細(xì)使用詳解
這篇文章主要介紹了Pytest實(shí)現(xiàn)setup和teardown的詳細(xì)使用詳解，文中通過(guò)示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
2021-04-04
解決安裝和導(dǎo)入tensorflow、keras出錯(cuò)的問(wèn)題
這篇文章主要介紹了解決安裝和導(dǎo)入tensorflow、keras出錯(cuò)的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
2024-01-01
Django中間件攔截未登錄url實(shí)例詳解
在本篇文章里小編給各位整理了關(guān)于Django中間件攔截未登錄url的實(shí)例內(nèi)容以及相關(guān)知識(shí)點(diǎn)，有需要的朋友們可以學(xué)習(xí)下。
2019-09-09
Python字典中的值求和兩種方法
在Python中字典是一種無(wú)序的數(shù)據(jù)結(jié)構(gòu),它由一系列鍵和對(duì)應(yīng)的值組成,有時(shí)候我們需要對(duì)字典中的鍵對(duì)應(yīng)的值進(jìn)行求和操作,這篇文章主要給大家介紹了關(guān)于Python字典中值求和兩種方法的相關(guān)資料,需要的朋友可以參考下
2023-11-11
Python?文件處理之open()函數(shù)
這篇文章主要介紹了Python?文件處理之open()函數(shù)，在?Python?中使用文件的關(guān)鍵函數(shù)是?open()?函數(shù)，關(guān)于其打開(kāi)文件的不同方式需要的小伙伴可以參考下面詳細(xì)介紹
2022-03-03

最新評(píng)論

<legend id="vudv3"><track id="vudv3"></track></legend>