python中將\\uxxxx轉(zhuǎn)換為Unicode字符串的方法
今天碰到一個很有意思的問題,需要將普通的 Unicode字符串轉(zhuǎn)換為 Unicode編碼的字符串,如下:
將 \\u9500\\u552e 轉(zhuǎn)化為 \u9500\u552e 也就是 銷售 。
乍一看感覺挺簡單的,用 re 庫將前面的反斜杠去掉即可,但是在替換的過程中會拋出如下錯誤:
Traceback (most recent call last):
File "<pyshell#15>", line 1, in <module>
re.sub(r"(\)\u", r'', t)
File "D:\Python36\lib\re.py", line 191, in sub
return _compile(pattern, flags).sub(repl, string, count)
File "D:\Python36\lib\re.py", line 301, in _compile
p = sre_compile.compile(pattern, flags)
File "D:\Python36\lib\sre_compile.py", line 562, in compile
p = sre_parse.parse(p, flags)
File "D:\Python36\lib\sre_parse.py", line 855, in parse
p = _parse_sub(source, pattern, flags & SRE_FLAG_VERBOSE, 0)
File "D:\Python36\lib\sre_parse.py", line 416, in _parse_sub
not nested and not items))
File "D:\Python36\lib\sre_parse.py", line 765, in _parse
p = _parse_sub(source, state, sub_verbose, nested + 1)
File "D:\Python36\lib\sre_parse.py", line 416, in _parse_sub
not nested and not items))
File "D:\Python36\lib\sre_parse.py", line 502, in _parse
code = _escape(source, this, state)
File "D:\Python36\lib\sre_parse.py", line 362, in _escape
raise source.error("incomplete escape %s" % escape, len(escape))
sre_constants.error: incomplete escape \u at position 3
大概意思就是去掉前面的反寫杠之后剩下的 \u 不能組成完整的字符。
到這里問題好像有點難以解決了,這時候我們會放棄嗎?
當(dāng)然不會,到谷歌上搜一下,發(fā)現(xiàn)還真有人碰到過這個問題,解決方法也是十分的巧妙。
竟然還可以使用 json 庫的 loads 方法 ...
解決方法如下:
import json s = '\\u9500\\u552e' print(json.loads(f'"{s}"'))
PS:python3 將字符串unicode轉(zhuǎn)換為中文
記錄一個經(jīng)常會遇到的問題:
得到的文本打印出來是“\uxxxx”的字符串格式,在python3中使用text.decode('unicode_escape')會報錯:‘str' object has no attribute 'decode'
正確的姿勢是:
text.encode('utf-8').decode("unicode_escape")
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
- Python 字節(jié)流,字符串,十六進制相互轉(zhuǎn)換實例(binascii,bytes)
- python3 json數(shù)據(jù)格式的轉(zhuǎn)換(dumps/loads的使用、dict to str/str to dict、json字符串/字典的相互轉(zhuǎn)換)
- Python 十六進制整數(shù)與ASCii編碼字符串相互轉(zhuǎn)換方法
- python 將字符串轉(zhuǎn)換成字典dict的各種方式總結(jié)
- python實現(xiàn)字典(dict)和字符串(string)的相互轉(zhuǎn)換方法
- python 轉(zhuǎn)換 Javascript %u 字符串為python unicode的代碼
- python 將字符串轉(zhuǎn)換成字典dict
- C語言字符串轉(zhuǎn)換為Python字符串的方法
相關(guān)文章
python 使用raw socket進行TCP SYN掃描實例
這篇文章主要介紹了python 使用raw socket進行TCP SYN掃描實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-05-05python正則過濾字母、中文、數(shù)字及特殊字符方法詳解
這篇文章主要介紹了python正則過濾字母、數(shù)字及特殊字符方法詳解,需要的朋友可以參考下2020-02-02python中數(shù)組array和列表list的基本用法及區(qū)別解析
大家都知道數(shù)組array是同類型數(shù)據(jù)的有限集合,列表list是一系列按特定順序排列的元素組成,可以將任何數(shù)據(jù)放入列表,且其中元素之間沒有任何關(guān)系,本文介紹python中數(shù)組array和列表list的基本用法及區(qū)別,感興趣的朋友一起看看吧2022-05-05Windows系統(tǒng)下Chromedriver.exe安裝及配置詳細教程
ChromeDriver.exe是一款實用的chrome瀏覽器驅(qū)動工具,能夠用于自動化測試、網(wǎng)絡(luò)爬蟲和操作瀏覽器,其主要作用是模擬瀏覽器操作,下面這篇文章主要給大家介紹了關(guān)于Windows系統(tǒng)下Chromedriver.exe安裝及配置的相關(guān)資料,需要的朋友可以參考下2023-11-11如何解決Pycharm運行報錯No Python interpreter selected
這篇文章主要介紹了如何解決Pycharm運行時No Python interpreter selected問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2024-05-05