python中將\\uxxxx轉換為Unicode字符串的方法
今天碰到一個很有意思的問題,需要將普通的 Unicode字符串轉換為 Unicode編碼的字符串,如下:
將 \\u9500\\u552e 轉化為 \u9500\u552e 也就是 銷售 。
乍一看感覺挺簡單的,用 re 庫將前面的反斜杠去掉即可,但是在替換的過程中會拋出如下錯誤:
Traceback (most recent call last):
File "<pyshell#15>", line 1, in <module>
re.sub(r"(\)\u", r'', t)
File "D:\Python36\lib\re.py", line 191, in sub
return _compile(pattern, flags).sub(repl, string, count)
File "D:\Python36\lib\re.py", line 301, in _compile
p = sre_compile.compile(pattern, flags)
File "D:\Python36\lib\sre_compile.py", line 562, in compile
p = sre_parse.parse(p, flags)
File "D:\Python36\lib\sre_parse.py", line 855, in parse
p = _parse_sub(source, pattern, flags & SRE_FLAG_VERBOSE, 0)
File "D:\Python36\lib\sre_parse.py", line 416, in _parse_sub
not nested and not items))
File "D:\Python36\lib\sre_parse.py", line 765, in _parse
p = _parse_sub(source, state, sub_verbose, nested + 1)
File "D:\Python36\lib\sre_parse.py", line 416, in _parse_sub
not nested and not items))
File "D:\Python36\lib\sre_parse.py", line 502, in _parse
code = _escape(source, this, state)
File "D:\Python36\lib\sre_parse.py", line 362, in _escape
raise source.error("incomplete escape %s" % escape, len(escape))
sre_constants.error: incomplete escape \u at position 3
大概意思就是去掉前面的反寫杠之后剩下的 \u 不能組成完整的字符。
到這里問題好像有點難以解決了,這時候我們會放棄嗎?
當然不會,到谷歌上搜一下,發(fā)現(xiàn)還真有人碰到過這個問題,解決方法也是十分的巧妙。
竟然還可以使用 json 庫的 loads 方法 ...
解決方法如下:
import json s = '\\u9500\\u552e' print(json.loads(f'"{s}"'))
PS:python3 將字符串unicode轉換為中文
記錄一個經常會遇到的問題:
得到的文本打印出來是“\uxxxx”的字符串格式,在python3中使用text.decode('unicode_escape')會報錯:‘str' object has no attribute 'decode'
正確的姿勢是:
text.encode('utf-8').decode("unicode_escape")
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
- Python 字節(jié)流,字符串,十六進制相互轉換實例(binascii,bytes)
- python3 json數據格式的轉換(dumps/loads的使用、dict to str/str to dict、json字符串/字典的相互轉換)
- Python 十六進制整數與ASCii編碼字符串相互轉換方法
- python 將字符串轉換成字典dict的各種方式總結
- python實現(xiàn)字典(dict)和字符串(string)的相互轉換方法
- python 轉換 Javascript %u 字符串為python unicode的代碼
- python 將字符串轉換成字典dict
- C語言字符串轉換為Python字符串的方法
相關文章
python 使用raw socket進行TCP SYN掃描實例
這篇文章主要介紹了python 使用raw socket進行TCP SYN掃描實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-05-05python中數組array和列表list的基本用法及區(qū)別解析
大家都知道數組array是同類型數據的有限集合,列表list是一系列按特定順序排列的元素組成,可以將任何數據放入列表,且其中元素之間沒有任何關系,本文介紹python中數組array和列表list的基本用法及區(qū)別,感興趣的朋友一起看看吧2022-05-05Windows系統(tǒng)下Chromedriver.exe安裝及配置詳細教程
ChromeDriver.exe是一款實用的chrome瀏覽器驅動工具,能夠用于自動化測試、網絡爬蟲和操作瀏覽器,其主要作用是模擬瀏覽器操作,下面這篇文章主要給大家介紹了關于Windows系統(tǒng)下Chromedriver.exe安裝及配置的相關資料,需要的朋友可以參考下2023-11-11如何解決Pycharm運行報錯No Python interpreter selected
這篇文章主要介紹了如何解決Pycharm運行時No Python interpreter selected問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2024-05-05