淺談Python2之漢字編碼為unicode的問題(即類似\xc3\xa4)

更新時間：2019年08月12日 16:47:18 作者：mighty13

今天小編就為大家分享一篇淺談Python2之漢字編碼為unicode的問題(即類似\xc3\xa4)，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

Python2中編碼相關的問題很是讓人蛋疼，特別是中文字符。

比如本文所述的中文網(wǎng)頁GBK編碼的詭異問題。

現(xiàn)象

例如：盲錄職氓聭聵，其實網(wǎng)頁里面正常的應該是會員

分析

接著上面的例子，會員這部分亂碼通過repr()函數(shù)求值得到如下結果

\xc3\xa4\xc2\xbc\xc2\x9a\xc3\xa5\xc2\x91\xc2\x98

使用type()函數(shù)求值得到的結果為unicode

eval(repr())出來值為

盲錄職氓聭聵

通過查表上述6個漢字對應

c3a4 c2bc c29a c3a5 c291 c298

而上面內容對應的UTF-8值就是會員

解決方法

相當詭異的是本身是unicode編碼，卻被當作GBK系列來解碼，結果導致亂碼。因此將這些字符先編碼再解決解決問題。

encode('raw_unicode_escape').decode()

以上這篇淺談Python2之漢字編碼為unicode的問題(即類似\xc3\xa4)就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

python編程使用協(xié)程并發(fā)的優(yōu)缺點
協(xié)程是一種用戶態(tài)的輕量級線程，又稱微線程。這篇文章主要介紹了python編程使用協(xié)程并發(fā)的優(yōu)缺點，感興趣的朋友跟隨小編一起看看吧
2018-09-09
Python編程快速上手——strip()函數(shù)的正則表達式實現(xiàn)方法分析
這篇文章主要介紹了Python strip()函數(shù)的正則表達式實現(xiàn)方法,結合實例形式分析了Python基于正則表達式實現(xiàn)strip()函數(shù)的方法,需要的朋友可以參考下
2020-02-02
Python手寫回歸樹的實現(xiàn)
本文主要介紹了Python手寫回歸樹的實現(xiàn)，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2022-06-06
django數(shù)據(jù)庫報錯解決匯總:django.db.utils.OperationalError?1045,1049,
這篇文章主要給大家介紹了關于django數(shù)據(jù)庫報錯解決:django.db.utils.OperationalError?1045,1049,2003的相關資料,文中將解決的辦法介紹的非常詳細,需要的朋友可以參考下
2023-02-02
初步理解Python進程的信號通訊
這篇文章主要介紹了初步理解Python進程的信號通訊,作者列舉了Linux系統(tǒng)下的信號通訊示例,需要的朋友可以參考下
2015-04-04
python遞歸打印某個目錄的內容(實例講解)
下面小編就為大家?guī)硪黄猵ython遞歸打印某個目錄的內容(實例講解)。小編覺得挺不錯的，現(xiàn)在就分享給大家，也給大家做個參考。一起跟隨小編過來看看吧
2017-08-08
Python數(shù)據(jù)類型學習筆記
這篇文章主要針對Python數(shù)據(jù)類型為大家進行了詳細介紹，整理一篇關于Python數(shù)據(jù)類型的學習筆記，感興趣的小伙伴們可以參考一下
2016-01-01
python的tkinter布局之簡單的聊天窗口實現(xiàn)方法
這篇文章主要介紹了python的tkinter布局之簡單的聊天窗口實現(xiàn)方法,對于tkinter用法做了初步的介紹與應用展示,需要的朋友可以參考下
2014-09-09
python 獲取計算機的網(wǎng)卡信息
這篇文章主要介紹了python 獲取計算機的網(wǎng)卡信息的方法，幫助大家更好的理解和學習python，感興趣的朋友可以了解下
2021-02-02
python使用插值法畫出平滑曲線
這篇文章主要為大家詳細介紹了python使用插值法畫出平滑曲線，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2018-12-12