欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python解決中文亂碼問題的方法小結(jié)

 更新時(shí)間:2024年11月11日 09:38:56   作者:hakesashou  
在Python編程中,有時(shí)候我們會(huì)遇到中文亂碼的問題,中文亂碼指的是在輸出或處理中文字符時(shí),出現(xiàn)了顯示錯(cuò)誤或亂碼的情況,下面我將介紹幾種常見的解決方法,幫助你解決Python中的中文亂碼問題,需要的朋友可以參考下

1、demo.py 文件和編碼聲明都為 GBK

這種方法比較笨,就是把 demo.py 文件改為 GBK 存儲(chǔ),而且編碼聲明也是GBK,個(gè)人不推薦。

# encoding:gbk
s = "中文"
print s
print repr(s)

2、中文用 unicode 表示

只要在中文前面加上個(gè)小u標(biāo)記,后面的中文就用 unicode 存儲(chǔ)了。

# encoding:utf-8
s = u"中文"
print s
print repr(s)

cmd 下是可以打印 unicode 字符的,如下:

3、把中文強(qiáng)制轉(zhuǎn)換為GBK或者unicode編碼

強(qiáng)制轉(zhuǎn)換為unicode編碼,在 Python 中編碼是可以互相轉(zhuǎn)換的,比如從utf-8轉(zhuǎn)換為gbk,不同編碼之間不能直接轉(zhuǎn)換,需要通過unicode字符集中間過渡下,從上面基礎(chǔ)知識(shí)可知unicode是一種字符集,不屬于編碼,而utf-8是具體實(shí)現(xiàn)unicode思想的一種編碼。utf-8轉(zhuǎn)換為unicode是一種解碼過程,通過decode可從utf-8解碼成unicode。

# encoding:utf-8
s = "中文"
u = s.decode('utf-8')
print u
print type(u)
print repr(u)

強(qiáng)制轉(zhuǎn)換為gbk編碼,上一步已經(jīng)從utf-8轉(zhuǎn)換為unicode了,從unicode是編碼的過程,通過encode實(shí)現(xiàn)。

# encoding:utf-8
s = "中文"
u = s.decode('utf-8')
g = u.encode('gbk')
print g
print type(g)
print repr(g)

總結(jié)

windows cmd 窗口下不支持utf-8,想要顯示中文必須轉(zhuǎn)換為gbk或者unicode,而 Python idle 中這三種編碼都支持。中文亂碼的出現(xiàn)都是由于編碼不一致導(dǎo)致的,存儲(chǔ)的是用utf-8,打印的時(shí)候用gbk就會(huì)亂碼了,所有要保證不亂碼盡量保持統(tǒng)一,建議全部使用unicode。

decode 解碼

從其它編碼變成unicode叫解碼,解碼用的方法是decode,第一個(gè)參數(shù)為被解碼的字符串原始編碼格式,如果寫錯(cuò)了也會(huì)報(bào)錯(cuò)。比如 s 是utf-8,用gbk去解碼就會(huì)報(bào)錯(cuò)。

# encoding:utf-8
s = "中文"
u = s.decode('gbk')
print u
print repr(u)

小提示

在 Python idle 和 cmd 下直接輸入 s = "中文"會(huì)以 gbk 編碼的,如果在文件中輸入 s = "中文"且文件存儲(chǔ)格式為utf-8,那么 s 是以u(píng)tf-8編碼存儲(chǔ)的,有點(diǎn)不一樣曾經(jīng)踩過坑,及時(shí) Python idle 成功了文件運(yùn)行的時(shí)候也可能失敗。

encode 編碼

不可以直接從utf-8轉(zhuǎn)換為gbk,必須經(jīng)過unicode中間轉(zhuǎn)換,這點(diǎn)很重要,被編碼的原始字符串一定要為unicode,否則會(huì)報(bào)錯(cuò)。

raw_input

raw_input 是獲取用戶輸入值的,獲取到的用戶輸入值和當(dāng)前運(yùn)行環(huán)境編碼有關(guān),比如 cmd 下默認(rèn)編碼是 gbk,那么輸入的漢字就是以gbk編碼,而不管 demo.py 文件編碼格式和編碼聲明。

# encoding:utf-8
s = raw_input("input something: ")
print s
print type(s)
print repr(s)

GBK 編碼一個(gè)漢字兩個(gè)字節(jié),UTF-8 一個(gè)漢字通常3個(gè)字節(jié)。

細(xì)心的朋友已經(jīng)注意了,raw_input的提示語我用的是英文,那改成中文看看,果真出現(xiàn)亂碼了。

# encoding:utf-8
s = raw_input("請(qǐng)輸入中文漢字:")
print s
print type(s)
print repr(s)

怎么辦呢?把提示字符串強(qiáng)制為gbk編碼就好,unicode和utf-8都不可以。

# encoding:utf-8
s = raw_input(u"請(qǐng)輸入中文漢字:".encode('gbk'))
print s
print type(s)
print repr(s)

相等陷阱

“中文”這兩個(gè)字符串用不同的編碼存儲(chǔ)是不一樣的,utf-8編碼和gbk編碼存儲(chǔ)的“中文”都不一樣。

總結(jié)

想要不亂碼,記住以下5點(diǎn)法則:

(1)文件存儲(chǔ)為utf-8格式,編碼聲明為utf-8,# encoding:utf-8。

(2)出現(xiàn)漢字的地方前面加 u。

(3)不同編碼之間不能直接轉(zhuǎn)換,要經(jīng)過unicode中間跳轉(zhuǎn)。

(4)cmd 下不支持utf-8編碼。

(5)raw_input提示字符串只能為gbk編碼。

到此這篇關(guān)于python解決中文亂碼問題的方法小結(jié)的文章就介紹到這了,更多相關(guān)python解決中文亂碼內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python設(shè)計(jì)模式之迭代器模式原理與用法實(shí)例分析

    Python設(shè)計(jì)模式之迭代器模式原理與用法實(shí)例分析

    這篇文章主要介紹了Python設(shè)計(jì)模式之迭代器模式原理與用法,結(jié)合具體實(shí)例形式分析了迭代器模式的概念、原理、定義及使用方法,代碼注釋說明簡(jiǎn)單易懂,需要的朋友可以參考下
    2019-01-01
  • 使用Python打造一個(gè)Excel批量加密工具

    使用Python打造一個(gè)Excel批量加密工具

    在日常辦公中,我們經(jīng)常需要處理包含敏感數(shù)據(jù)的Excel文件,本文將介紹如何使用Python+PyQt5開發(fā)一個(gè)支持拖拽操作,emoji美化界面,多線程處理的Excel批量加密工具,感興趣的可以了解下
    2025-05-05
  • Python random模塊用法解析及簡(jiǎn)單示例

    Python random模塊用法解析及簡(jiǎn)單示例

    這篇文章主要介紹了Python random模塊用法解析及簡(jiǎn)單示例,具有一定借鑒價(jià)值,需要的朋友可以參考下。
    2017-12-12
  • pandas創(chuàng)建新Dataframe并添加多行的實(shí)例

    pandas創(chuàng)建新Dataframe并添加多行的實(shí)例

    下面小編就為大家分享一篇pandas創(chuàng)建新Dataframe并添加多行的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2018-04-04
  • Python使用Pandas對(duì)比兩列數(shù)據(jù)取最大值的五種方法

    Python使用Pandas對(duì)比兩列數(shù)據(jù)取最大值的五種方法

    本文主要介紹使用 Pandas 對(duì)比兩列數(shù)據(jù)取最大值的五種方法,包括使用 max 方法、apply 方法結(jié)合 lambda 函數(shù)、函數(shù)、clip 方法、where 方法結(jié)合條件賦值,并通過案例進(jìn)行詳細(xì)說明,需要的朋友可以參考下
    2025-02-02
  • Python實(shí)現(xiàn)PS濾鏡特效之扇形變換效果示例

    Python實(shí)現(xiàn)PS濾鏡特效之扇形變換效果示例

    這篇文章主要介紹了Python實(shí)現(xiàn)PS濾鏡特效之扇形變換效果,結(jié)合實(shí)例形式分析了Python實(shí)現(xiàn)PS濾鏡扇形變換效果的原理與相關(guān)操作技巧,需要的朋友可以參考下
    2018-01-01
  • Python通過m3u8文件下載合并ts視頻的操作

    Python通過m3u8文件下載合并ts視頻的操作

    這篇文章主要介紹了Python通過m3u8文件下載合并ts視頻的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2021-04-04
  • Python?循環(huán)結(jié)構(gòu)詳解

    Python?循環(huán)結(jié)構(gòu)詳解

    這篇文章主要介紹了Python?循環(huán)結(jié)構(gòu),程序的循環(huán)結(jié)構(gòu)邏輯,循環(huán)就是按照一定的條件重復(fù)的去做一件事情,當(dāng)條件不成立時(shí)就結(jié)束循環(huán)的內(nèi)容,需要的小伙伴一起和小編一起進(jìn)入下面文章學(xué)習(xí)吧
    2022-02-02
  • Python基于Faker假數(shù)據(jù)構(gòu)造庫

    Python基于Faker假數(shù)據(jù)構(gòu)造庫

    這篇文章主要介紹了Python基于Faker假數(shù)據(jù)構(gòu)造庫,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-11-11
  • Python中用append()連接后多出一列Unnamed的解決

    Python中用append()連接后多出一列Unnamed的解決

    Python中用append()連接后多出一列Unnamed的解決方案,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-01-01

最新評(píng)論