Python編碼類型轉換方法詳解
本文實例講述了Python編碼類型轉換方法。分享給大家供大家參考,具體如下:
1:Python和unicode
為了正確處理多語言文本,Python在2.0版后引入了Unicode字符串。
2:python中的print
雖然python內(nèi)部需要將文本編碼轉換為unicode編碼來處理,而終端顯示工作則由傳統(tǒng)的Python字符串完成(實際上,Python的print語句根本無法打印出雙字節(jié)的Unicode編碼字符)。
python的print會對輸出的unicode編碼(對其它非unicode編碼,print會原樣輸出)做自動的編碼轉換(輸出到控制臺時),而文件對象的write方法就不會做,因此,當一些字符串用print輸出正常時,write到文件確不一定和print的一樣。
在linux下是按照環(huán)境變量來轉換的,在linux下使用locale命令就可以看到。print語句它的實現(xiàn)是將要輸出的內(nèi)容傳送了操作系統(tǒng),操作系統(tǒng)會根據(jù)系統(tǒng)的編碼對輸入的字節(jié)流進行編碼。
>>>str='學習python' >>> str '\xe5\xad\xa6\xe4\xb9\xa0python' #asII編碼 >>> print str 學習python >>> str=u'學習python' >>> str ####unicode編碼 '\xe5u\xad\xa6\xe4\xb9\xa0python'
3: python中的decode
將其他字符集轉化為unicode編碼(只有中文字符才需要轉換)
>>> str='學習' >>> ustr=str.decode('utf-8') >>> ustr u'\u5b66\u4e60'
這樣就對中文字符進行了編碼轉換,可用python進行后續(xù)的處理;(如果不轉換的話,python會根據(jù)機器的環(huán)境變量進行默認的編碼轉換,這樣就可能出現(xiàn)亂碼)
4:python中的encode
將unicode轉化為其它字符集
>>> str='學習' >>> ustr=str.decode('utf-8') >>> ustr u'\u5b66\u4e60' >>> ustr.encode('utf-8') '\xe5\xad\xa6\xe4\xb9\xa0' >>> print ustr.encode('utf-8') 學習
更多關于Python相關內(nèi)容感興趣的讀者可查看本站專題:《Python編碼操作技巧總結》、《Python圖片操作技巧總結》、《Python數(shù)據(jù)結構與算法教程》、《Python Socket編程技巧總結》、《Python函數(shù)使用技巧總結》、《Python字符串操作技巧匯總》、《Python入門與進階經(jīng)典教程》及《Python文件與目錄操作技巧匯總》
希望本文所述對大家Python程序設計有所幫助。
相關文章
利用Python對文件夾下圖片數(shù)據(jù)進行批量改名的代碼實例
今天小編就為大家分享一篇關于利用Python對文件夾下圖片數(shù)據(jù)進行批量改名的代碼實例,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧2019-02-02Python實現(xiàn)多圖繪制系統(tǒng)的示例代碼
這篇文章主要為大家詳細介紹了Python如何實現(xiàn)制作一個多圖繪制系統(tǒng),文中的示例代碼簡潔易懂,具有一定的借鑒價值,感興趣的小伙伴可以學習一下2023-09-09Python Arrow處理時間數(shù)據(jù)使用詳解(標準庫之外另一種選擇)
這篇文章主要介紹了Python標準庫之外Arrow處理時間數(shù)據(jù)的另一種選擇使用詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2024-01-01python3.6+django2.0+mysql搭建網(wǎng)站過程詳解
這篇文章主要介紹了python3.6+django2.0+mysql搭建網(wǎng)站過程詳解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下2019-07-07