欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python3 中文文件讀寫方法

 更新時(shí)間:2018年01月23日 15:08:59   作者:SuPhoebe  
下面小編就為大家分享一篇Python3 中文文件讀寫方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧

字符串在Python內(nèi)部的表示是Unicode編碼,因此,在做編碼轉(zhuǎn)換時(shí),通常需要以Unicode作為中間編碼,即先將其他編碼的字符串解碼(decode)成Unicode,再?gòu)腢nicode編碼(encode)成另一種編碼。

在新版本的python3中,取消了unicode類型,代替它的是使用unicode字符的字符串類型(str),字符串類型(str)成為基礎(chǔ)類型如下所示,而編碼后的變?yōu)榱俗止?jié)類型(bytes) 但是兩個(gè)函數(shù)的使用方法不變:

  decode    encode
bytes ------> str(unicode)------>bytes
u = '中文' #指定字符串類型對(duì)象u 
str = u.encode('gb2312') #以gb2312編碼對(duì)u進(jìn)行編碼,獲得bytes類型對(duì)象str 
u1 = str.decode('gb2312')#以gb2312編碼對(duì)字符串str進(jìn)行解碼,獲得字符串類型對(duì)象u1 
u2 = str.decode('utf-8')#如果以u(píng)tf-8的編碼對(duì)str進(jìn)行解碼得到的結(jié)果,將無(wú)法還原原來(lái)的字符串內(nèi)容

文件讀取問(wèn)題

假如我們讀取一個(gè)文件,文件保存時(shí),使用的編碼格式,決定了我們從文件讀取的內(nèi)容的編碼格式,例如,我們從記事本新建一個(gè)文本文件test.txt, 編輯內(nèi)容,保存的時(shí)候注意,編碼格式是可以選擇的,例如我們可以選擇gb2312,那么使用python讀取文件內(nèi)容,方式如下:

f = open('test.txt','r')
s = f.read() #讀取文件內(nèi)容,如果是不識(shí)別的encoding格式(識(shí)別的encoding類型跟使用的系統(tǒng)有關(guān)),這里將讀取失敗
'''假設(shè)文件保存時(shí)以gb2312編碼保存'''
u = s.decode('gb2312') #以文件保存格式對(duì)內(nèi)容進(jìn)行解碼,獲得unicode字符串
'''下面我們就可以對(duì)內(nèi)容進(jìn)行各種編碼的轉(zhuǎn)換了'''
str = u.encode('utf-8')#轉(zhuǎn)換為utf-8編碼的字符串str
str1 = u.encode('gbk')#轉(zhuǎn)換為gbk編碼的字符串str1
str1 = u.encode('utf-16')#轉(zhuǎn)換為utf-16編碼的字符串str1

codecs進(jìn)行文件的讀取

python給我們提供了一個(gè)包c(diǎn)odecs進(jìn)行文件的讀取,這個(gè)包中的open()函數(shù)可以指定編碼的類型:

import codecs 
f = codecs.open('text.text','r+',encoding='utf-8')#必須事先知道文件的編碼格式,這里文件編碼是使用的utf-8 
content = f.read()#如果open時(shí)使用的encoding和文件本身的encoding不一致的話,那么這里將將會(huì)產(chǎn)生錯(cuò)誤 
f.write('你想要寫入的信息') 
f.close()

以上這篇Python3 中文文件讀寫方法就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

相關(guān)文章

最新評(píng)論