深入解讀Python如何進(jìn)行文件讀寫(xiě)
open
Python提供了非常方便的文件讀寫(xiě)功能,其中open是讀寫(xiě)文件的第一步,通過(guò)open讀寫(xiě)文件的方式和把大象裝冰箱是一樣的
f = open("test.txt",'w') #第一步,把冰箱門(mén)(文件)打開(kāi)
f.write("this is content") #第二步,把大象(文件內(nèi)容)裝進(jìn)去
f.close() #第三步,把冰箱門(mén)關(guān)上,否則大象可能會(huì)跑掉
open的定義方式為
file=open(path,mode='r',buffering=-1,encoding=None)
其中,
path為文件路徑mode為讀取模式,默認(rèn)為r,即只讀模式。buffering為緩沖區(qū),由于內(nèi)存的讀寫(xiě)速度快于外設(shè),所以大部分情況不用設(shè),即不大于0。encoding為編碼方式- 最后,輸出的
file是一個(gè)文件對(duì)象。
其中,mode包括以下幾種
| r | r+ | w | w+ | a | a+ | |
|---|---|---|---|---|---|---|
| b | rb | rb+ | wb | wb+ | ab | ab+ |
其中,b表示二進(jìn)制,r表示讀,w表示寫(xiě),a表示追加。無(wú)論什么模式,有+則意味著可讀可寫(xiě)。寫(xiě)入一般會(huì)覆蓋原文件,追加則在原文件尾部開(kāi)始寫(xiě)。如果文件不存在,w, w+, a, a+, wb會(huì)創(chuàng)建新文件。
文件對(duì)象
通過(guò)open創(chuàng)建的文件對(duì)象,除了用于關(guān)閉文件的close之外,有兩組最常用的函數(shù),即代表讀寫(xiě)的read和write,分別用于讀寫(xiě),其區(qū)別如下
| read | write | 讀寫(xiě)整個(gè)文件 read(size)可讀取size大小的文件 |
| readline | 每次讀一行 由于write直接輸入字符串,故不必設(shè)置writeline |
|
| readlines | writelines | 前者按行讀取文件,并存入一個(gè)字符串列表 writelines將一個(gè)字符串列表的形式寫(xiě)入文件 |
例如
>>> f = open('test.txt','w')
>>> f.writelines(['a','b','c\n','d'])
>>> f.close()
>>> f = open('test.txt','r')
>>> f.readlines()
['abc\n', 'd'] #在寫(xiě)lines的時(shí)候,并不會(huì)自動(dòng)添加\n
>>> f.close()
根據(jù)我電腦的性能,讀取500M的txt就要超過(guò)1s,讀取2G的文件多半要報(bào)錯(cuò)。這個(gè)時(shí)候需要通過(guò)seek函數(shù)來(lái)指定偏移量,然后在偏移處的位置對(duì)文件進(jìn)行讀寫(xiě)操作。其輸入為f.seek(offset,whence=0)
其中
offset為偏移量whence為偏移方式,為0時(shí)表示絕對(duì)定位;為1時(shí)表示相對(duì)定位;為2表示從末尾定位。
從seek的視角來(lái)看,open文件時(shí),如果用了w,則代表seek(0),如果用了a,則代表seek(0,2)。
通過(guò)tell可以返回當(dāng)前偏移量,相當(dāng)于seek的對(duì)偶函數(shù)。
在對(duì)文件操作結(jié)束后,需要使用f.close()將緩存中的字符串寫(xiě)入硬盤(pán);如果害怕發(fā)生意外,可以用f.flush()強(qiáng)制寫(xiě)入。
此外,文件對(duì)象的成員變量如下
| name | mode | encoding | error | closed | buffer |
|---|---|---|---|---|---|
| 文件名 | 讀寫(xiě)模式 | 編碼方式 | 錯(cuò)誤模式 | 是否已經(jīng)關(guān)閉 | 緩沖區(qū) |
此外還有三個(gè)判定函數(shù)
readable() |
writable() |
seekable |
|---|---|---|
| 是否可讀 | 是否可寫(xiě) | 可否指定偏移量 |
with … as表達(dá)式
在寫(xiě)入文件時(shí),如果忘了close或者flush,那么可能還有一些數(shù)據(jù)留在內(nèi)存中,從而導(dǎo)致我們得到的文件是殘缺的。
with as表達(dá)式可以通過(guò)調(diào)用對(duì)象中的__enter__方法和__exit__方法,來(lái)更加智能地調(diào)用close,從而免除了忘寫(xiě)close的麻煩。其調(diào)用方法為
with open('text.txt','w') as f:
f.write("12345")
查看file.py,其__exit__函數(shù)正是close:
def __enter__(self):
return self
def __exit__(self, type, value, traceback):
self.close()
底層實(shí)現(xiàn):os.open
open是非常方便的函數(shù),但開(kāi)銷(xiāo)也很大,畢竟直接返回了一個(gè)文件對(duì)象。相比之下,其底層實(shí)現(xiàn)os.open返回的是一個(gè)整型的文件ID,對(duì)于在速度上有要求的頻繁的文件讀寫(xiě)操作,可以考慮使用。
os中,打開(kāi)一個(gè)文件的方法為
fd = os.open(path, flags, mode=511, dir_fd=None)
其中,
path為文件路徑flags為打開(kāi)標(biāo)志,例如os.O_RDONLY代表只讀、os.O_WRONLY代表只寫(xiě)mode表示文件權(quán)限,例如777代表任何人可讀可寫(xiě)可執(zhí)行;511代表文件創(chuàng)建者可讀可執(zhí)行,其他人只可讀,這屬于Linux的內(nèi)容,日后可專門(mén)在Linux里說(shuō)。dir_fd表示相對(duì)路徑的規(guī)則,為自定義函數(shù),比較少用。- 最后,輸出的
fd是某個(gè)文件的標(biāo)識(shí)。
其中,mode的取值可見(jiàn)于deepin和windows的手冊(cè),常用的標(biāo)志如下,多個(gè)標(biāo)志可通過(guò)|疊加,這一股濃郁的C風(fēng)確認(rèn)來(lái)自操作系統(tǒng)無(wú)疑了。
| os.open | open | os.open | open |
|---|---|---|---|
| os.O_RDONLY | ‘r' | os.O_WRONLY | ‘w' |
| os.O_RDWR | ‘r+' | os.O_APPEND | ‘a(chǎn)' |
| os.O_CREAT | 創(chuàng)建并打開(kāi) |
其中相關(guān)的函數(shù)還有:
os.fdopen(fd, mode, bufsize) |
通過(guò)fd創(chuàng)建一個(gè)文件對(duì)象,并返回這個(gè)文件對(duì)象 |
os.read(fd, n) |
從fd 中讀取最多 n 個(gè)字節(jié)并返回,如果fd對(duì)應(yīng)文件已達(dá)到結(jié)尾, 則返回空串。 |
os.write(fd, str) |
將str寫(xiě)入fd,返回實(shí)際寫(xiě)入的字符串長(zhǎng)度 |
os.fsync(fd) |
強(qiáng)制將fd所對(duì)應(yīng)的文件寫(xiě)入硬盤(pán) |
os.close(fd) |
關(guān)閉fd |
os.dup(fd) |
復(fù)制fd |
os.dup2(fd, fd2) |
將fd1所對(duì)應(yīng)的文件復(fù)制給fd2 |
os.fstat(fd) |
返回fd的狀態(tài) |
os.ftruncate(fd, length) |
裁剪fd, length不大于文件尺寸 |
os.isatty(fd) |
如果fd已經(jīng)打開(kāi),同時(shí)與tty(-like)設(shè)備相連,則返回True, 否則False。 |
os.lseek(fd, pos, how) |
設(shè)置fd當(dāng)前位置為pos, how為修改方式,等同于前文中的whence |
到此這篇關(guān)于深入解讀Python如何進(jìn)行文件讀寫(xiě)的文章就介紹到這了,更多相關(guān)Python 文件讀寫(xiě)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
jupyter notebook 恢復(fù)誤刪單元格或者歷史代碼的實(shí)現(xiàn)
這篇文章主要介紹了jupyter notebook 恢復(fù)誤刪單元格或者歷史代碼的實(shí)現(xiàn),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-04-04
python 函數(shù)內(nèi)部修改外部變量的方法
今天小編就為大家分享一篇python 函數(shù)內(nèi)部修改外部變量的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-12-12
Python numpy.array()生成相同元素?cái)?shù)組的示例
今天小編就為大家分享一篇Python numpy.array()生成相同元素?cái)?shù)組的示例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-11-11
python+opencv實(shí)現(xiàn)攝像頭調(diào)用的方法
這篇文章主要為大家詳細(xì)介紹了python+opencv實(shí)現(xiàn)攝像頭調(diào)用的方法,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-06-06
基于django和dropzone.js實(shí)現(xiàn)上傳文件
這篇文章主要介紹了基于django和dropzone.js實(shí)現(xiàn)上傳文件,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-11-11

