深入解讀Python如何進行文件讀寫
open
Python提供了非常方便的文件讀寫功能,其中open
是讀寫文件的第一步,通過open
讀寫文件的方式和把大象裝冰箱是一樣的
f = open("test.txt",'w') #第一步,把冰箱門(文件)打開 f.write("this is content") #第二步,把大象(文件內(nèi)容)裝進去 f.close() #第三步,把冰箱門關(guān)上,否則大象可能會跑掉
open
的定義方式為
file=open(path,mode='r',buffering=-1,encoding=None)
其中,
path
為文件路徑mode
為讀取模式,默認為r
,即只讀模式。buffering
為緩沖區(qū),由于內(nèi)存的讀寫速度快于外設(shè),所以大部分情況不用設(shè),即不大于0。encoding
為編碼方式- 最后,輸出的
file
是一個文件對象。
其中,mode
包括以下幾種
r | r+ | w | w+ | a | a+ | |
---|---|---|---|---|---|---|
b | rb | rb+ | wb | wb+ | ab | ab+ |
其中,b表示二進制,r表示讀,w表示寫,a表示追加。無論什么模式,有+
則意味著可讀可寫。寫入一般會覆蓋原文件,追加則在原文件尾部開始寫。如果文件不存在,w, w+, a, a+, wb
會創(chuàng)建新文件。
文件對象
通過open
創(chuàng)建的文件對象,除了用于關(guān)閉文件的close
之外,有兩組最常用的函數(shù),即代表讀寫的read
和write
,分別用于讀寫,其區(qū)別如下
read | write | 讀寫整個文件 read(size)可讀取size大小的文件 |
readline | 每次讀一行 由于write直接輸入字符串,故不必設(shè)置writeline |
|
readlines | writelines | 前者按行讀取文件,并存入一個字符串列表 writelines將一個字符串列表的形式寫入文件 |
例如
>>> f = open('test.txt','w') >>> f.writelines(['a','b','c\n','d']) >>> f.close() >>> f = open('test.txt','r') >>> f.readlines() ['abc\n', 'd'] #在寫lines的時候,并不會自動添加\n >>> f.close()
根據(jù)我電腦的性能,讀取500M的txt就要超過1s,讀取2G的文件多半要報錯。這個時候需要通過seek
函數(shù)來指定偏移量,然后在偏移處的位置對文件進行讀寫操作。其輸入為f.seek(offset,whence=0)
其中
offset
為偏移量whence
為偏移方式,為0時表示絕對定位;為1時表示相對定位;為2表示從末尾定位。
從seek
的視角來看,open
文件時,如果用了w
,則代表seek(0)
,如果用了a
,則代表seek(0,2)
。
通過tell
可以返回當(dāng)前偏移量,相當(dāng)于seek
的對偶函數(shù)。
在對文件操作結(jié)束后,需要使用f.close()
將緩存中的字符串寫入硬盤;如果害怕發(fā)生意外,可以用f.flush()
強制寫入。
此外,文件對象的成員變量如下
name | mode | encoding | error | closed | buffer |
---|---|---|---|---|---|
文件名 | 讀寫模式 | 編碼方式 | 錯誤模式 | 是否已經(jīng)關(guān)閉 | 緩沖區(qū) |
此外還有三個判定函數(shù)
readable() |
writable() |
seekable |
---|---|---|
是否可讀 | 是否可寫 | 可否指定偏移量 |
with … as表達式
在寫入文件時,如果忘了close
或者flush
,那么可能還有一些數(shù)據(jù)留在內(nèi)存中,從而導(dǎo)致我們得到的文件是殘缺的。
with as
表達式可以通過調(diào)用對象中的__enter__
方法和__exit__
方法,來更加智能地調(diào)用close
,從而免除了忘寫close
的麻煩。其調(diào)用方法為
with open('text.txt','w') as f: f.write("12345")
查看file.py
,其__exit__
函數(shù)正是close
:
def __enter__(self): return self def __exit__(self, type, value, traceback): self.close()
底層實現(xiàn):os.open
open
是非常方便的函數(shù),但開銷也很大,畢竟直接返回了一個文件對象。相比之下,其底層實現(xiàn)os.open
返回的是一個整型的文件ID,對于在速度上有要求的頻繁的文件讀寫操作,可以考慮使用。
os
中,打開一個文件的方法為
fd = os.open(path, flags, mode=511, dir_fd=None)
其中,
path
為文件路徑flags
為打開標(biāo)志,例如os.O_RDONLY
代表只讀、os.O_WRONLY
代表只寫mode
表示文件權(quán)限,例如777代表任何人可讀可寫可執(zhí)行;511代表文件創(chuàng)建者可讀可執(zhí)行,其他人只可讀,這屬于Linux的內(nèi)容,日后可專門在Linux里說。dir_fd
表示相對路徑的規(guī)則,為自定義函數(shù),比較少用。- 最后,輸出的
fd
是某個文件的標(biāo)識。
其中,mode的取值可見于deepin和windows的手冊,常用的標(biāo)志如下,多個標(biāo)志可通過|
疊加,這一股濃郁的C風(fēng)確認來自操作系統(tǒng)無疑了。
os.open | open | os.open | open |
---|---|---|---|
os.O_RDONLY | ‘r' | os.O_WRONLY | ‘w' |
os.O_RDWR | ‘r+' | os.O_APPEND | ‘a(chǎn)' |
os.O_CREAT | 創(chuàng)建并打開 |
其中相關(guān)的函數(shù)還有:
os.fdopen(fd, mode, bufsize) |
通過fd創(chuàng)建一個文件對象,并返回這個文件對象 |
os.read(fd, n) |
從fd 中讀取最多 n 個字節(jié)并返回,如果fd對應(yīng)文件已達到結(jié)尾, 則返回空串。 |
os.write(fd, str) |
將str 寫入fd,返回實際寫入的字符串長度 |
os.fsync(fd) |
強制將fd所對應(yīng)的文件寫入硬盤 |
os.close(fd) |
關(guān)閉fd |
os.dup(fd) |
復(fù)制fd |
os.dup2(fd, fd2) |
將fd1所對應(yīng)的文件復(fù)制給fd2 |
os.fstat(fd) |
返回fd的狀態(tài) |
os.ftruncate(fd, length) |
裁剪fd, length 不大于文件尺寸 |
os.isatty(fd) |
如果fd已經(jīng)打開,同時與tty(-like)設(shè)備相連,則返回True, 否則False。 |
os.lseek(fd, pos, how) |
設(shè)置fd當(dāng)前位置為pos, how為修改方式,等同于前文中的whence |
到此這篇關(guān)于深入解讀Python如何進行文件讀寫的文章就介紹到這了,更多相關(guān)Python 文件讀寫內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
jupyter notebook 恢復(fù)誤刪單元格或者歷史代碼的實現(xiàn)
這篇文章主要介紹了jupyter notebook 恢復(fù)誤刪單元格或者歷史代碼的實現(xiàn),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-04-04python 函數(shù)內(nèi)部修改外部變量的方法
今天小編就為大家分享一篇python 函數(shù)內(nèi)部修改外部變量的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-12-12Python numpy.array()生成相同元素數(shù)組的示例
今天小編就為大家分享一篇Python numpy.array()生成相同元素數(shù)組的示例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-11-11python+opencv實現(xiàn)攝像頭調(diào)用的方法
這篇文章主要為大家詳細介紹了python+opencv實現(xiàn)攝像頭調(diào)用的方法,具有一定的參考價值,感興趣的小伙伴們可以參考一下2019-06-06基于django和dropzone.js實現(xiàn)上傳文件
這篇文章主要介紹了基于django和dropzone.js實現(xiàn)上傳文件,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-11-11