深入解讀Python如何進行文件讀寫
open
Python提供了非常方便的文件讀寫功能,其中open
是讀寫文件的第一步,通過open
讀寫文件的方式和把大象裝冰箱是一樣的
f = open("test.txt",'w') #第一步,把冰箱門(文件)打開 f.write("this is content") #第二步,把大象(文件內容)裝進去 f.close() #第三步,把冰箱門關上,否則大象可能會跑掉
open
的定義方式為
file=open(path,mode='r',buffering=-1,encoding=None)
其中,
path
為文件路徑mode
為讀取模式,默認為r
,即只讀模式。buffering
為緩沖區(qū),由于內存的讀寫速度快于外設,所以大部分情況不用設,即不大于0。encoding
為編碼方式- 最后,輸出的
file
是一個文件對象。
其中,mode
包括以下幾種
r | r+ | w | w+ | a | a+ | |
---|---|---|---|---|---|---|
b | rb | rb+ | wb | wb+ | ab | ab+ |
其中,b表示二進制,r表示讀,w表示寫,a表示追加。無論什么模式,有+
則意味著可讀可寫。寫入一般會覆蓋原文件,追加則在原文件尾部開始寫。如果文件不存在,w, w+, a, a+, wb
會創(chuàng)建新文件。
文件對象
通過open
創(chuàng)建的文件對象,除了用于關閉文件的close
之外,有兩組最常用的函數,即代表讀寫的read
和write
,分別用于讀寫,其區(qū)別如下
read | write | 讀寫整個文件 read(size)可讀取size大小的文件 |
readline | 每次讀一行 由于write直接輸入字符串,故不必設置writeline |
|
readlines | writelines | 前者按行讀取文件,并存入一個字符串列表 writelines將一個字符串列表的形式寫入文件 |
例如
>>> f = open('test.txt','w') >>> f.writelines(['a','b','c\n','d']) >>> f.close() >>> f = open('test.txt','r') >>> f.readlines() ['abc\n', 'd'] #在寫lines的時候,并不會自動添加\n >>> f.close()
根據我電腦的性能,讀取500M的txt就要超過1s,讀取2G的文件多半要報錯。這個時候需要通過seek
函數來指定偏移量,然后在偏移處的位置對文件進行讀寫操作。其輸入為f.seek(offset,whence=0)
其中
offset
為偏移量whence
為偏移方式,為0時表示絕對定位;為1時表示相對定位;為2表示從末尾定位。
從seek
的視角來看,open
文件時,如果用了w
,則代表seek(0)
,如果用了a
,則代表seek(0,2)
。
通過tell
可以返回當前偏移量,相當于seek
的對偶函數。
在對文件操作結束后,需要使用f.close()
將緩存中的字符串寫入硬盤;如果害怕發(fā)生意外,可以用f.flush()
強制寫入。
此外,文件對象的成員變量如下
name | mode | encoding | error | closed | buffer |
---|---|---|---|---|---|
文件名 | 讀寫模式 | 編碼方式 | 錯誤模式 | 是否已經關閉 | 緩沖區(qū) |
此外還有三個判定函數
readable() |
writable() |
seekable |
---|---|---|
是否可讀 | 是否可寫 | 可否指定偏移量 |
with … as表達式
在寫入文件時,如果忘了close
或者flush
,那么可能還有一些數據留在內存中,從而導致我們得到的文件是殘缺的。
with as
表達式可以通過調用對象中的__enter__
方法和__exit__
方法,來更加智能地調用close
,從而免除了忘寫close
的麻煩。其調用方法為
with open('text.txt','w') as f: f.write("12345")
查看file.py
,其__exit__
函數正是close
:
def __enter__(self): return self def __exit__(self, type, value, traceback): self.close()
底層實現:os.open
open
是非常方便的函數,但開銷也很大,畢竟直接返回了一個文件對象。相比之下,其底層實現os.open
返回的是一個整型的文件ID,對于在速度上有要求的頻繁的文件讀寫操作,可以考慮使用。
os
中,打開一個文件的方法為
fd = os.open(path, flags, mode=511, dir_fd=None)
其中,
path
為文件路徑flags
為打開標志,例如os.O_RDONLY
代表只讀、os.O_WRONLY
代表只寫mode
表示文件權限,例如777代表任何人可讀可寫可執(zhí)行;511代表文件創(chuàng)建者可讀可執(zhí)行,其他人只可讀,這屬于Linux的內容,日后可專門在Linux里說。dir_fd
表示相對路徑的規(guī)則,為自定義函數,比較少用。- 最后,輸出的
fd
是某個文件的標識。
其中,mode的取值可見于deepin和windows的手冊,常用的標志如下,多個標志可通過|
疊加,這一股濃郁的C風確認來自操作系統(tǒng)無疑了。
os.open | open | os.open | open |
---|---|---|---|
os.O_RDONLY | ‘r' | os.O_WRONLY | ‘w' |
os.O_RDWR | ‘r+' | os.O_APPEND | ‘a' |
os.O_CREAT | 創(chuàng)建并打開 |
其中相關的函數還有:
os.fdopen(fd, mode, bufsize) |
通過fd創(chuàng)建一個文件對象,并返回這個文件對象 |
os.read(fd, n) |
從fd 中讀取最多 n 個字節(jié)并返回,如果fd對應文件已達到結尾, 則返回空串。 |
os.write(fd, str) |
將str 寫入fd,返回實際寫入的字符串長度 |
os.fsync(fd) |
強制將fd所對應的文件寫入硬盤 |
os.close(fd) |
關閉fd |
os.dup(fd) |
復制fd |
os.dup2(fd, fd2) |
將fd1所對應的文件復制給fd2 |
os.fstat(fd) |
返回fd的狀態(tài) |
os.ftruncate(fd, length) |
裁剪fd, length 不大于文件尺寸 |
os.isatty(fd) |
如果fd已經打開,同時與tty(-like)設備相連,則返回True, 否則False。 |
os.lseek(fd, pos, how) |
設置fd當前位置為pos, how為修改方式,等同于前文中的whence |
到此這篇關于深入解讀Python如何進行文件讀寫的文章就介紹到這了,更多相關Python 文件讀寫內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
jupyter notebook 恢復誤刪單元格或者歷史代碼的實現
這篇文章主要介紹了jupyter notebook 恢復誤刪單元格或者歷史代碼的實現,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-04-04Python numpy.array()生成相同元素數組的示例
今天小編就為大家分享一篇Python numpy.array()生成相同元素數組的示例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-11-11