Python實(shí)現(xiàn)讀取文件中的特定行的方法詳解
在Python中,讀取文件中的特定行通常涉及到幾個(gè)步驟:打開(kāi)文件,遍歷行,然后定位到你感興趣的行。下面是一個(gè)簡(jiǎn)單的例子,說(shuō)明如何讀取文件中的特定行(例如第n行):
def read_specific_line(file_path, line_number): with open(file_path, 'r') as file: # 逐行讀取文件,直到找到所需的行號(hào) for i, line in enumerate(file, 1): if i == line_number: return line.strip() # strip() 用于移除行尾的換行符 return None # 如果沒(méi)有找到指定行號(hào),則返回None # 替換為你的文件路徑和要讀取的行號(hào) file_path = "path_to_your_file.txt" line_number = 5 # 讀取第5行 # 調(diào)用函數(shù)并打印結(jié)果 specific_line = read_specific_line(file_path, line_number) if specific_line: print(f"Line {line_number}: {specific_line}") else: print(f"Line {line_number} not found in the file.")
在這個(gè)例子中,enumerate()函數(shù)用于在遍歷文件的同時(shí)計(jì)數(shù)行號(hào)。enumerate()的第二個(gè)參數(shù)1是起始計(jì)數(shù)值,因?yàn)槲覀兺ǔUJ(rèn)為文件的第一行是行號(hào)1。strip()方法用于移除行尾的換行符(\n),這樣你就可以得到一個(gè)干凈的字符串。
如果你知道文件不是特別大,并且想直接訪問(wèn)特定行而不需要遍歷整個(gè)文件,你也可以先將所有行讀入一個(gè)列表,然后直接通過(guò)索引訪問(wèn):
def read_specific_line_direct(file_path, line_number): with open(file_path, 'r') as file: lines = file.readlines() # 讀取所有行到列表中 if 0 < line_number <= len(lines): return lines[line_number - 1].strip() # 注意列表索引是從0開(kāi)始的,所以要減1 return None # 使用與之前相同的文件路徑和行號(hào) file_path = "path_to_your_file.txt" line_number = 5 # 調(diào)用函數(shù)并打印結(jié)果 specific_line = read_specific_line_direct(file_path, line_number) if specific_line: print(f"Line {line_number}: {specific_line}") else: print(f"Line {line_number} not found in the file.")
請(qǐng)注意,這種方法將整個(gè)文件內(nèi)容加載到內(nèi)存中,因此對(duì)于非常大的文件可能會(huì)導(dǎo)致性能問(wèn)題或內(nèi)存不足。在大多數(shù)情況下,第一種方法(逐行讀?。┦歉扇〉倪x擇,因?yàn)樗屿`活且內(nèi)存效率更高。
方法補(bǔ)充
除了上文的方法,小編還為大家整理了一下其他Python讀取文件指定行的方法,希望對(duì)大家有所幫助
python讀取文件指定行的三種方法
1.行遍歷實(shí)現(xiàn)
在python中如果要將一個(gè)文件完全加載到內(nèi)存中,通過(guò)file.readlines()即可,但是在文件占用較高時(shí),我們是無(wú)法完整的將文件加載到內(nèi)存中的,這時(shí)候就需要用到python的file.readline()進(jìn)行迭代式的逐行讀?。?/p>
filename = 'hello.txt' with open(filename, 'r') as file: line = file.readline() counts = 1 while line: if counts >= 50000000: break line = file.readline() ??????? counts += 1
這里我們的實(shí)現(xiàn)方式是先用一個(gè)with語(yǔ)句打開(kāi)一個(gè)文件,然后用readline()函數(shù)配合while循環(huán)逐行加載,最終通過(guò)一個(gè)序號(hào)標(biāo)記來(lái)結(jié)束循環(huán)遍歷,輸出文件第50000000行的內(nèi)容。該代碼的執(zhí)行效果如下:
dechin@ubuntu2004:~/projects/gitlab/dechin/$ time python3 get_line.py
real 0m10.359s
user 0m10.062s
sys 0m0.296s
可以看到這里的耗時(shí)為10s多一些。
2.linecache實(shí)現(xiàn)
雖然在python的readline函數(shù)中并沒(méi)有實(shí)現(xiàn)讀取指定行內(nèi)容的方案,但是在另一個(gè)庫(kù)linecache中是實(shí)現(xiàn)了的,由于使用的方式較為簡(jiǎn)單,這里直接放上代碼示例供參考:
filename = 'hello.txt' import linecache text = linecache.getline(filename, 50000000)
該代碼的執(zhí)行結(jié)果如下:
dechin@ubuntu2004:~/projects/gitlab/dechin/$ time python3 get_line.py
real 0m11.904s
user 0m5.672s
sys 0m6.231s
雖然在實(shí)現(xiàn)方式上簡(jiǎn)化了許多,但是我們發(fā)現(xiàn)這個(gè)實(shí)現(xiàn)的用時(shí)超過(guò)了11s,還不如我們自己手動(dòng)實(shí)現(xiàn)的循環(huán)遍歷方案。因此如果是對(duì)于性能有一定要求的場(chǎng)景,是不建議采用這個(gè)方案的。
3.命令行sed獲取
我們知道用Linux系統(tǒng)本身自帶的sed指令也是可以獲取到文件指定行或者是指定行范圍的數(shù)據(jù)的,其執(zhí)行指令為:sed -n 50000000p filename即表示讀取文件的第50000000行的內(nèi)容。同時(shí)結(jié)合python的話,我們可以在python代碼中執(zhí)行系統(tǒng)指令并獲取輸出結(jié)果:
filename = 'hello.txt' import os result = os.popen('sed -n {}p {}'.format(50000000, filename)).read()
需要注意的是,如果直接運(yùn)行os.system()是沒(méi)有返回值的,只有os.popen()是有返回值的,并且需要在尾巴加上一個(gè)read()的選項(xiàng)。該代碼的執(zhí)行結(jié)果如下:
dechin@ubuntu2004:~/projects/gitlab/dechin/$ time python3 get_line.py
real 0m2.532s
user 0m0.032s
sys 0m0.020s
可以看到直接使用sed指令的執(zhí)行速度很快,但是用這種方法并不是一本萬(wàn)利的,比如以下這個(gè)例子:
filename = 'hello.txt' import os result = os.popen('sed -n {}p {}'.format(500, filename)).read()
我們把讀取第50000000行內(nèi)容改為讀取第500行的內(nèi)容,再運(yùn)行一次程序:
dechin@ubuntu2004:~/projects/gitlab/dechin/$ time python3 get_line.py
real 0m2.540s
user 0m0.037ssys 0m0.013s
然而我們發(fā)現(xiàn)這個(gè)速度并沒(méi)有因?yàn)橐x取的行數(shù)減少了而變少,而是幾乎保持不變的。
到此這篇關(guān)于Python實(shí)現(xiàn)讀取文件中的特定行的方法詳解的文章就介紹到這了,更多相關(guān)Python讀取文件特定行內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
簡(jiǎn)單介紹Python中的len()函數(shù)的使用
這篇文章主要簡(jiǎn)單介紹了Python中的len()函數(shù)的使用,包括在四種情況下的使用小例子,是Python學(xué)習(xí)當(dāng)中的基礎(chǔ)知識(shí),需要的朋友可以參考下2015-04-04Python tempfile模塊學(xué)習(xí)筆記(臨時(shí)文件)
這篇文章主要介紹了Python tempfile模塊學(xué)習(xí)筆記,著重講解了模塊下的幾個(gè)函數(shù),需要的朋友可以參考下2014-05-05一起用Python做個(gè)上課點(diǎn)名器的制作過(guò)程
今天給大家分享一個(gè)讀者粉絲投稿的,關(guān)于上課點(diǎn)名的實(shí)戰(zhàn)案例,對(duì)Python上課點(diǎn)名器實(shí)現(xiàn)過(guò)程感興趣的朋友,一起來(lái)看看是如何實(shí)現(xiàn)的吧2021-09-09Flask使用SQLAlchemy實(shí)現(xiàn)持久化數(shù)據(jù)
本文主要介紹了Flask使用SQLAlchemy實(shí)現(xiàn)持久化數(shù)據(jù),文中通過(guò)示例代碼介紹的非常詳細(xì),需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-07-07python3.6.3轉(zhuǎn)化為win-exe文件發(fā)布的方法
今天小編就為大家分享一篇python3.6.3轉(zhuǎn)化為win-exe文件發(fā)布的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-10-10關(guān)于Python包導(dǎo)入報(bào)錯(cuò)的問(wèn)題總結(jié)
這篇文章主要介紹了關(guān)于Python包導(dǎo)入報(bào)錯(cuò)的問(wèn)題總結(jié),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-02-02python熱力圖實(shí)現(xiàn)的完整實(shí)例
熱力圖的使用場(chǎng)景有描述數(shù)據(jù)在空間的密集程度,常見(jiàn)有城市熱力圖、區(qū)域熱力圖,描述多個(gè)變量之間相關(guān)性高低程度,這篇文章主要給大家介紹了關(guān)于python熱力圖實(shí)現(xiàn)的相關(guān)資料,需要的朋友可以參考下2022-06-06