使用 Python 實現(xiàn)文件遞歸遍歷的三種方式
今天有個腳本需要遍歷獲取某指定文件夾下面的所有文件,我記得很早前也實現(xiàn)過文件遍歷和目錄遍歷的功能,于是找來看一看,嘿,不看不知道,看了嚇一跳,原來之前我竟然用了這么搓的實現(xiàn)。
先發(fā)出來看看:
def getallfiles(dir): """遍歷獲取指定文件夾下面所有文件""" if os.path.isdir(dir): filelist = os.listdir(dir) for ret in filelist: filename = dir + "\\" + ret if os.path.isfile(filename): print filename def getalldirfiles(dir, basedir): """遍歷獲取所有子文件夾下面所有文件""" if os.path.isdir(dir): getallfiles(dir) dirlist = os.listdir(dir) for dirret in dirlist: fullname = dir + "\\" + dirret if os.path.isdir(fullname): getalldirfiles(fullname, basedir)
我是用了 2 個函數(shù),并且每個函數(shù)都用了一次 listdir,只是一次用來過濾文件,一次用來過濾文件夾,如果只是從功能實現(xiàn)上看,一點問題沒有,但是這…太不優(yōu)雅了吧。
開始著手優(yōu)化,方案一:
def getallfiles(dir): """使用listdir循環(huán)遍歷""" if not os.path.isdir(dir): print dir return dirlist = os.listdir(dir) for dirret in dirlist: fullname = dir + "\\" + dirret if os.path.isdir(fullname): getallfiles(fullname) else: print fullname
從上圖可以看到,我把兩個函數(shù)合并成了一個,只調(diào)用了一次 listdir,把文件和文件夾用 if~else~ 進(jìn)行了分支處理,當(dāng)然,自我調(diào)用的循環(huán)還是存在。
有木有更好的方式呢?網(wǎng)上一搜一大把,原來有一個現(xiàn)成的 os.walk() 函數(shù)可以用來處理文件(夾)的遍歷,這樣優(yōu)化下就更簡單了。
方案二:
def getallfilesofwalk(dir): """使用listdir循環(huán)遍歷""" if not os.path.isdir(dir): print dir return dirlist = os.walk(dir) for root, dirs, files in dirlist: for file in files: print os.path.join(root, file)
只是從代碼實現(xiàn)上看,方案二是最優(yōu)雅簡潔的了,但是再翻看 os.walk() 實現(xiàn)的源碼就會發(fā)現(xiàn),其實它內(nèi)部還是調(diào)用的 listdir 完成具體的功能實現(xiàn),只是它對輸出結(jié)果做了下額外的處理而已。
附上os.walk()的源碼:
from os.path import join, isdir, islink # We may not have read permission for top, in which case we can't # get a list of the files the directory contains. os.path.walk # always suppressed the exception then, rather than blow up for a # minor reason when (say) a thousand readable directories are still # left to visit. That logic is copied here. try: # Note that listdir and error are globals in this module due # to earlier import-*. names = listdir(top) except error, err: if onerror is not None: onerror(err) return dirs, nondirs = [], [] for name in names: if isdir(join(top, name)): dirs.append(name) else: nondirs.append(name) if topdown: yield top, dirs, nondirs for name in dirs: path = join(top, name) if followlinks or not islink(path): for x in walk(path, topdown, onerror, followlinks): yield x if not topdown: yield top, dirs, nondirs
至于 listdir 和 walk 在輸出時的不同點,主要就是 listdir 默認(rèn)是按照文件和文件夾存放的字母順序進(jìn)行輸出,而 walk 則是先輸出頂級文件夾,然后是頂級文件,再輸出第二級文件夾,以及第二級文件,以此類推,具體大家可以把上面腳本拷貝后自行驗證。
總結(jié)
以上所述是小編給大家介紹的使用 Python 實現(xiàn)文件遞歸遍歷的三種方式,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復(fù)大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
相關(guān)文章
python學(xué)習(xí)教程之socket庫的基本使用(網(wǎng)絡(luò)編程-套接字)
Python中的socket模塊提供了網(wǎng)絡(luò)編程中的套接字(socket)功能,通過套接字我們可以實現(xiàn)不同計算機之間的通信,這篇文章主要給大家介紹了關(guān)于python學(xué)習(xí)教程之socket庫的基本使用,需要的朋友可以參考下2024-07-07pandas中fillna()函數(shù)填充NaN和None的實現(xiàn)
本文主要介紹了pandas中fillna()函數(shù)填充NaN和None的實現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-01-01Python實現(xiàn)的遠(yuǎn)程文件自動打包并下載功能示例
這篇文章主要介紹了Python實現(xiàn)的遠(yuǎn)程文件自動打包并下載功能,結(jié)合實例形式分析了Python使用spawn()方法執(zhí)行ssh、scp 命令實現(xiàn)遠(yuǎn)程文件的相關(guān)操作技巧,需要的朋友可以參考下2019-07-07python3之讀取redis數(shù)據(jù)帶有‘b’的問題
這篇文章主要介紹了python3之讀取redis數(shù)據(jù)帶有‘b’的問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-09-09解決ModuleNotFoundError: No module named ‘
這篇文章主要介紹了解決ModuleNotFoundError: No module named ‘flask._compat的問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2024-06-06關(guān)于Python-faker的函數(shù)效果一覽
今天小編就為大家分享一篇關(guān)于Python-faker的函數(shù)效果一覽,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-11-11