Python文件路徑模式匹配glob模塊使用詳解
一、glob 模塊概述
glob 模塊可根據(jù)指定的模式來查找文件和目錄,它支持使用通配符進行模糊匹配。主要通過 glob 和 iglob 兩個函數(shù)來實現(xiàn)文件路徑的模式匹配,能處理簡單的文件名模式,如 *.txt 可匹配所有擴展名為 .txt 的文件。
二、通配符規(guī)則
(一)* 通配符
- 功能:匹配任意數(shù)量(包括零個)的任意字符。
- 示例:
import glob
# 匹配當前目錄下所有擴展名為 .txt 的文件
txt_files = glob.glob('*.txt')
for file in txt_files:
print(file)
上述代碼中,*.txt 表示匹配當前目錄下文件名任意,但擴展名為 .txt 的所有文件。
(二)? 通配符
- 功能:匹配單個任意字符。
- 示例:
import glob
# 匹配當前目錄下文件名只有一個字符且擴展名為 .py 的文件
single_char_py_files = glob.glob('?.py')
for file in single_char_py_files:
print(file)
這里,?.py 表示文件名只有一個字符,擴展名為 .py 的文件。
(三)[] 通配符
功能:匹配方括號內(nèi)指定的任意一個字符。
示例:
import glob
# 匹配當前目錄下文件名以 a 或 b 開頭且擴展名為 .txt 的文件
ab_txt_files = glob.glob('[ab]*.txt')
for file in ab_txt_files:
print(file)
[ab]*.txt 表示文件名以 a 或 b 開頭,擴展名為 .txt 的文件。
(四)** 通配符(遞歸匹配)
- 功能:在路徑中使用
**表示遞歸匹配目錄。在 Python 3.5 及以上版本支持。 - 示例:
import glob
# 遞歸匹配當前目錄及其子目錄下所有擴展名為 .txt 的文件
all_txt_files = glob.glob('**/*.txt', recursive=True)
for file in all_txt_files:
print(file)
**/*.txt 結(jié)合 recursive=True 會遞歸查找當前目錄及其所有子目錄下的 .txt 文件。
三、glob 函數(shù)
(一)glob.glob(pathname, *, recursive=False)
功能:返回一個符合指定模式的文件和目錄路徑列表。
參數(shù):
pathname:要匹配的路徑模式。recursive:是否進行遞歸匹配,默認為False。當設置為True時,支持使用**通配符進行遞歸查找。
示例:
import glob
# 匹配當前目錄及其子目錄下所有以 test 開頭的文件
test_files = glob.glob('**/test*', recursive=True)
for file in test_files:
print(file)
四、iglob 函數(shù)
(一)glob.iglob(pathname, *, recursive=False)
- 功能:返回一個迭代器,該迭代器會逐個產(chǎn)生符合指定模式的文件和目錄路徑。
- 參數(shù):與
glob.glob相同。 - 示例:
import glob
# 使用 iglob 迭代匹配當前目錄下所有 .py 文件
py_files_iter = glob.iglob('*.py')
for file in py_files_iter:
print(file)
iglob 適合處理大量匹配結(jié)果的情況,因為它不會一次性生成所有匹配結(jié)果,而是逐個產(chǎn)生,節(jié)省內(nèi)存。
五、glob 與其他文件查找方式的對比
| 查找方式 | 優(yōu)點 | 缺點 | 適用場景 |
|---|---|---|---|
glob 模塊 | 使用簡單,支持通配符匹配,能快速查找符合模式的文件和目錄。 | 模式匹配功能相對簡單,不支持復雜的正則表達式匹配。 | 簡單的文件和目錄查找,如按擴展名、文件名前綴等查找。 |
os.walk 函數(shù) | 可以遞歸遍歷目錄樹,能詳細控制遍歷過程。 | 需要手動編寫代碼進行文件篩選,使用相對復雜。 | 需要對目錄樹進行深度遍歷和復雜篩選的場景。 |
re 模塊(正則表達式) | 支持復雜的模式匹配,功能強大。 | 學習成本較高,代碼相對復雜。 | 需要進行復雜文件名模式匹配的場景。 |
六、應用場景
(一)批量文件處理
可以使用 glob 模塊查找符合特定模式的文件,然后對這些文件進行批量處理,如批量重命名、批量讀取文件內(nèi)容等。
import glob
# 批量重命名當前目錄下所有 .txt 文件
txt_files = glob.glob('*.txt')
for file in txt_files:
new_name = file.replace('.txt', '_new.txt')
import os
os.rename(file, new_name)
(二)數(shù)據(jù)收集
在進行數(shù)據(jù)收集時,可能需要從多個文件中讀取數(shù)據(jù)??梢允褂?nbsp;glob 模塊查找相關(guān)文件,然后讀取數(shù)據(jù)。
import glob
# 讀取當前目錄及其子目錄下所有 .csv 文件的數(shù)據(jù)
csv_files = glob.glob('**/*.csv', recursive=True)
for file in csv_files:
with open(file, 'r') as f:
data = f.read()
print(f"Data from {file}: {data[:100]}...")
文章總結(jié)
glob 模塊為 Python 開發(fā)者提供了一種便捷的文件和目錄查找方式,通過使用 Unix 風格的通配符規(guī)則,能快速定位符合特定模式的文件和目錄。glob.glob 函數(shù)返回匹配結(jié)果列表,glob.iglob 函數(shù)返回迭代器,適用于不同的應用場景。在簡單的文件查找和批量處理任務中,glob 模塊是一個非常實用的工具。
到此這篇關(guān)于Python文件路徑模式匹配glob模塊使用的文章就介紹到這了,更多相關(guān)Python文件路徑模式匹配glob模塊內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python利用sqlacodegen自動生成ORM實體類示例
這篇文章主要介紹了Python利用sqlacodegen自動生成ORM實體類,結(jié)合實例形式分析了Python sqlacodegen安裝技巧ORM實體類相關(guān)實現(xiàn)技巧,需要的朋友可以參考下2019-06-06
Tensorflow分類器項目自定義數(shù)據(jù)讀入的實現(xiàn)
這篇文章主要介紹了Tensorflow分類器項目自定義數(shù)據(jù)讀入的實現(xiàn),小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2019-02-02
利用 Python 實現(xiàn)隨機相對強弱指數(shù) StochRSI
隨機相對強弱指數(shù)簡稱為StochRSI,是一種技術(shù)分析指標,用于確定資產(chǎn)是否處于超買或超賣狀態(tài),也用于確定當前市場的態(tài)勢。本篇文章小編九來為大家介紹隨機相對強弱指數(shù)簡稱為StochRSI,需要的朋友可以參考下面文章的具體內(nèi)容2021-09-09
Python+Pygame實戰(zhàn)之瘋狂吃水果游戲的實現(xiàn)
吃豆人和切水果這兩個游戲相信大家都不陌生吧,本文將利用Python中的Pygame模塊編寫出一款結(jié)合吃豆人+切水果的新游戲:瘋狂吃水果,感興趣的可以了解一下2022-06-06

