Python使用fliecmp實(shí)現(xiàn)比較文件的操作
前言
對(duì)于文件的比較一般有幾種,比如比較文件的內(nèi)容,比較文件的大小,或者直接對(duì)比整個(gè)項(xiàng)目文件。特別是在項(xiàng)目的更新迭代中,可以通過該庫來比較當(dāng)前版本與之前版本有哪些文件不同。
所以,本篇將詳細(xì)講解Python的文件比較庫:filecmp。
生成示例文件
在比較文件之前,我們首先需要有用于比較的文件。所以,為了后面的測(cè)試,我們先來創(chuàng)建一些文件。示例如下:
def mkfile(filename,content): with open(filename,'w') as f: f.write(content or filename) return mkfile('filecmps/one.txt','1212121212') mkfile('filecmps/two.txt','1212121212') mkfile('filecmps/three.txt','333333333')
這里,我們先創(chuàng)建3個(gè)文件,其中2個(gè)文件的內(nèi)容相等。
cmp()(比較文件)
fliecmp庫提供了cmp()函數(shù)用于比較文件系統(tǒng)上的兩個(gè)文件。示例如下:
import filecmp print(filecmp.cmp('filecmps/one.txt', 'filecmps/two.txt', shallow=False)) print(filecmp.cmp('filecmps/one.txt', 'filecmps/three.txt', shallow=False)) print(filecmp.cmp('filecmps/one.txt', 'filecmps/two.txt')) print(filecmp.cmp('filecmps/one.txt', 'filecmps/one.txt'))
運(yùn)行之后,效果如下:
如果參數(shù)shallow為True,只判斷os.stat()函數(shù)返回內(nèi)容是否相同,如果相同就返回True,否則再比較文件內(nèi)容是否相同,如果相同也返回True。使用shallow參數(shù)可以快速地比較文件是否有修改過。(shallow參數(shù)默認(rèn)為True)
cmpfiles()(比較一組文件)
cmp()函數(shù)用于單個(gè)文件的比較,而要對(duì)比兩個(gè)目錄中的一組文件,我們需要使用cmpfiles()函數(shù),示例如下:
import filecmp print(filecmp.cmpfiles('filecmps', 'text', common=['13.png', '14.png', 'one.txt']))
運(yùn)行之后,效果如下:
這里返回了3個(gè)列表,分別是相同列表,不同列表以及錯(cuò)誤列表。相同列表放的是兩個(gè)目錄中相同的文件,不同列表是兩個(gè)目錄中不同的文件,但需要注意common指定了需要對(duì)比的文件,也就是說這3個(gè)列表的每個(gè)文件必須在common指定中才會(huì)用于對(duì)比,不指定不會(huì)對(duì)比也不會(huì)存在于列表中,哪怕文件夾下面有其他文件。錯(cuò)誤列表指的是某個(gè)目錄根本沒有該文件。
dircmp()(比較目錄)
前面2個(gè)函數(shù)都是針對(duì)文件進(jìn)行的比較,但是項(xiàng)目文件的迭代對(duì)比往往直接對(duì)比的是整個(gè)目錄結(jié)構(gòu),所以我們還需要掌握目錄的比較。fliecmp庫提供的目錄比較函數(shù)為:dircmp()。示例如下:
import filecmp dc = filecmp.dircmp('filecmps', 'text') dc.report()
運(yùn)行之后,效果如下:
第1行為對(duì)比的兩個(gè)文件夾,第2第3行為對(duì)比的兩個(gè)目錄中的所有文件。第4行是對(duì)比后的結(jié)果,這里只有3個(gè)文件完全相同。但是需要注意的是,report()函數(shù)只是用于比較當(dāng)前目錄下的文件,不包括里面文件夾以及文件夾下面的文件。如果需要遞歸比較所有目錄文件,需要用到report_full_closure()。
示例如下:
import filecmp dc = filecmp.dircmp('filecmps', 'text') dc.report_full_closure()
運(yùn)行之后,效果如下:
left_list與right_list
在對(duì)比文件之前,我們可以列出所比較目錄中的文件以及子目錄。示例如下:
import filecmp dc = filecmp.dircmp('filecmps', 'text') print(dc.left_list) print(dc.right_list)
運(yùn)行之后,效果如下:
left_list為第1個(gè)參數(shù)的目錄,right_list為第2個(gè)參數(shù)的目錄,把2個(gè)參數(shù)看成左右,自然很好區(qū)分。
忽略部分文件進(jìn)行對(duì)比
在對(duì)比兩個(gè)目錄的所有文件之時(shí),我們還可以手動(dòng)的過濾掉不需要對(duì)比的文件及文件夾,比如我們不對(duì)比文件中的123文件夾中的所有文件,可以直接這樣操作:
import filecmp dc = filecmp.dircmp('filecmps', 'text',ignore=['123']) dc.report_full_closure()
運(yùn)行之后,效果如下:
report_full_closure()函數(shù)本來需要一層一層目錄去對(duì)比的。這里,博主過濾掉了其唯一的子目錄123,所以只存在一層文件的對(duì)比。目錄結(jié)構(gòu)如下:
其他屬性
除了這些方法與屬性之外,還有其他的屬性供開發(fā)者調(diào)用,比如只查找相同的文件,或者只判斷某個(gè)目錄的獨(dú)有文件,可以這樣操作:
import filecmp dc = filecmp.dircmp('filecmps', 'text') print(dc.common) print(dc.right_only) print(dc.left_only)
運(yùn)行之后,效果如下:
common:為2目錄同時(shí)存在的文件名
right_only:為右目錄獨(dú)有的文件
left_only:為左目錄獨(dú)有的文件。
這里的common公共目錄還可以進(jìn)一步的操作,示例如下:
import filecmp dc = filecmp.dircmp('filecmps', 'text') print(dc.common_dirs) print(dc.common_files) print(dc.common_funny)
運(yùn)行之后,效果如下:
common_dirs:公共的文件夾
common_files:公共的文件
common_funny: 2個(gè)目錄中類型不同的內(nèi)容,或os.stat()指出的有錯(cuò)誤的地方(可以簡(jiǎn)單的理解有一個(gè)文件夾是123,一個(gè)文件也是123,那么就會(huì)出現(xiàn)在common_files中)
以上是相同的劃分,我們還有不同的劃分,示例如下:
import filecmp dc = filecmp.dircmp('filecmps', 'text') print(dc.same_files) print(dc.diff_files) print(dc.funny_files)
這里一一對(duì)應(yīng)上面的公共,只是是不同的不是公共的。運(yùn)行之后,效果如下:
最后還有一個(gè)屬性:subdirs,用于將目錄名映射到新的dircmp對(duì)象。示例如下:
import filecmp dc = filecmp.dircmp('filecmps', 'text') print(dc.subdirs)
運(yùn)行之后,效果如下:
到此這篇關(guān)于Python使用fliecmp實(shí)現(xiàn)比較文件的操作的文章就介紹到這了,更多相關(guān)Python 比較文件內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Pandas常用的數(shù)據(jù)結(jié)構(gòu)和常用的數(shù)據(jù)分析技術(shù)
Pandas是Python中用于數(shù)據(jù)處理和分析的強(qiáng)大庫,其最常用的數(shù)據(jù)結(jié)構(gòu)是Series和DataFrame。Series類似于一維數(shù)組,可以表示一列數(shù)據(jù);DataFrame類似于二維表格,可以表示多列數(shù)據(jù)2023-04-04Django框架創(chuàng)建mysql連接與使用示例
這篇文章主要介紹了Django框架創(chuàng)建mysql連接與使用,簡(jiǎn)單介紹了Linux環(huán)境下mysql的安裝,并結(jié)合實(shí)例形式分析了Django框架基于第三方庫pymysql連接mysql數(shù)據(jù)庫相關(guān)操作技巧,需要的朋友可以參考下2019-07-07Python pyecharts實(shí)現(xiàn)繪制中國地圖的實(shí)例詳解
pyecharts是一個(gè)用于生成 Echarts 圖表的類庫。Echarts 是百度開源的一個(gè)數(shù)據(jù)可視化 JS 庫。用 Echarts 生成的圖可視化效果非常棒。本文將通過pyecharts繪制中國地圖,需要的可以學(xué)習(xí)一下2022-01-01Python實(shí)現(xiàn)Excel做表自動(dòng)化的最全方法合集
Microsoft?Excel?是一款強(qiáng)大的辦公工具,廣泛用于數(shù)據(jù)分析、報(bào)告制作、預(yù)算管理等各種任務(wù),本文將深入探討如何使用?Python?進(jìn)行?Excel?表格的自動(dòng)化,需要的可以參考下2024-02-02jupyter notebook插入本地圖片的實(shí)現(xiàn)
這篇文章主要介紹了jupyter notebook插入本地圖片的實(shí)現(xiàn),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2020-04-04Python趣味挑戰(zhàn)之pygame實(shí)現(xiàn)無敵好看的百葉窗動(dòng)態(tài)效果
最近寫了很多期關(guān)于pygame的案例和知識(shí)點(diǎn),自己也收獲了很多知識(shí),也在這個(gè)過程中成長(zhǎng)了不少, 這次還是圍繞surface對(duì)象進(jìn)行詳細(xì)介紹,并形成完整的案例過程,文中有非常詳細(xì)實(shí)現(xiàn)百葉窗動(dòng)態(tài)效果的代碼示例,需要的朋友可以參考下2021-05-05