Python在后臺(tái)自動(dòng)解壓各種壓縮文件的實(shí)現(xiàn)方法
1.需求描述
編寫(xiě)一個(gè) Python 程序,每次下載壓縮包形式的文件后,自動(dòng)將內(nèi)部文件解壓到當(dāng)前文件夾后將壓縮包刪除,通過(guò)本案例可以學(xué)到的知識(shí)點(diǎn):
- os 模塊綜合應(yīng)用
- glob 模塊綜合應(yīng)用
- 利用 gzip zipfile rarfile tarfile 模塊解壓文件
2.步驟分析和前置知識(shí)
碼代碼之前需要將復(fù)雜問(wèn)題解釋成多個(gè)明確的要求,即這個(gè)程序?qū)崿F(xiàn)的邏輯為:
- 定時(shí)檢測(cè)某個(gè)文件夾(如 download 文件夾)是否存在壓縮文件
- 如果有新出現(xiàn)的壓縮文件則將其解壓到當(dāng)前文件夾內(nèi)的新文件夾中 刪除壓縮文件
- 提到壓縮文件就要分不同壓縮格式進(jìn)行討論,主要有以下4種:
提到壓縮文件就要分不同壓縮格式進(jìn)行討論,主要有以下4種:
.gz: 即 gzip,通常只能壓縮一個(gè)文件
.tar: 本質(zhì)上不是壓縮工具而是打包工具,可以跟 .gz 配合形成 .tar.gz 的打包壓縮格式 .zip: 和 .tar.gz 很類似但可以打包壓縮多個(gè)文件
.rar: 打包壓縮文件,最初用于 DOS
因此,文件是否為壓縮文件的判斷邏輯可以如下:
- 建立一個(gè)含壓縮包后綴的列表 compressed_lst = ['gz', 'tar', 'zip', 'rar']
- 目標(biāo)文件夾下的所有文件名運(yùn)行 filename.split(.)[-1] 獲取后綴名
- 判斷后綴名是否在 compressed_lst 中,如果存在則運(yùn)行后續(xù)的解壓代碼
- 如果是以 gz 結(jié)尾的文件,解壓后需要再次判斷是否是以 .tar 結(jié)尾,并進(jìn)行相應(yīng)處理
不同壓縮文件的解壓代碼各不相同,在后續(xù)代碼操作中具體展開(kāi)。
3.代碼實(shí)現(xiàn)
首先是獲取 download 文件夾下所有文件的文件名
import glob import os path = r'C:\xxxx\download' file_lst = glob.glob(path + '/*') # 列表推導(dǎo)式 filename_lst = [os.path.basename(i) for i in file_lst] print(filename_lst)
接下來(lái)根據(jù)文件的后綴名判斷是否需要壓縮,先看一下代碼框架
for i in filename_lst: if '.' in i: # 獲取后綴名 suffix = i.split('.')[-1] # 逐個(gè)將后綴名和各格式的壓縮后綴匹配 if suffix == 'gz': pass if ...: # 再次判斷新產(chǎn)生的文件名是否以 .tar 結(jié)尾 pass if suffix == 'tar': pass if suffix == 'zip': pass if suffix == 'rar': pass
這里有2個(gè)注意點(diǎn):
有些文件沒(méi)有后綴名,因此可能不存在 .,這時(shí)用 filename.split('.')[-1]會(huì)報(bào)錯(cuò),因此需要先判斷
以.gz 結(jié)尾的文件,解壓后需要再次判斷是否是以 .tar 結(jié)尾,然后我們就可以分別將四種壓縮文件的解壓代碼寫(xiě)成函數(shù),符合時(shí)候單獨(dú)調(diào)用即可
1、處理.gz 文件
import gzip def ungz(filename): filename = filename[:-3] # gz文件的單文件解壓就是去掉 filename 后面的 .gz gz_file = gzip.GzipFile(filename) with open(filename, "w+") as file: file.write(gz_file.read()) return filename # 這個(gè)gzip的函數(shù)需要返回值以進(jìn)一步配合untar函數(shù)
前面反復(fù)提及的 gz 文件有可能跟 tar 文件配合,因此解壓 gz 文件后需要再判斷是否有必要解開(kāi) tar 文件
這里就可以先把 tar 文件的函數(shù)寫(xiě)出來(lái)
2、處理.tar文件
import tarfile def untar(filename): tar = tarfile.open(filename) names = tar.getnames() # tar本身是將文件打包,解除打包會(huì)產(chǎn)生很多文件,因此需要建立文件夾存放 if not os.path.isdir(filename + "_dir"): os.mkdir(filename + "_dir") for name in names: tar.extract(name, filename + "_dir/") tar.close()
3、處理.zip文件
import zipfile def unzip(filename): zip_file = zipfile.ZipFile(filename) # 類似tar解除打包,建立文件夾存放解壓的多個(gè)文件 if not os.path.isdir(filename + "_dir"): os.mkdir(filename + "_dir") for names in zip_file.namelist(): zip_file.extract(names, filename + "_dir/") zip_file.close()
4、處理.rar文件
import rarfile def unrar(filename): rar = rarfile.RarFile(filename) if not os.path.isdir(filename + "_dir"): os.mkdir(filename + "_dir") os.chdir(filename + "_dir") rar.extractall() rar.close()
可以看到,四種解壓代碼略有不同,推薦大家實(shí)際演示中自己體會(huì)一下差別,解壓后配合 os.remove() 就可以刪除壓縮包,現(xiàn)在看看邏輯框架補(bǔ)上解壓函數(shù)后的內(nèi)容:
for filename in filename_lst: if '.' in filename: suffix = filename.split('.')[-1] if suffix == 'gz': new_filename = ungz(filename) os.remove(filename) if new_filename.split('.')[-1] == 'tar': untar(new_filename) os.remove(new_filename) if suffix == 'tar': untar(filename) os.remove(filename) if suffix == 'zip': unzip(filename) os.remove(filename) if suffix == 'rar': unrar(filename) os.remove(filename)
5、實(shí)現(xiàn)實(shí)時(shí)檢測(cè)
比較簡(jiǎn)單的方法就是建立 while True 死循環(huán)配合 time.sleep()睡眠,框架如下:
import time while True: func() time.sleep(5) # 睡眠秒數(shù)可以設(shè)置大一點(diǎn)避免過(guò)度占用資源
最后將第二步的實(shí)現(xiàn)代碼改為函數(shù)并放在循環(huán)框架中就可以完成本次需求,完整代碼如下
import glob import os import gzip import tarfile import zipfile import rarfile import time path = r'C:\xxxx\download' file_lst = glob.glob(path + '/*') filename_lst = [os.path.basename(i) for i in file_lst] def ungz(filename): filename = filename[:-3] gz_file = gzip.GzipFile(filename) with open(filename, "w+") as file: file.write(gz_file.read()) return filename def untar(filename): tar = tarfile.open(filename) names = tar.getnames() if not os.path.isdir(filename + "_dir"): os.mkdir(filename + "_dir") for name in names: tar.extract(name, filename + "_dir/") tar.close() def unzip(filename): zip_file = zipfile.ZipFile(filename) if not os.path.isdir(filename + "_dir"): os.mkdir(filename + "_dir") for names in zip_file.namelist(): zip_file.extract(names, filename + "_dir/") zip_file.close() def unrar(filename): rar = rarfile.RarFile(filename) if not os.path.isdir(filename + "_dir"): os.mkdir(filename + "_dir") os.chdir(filename + "_dir") rar.extractall() rar.close() def unzip_files(): for filename in filename_lst: if '.' in filename: suffix = filename.split('.')[-1] if suffix == 'gz': new_filename = ungz(filename) os.remove(filename) if new_filename.split('.')[-1] == 'tar': untar(new_filename) os.remove(new_filename) if suffix == 'tar': untar(filename) os.remove(filename) if suffix == 'zip': unzip(filename) os.remove(filename) if suffix == 'rar': unrar(filename) os.remove(filename) while True: unzip_files() time.sleep(5)
到此這篇關(guān)于Python在后臺(tái)自動(dòng)解壓各種壓縮文件的實(shí)現(xiàn)方法的文章就介紹到這了,更多相關(guān)Python自動(dòng)解壓各種壓縮文件內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python統(tǒng)計(jì)字符串中字母出現(xiàn)次數(shù)代碼實(shí)例
這篇文章主要介紹了python統(tǒng)計(jì)字符串中字母出現(xiàn)次數(shù)代碼實(shí)例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-03-03python實(shí)現(xiàn)在目錄中查找指定文件的方法
這篇文章主要介紹了python實(shí)現(xiàn)在目錄中查找指定文件的方法,通過(guò)模糊查找與精確查找兩個(gè)實(shí)例較為詳細(xì)的闡述了文件查找的方法,是非常實(shí)用的技巧,需要的朋友可以參考下2014-11-11Python astype(np.float)函數(shù)使用方法解析
這篇文章主要介紹了Python astype(np.float)函數(shù)使用方法解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-06-06pytorch VGG11識(shí)別cifar10數(shù)據(jù)集(訓(xùn)練+預(yù)測(cè)單張輸入圖片操作)
這篇文章主要介紹了pytorch VGG11識(shí)別cifar10數(shù)據(jù)集(訓(xùn)練+預(yù)測(cè)單張輸入圖片操作),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-06-06python 讀txt文件,按‘,’分割每行數(shù)據(jù)操作
這篇文章主要介紹了python 讀txt文件,按‘,’分割每行數(shù)據(jù)操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-07-07淺談python函數(shù)調(diào)用返回兩個(gè)或多個(gè)變量的方法
今天小編就為大家分享一篇淺談python函數(shù)調(diào)用返回兩個(gè)或多個(gè)變量的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-01-01Django中STATIC_ROOT和STATIC_URL及STATICFILES_DIRS淺析
這篇文章主要給大家介紹了關(guān)于Django中STATIC_ROOT和STATIC_URL及STATICFILES_DIRS的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起看看吧2018-05-05