python批量解壓zip文件的方法
這是一個(gè)用python寫(xiě)解壓大量zip腳本的說(shuō)明,本人新手一個(gè),希望能對(duì)各位有所啟發(fā)。
首先要注意的,在運(yùn)行自己的腳本之前一定先備份或者復(fù)制出一些樣本進(jìn)行測(cè)試,不然出錯(cuò)會(huì)很麻煩;
之后我用到的是解壓zip文件的擴(kuò)展包zipfile,可以直接pip安裝或者在IDE里安裝,需要特別注意的是這個(gè)包的文件名解碼方式需要我們?nèi)バ薷?,先去查看源文件,直接搜索“cp437”(一個(gè)編碼方式),找到后全部替換為“gbk”,即可解決中文顯示問(wèn)題。
代碼:
import os import shutil import zipfile # 首先引入需要的工具包 # shutil為后期移動(dòng)文件所需,可以忽略此項(xiàng) # 路徑改這里! parent_path = r'輸入路徑,會(huì)解壓該路徑下的所有zip壓縮文件' # 文件類型選擇 # 可以自行更改壓縮文件類型,需要引入其它工具包,如tarfile等 # 這里是因?yàn)樵谧约旱膚indows上,zip比較常見(jiàn),其他類型請(qǐng)自行更改 file_flag = '.zip' # 刪除已解壓的zip文件 # 不建議初次使用,在確定程序無(wú)誤后可以添加使用 def del_old_zip(file_path): os.remove(file_path) # 解壓 def decompress(file_path, root): # 開(kāi)始 # zipfile打開(kāi)zip文件 z = zipfile.ZipFile(f'{file_path}', 'r') # 解壓 z.extractall(path=f"{root}") # path為解壓路徑,解包后位于該路徑下 # 判斷是否需要重復(fù)解包 for names in z.namelist(): if names.endswith(file_flag): z.close() return 1 # 結(jié)束 z.close() return 0 # 因?yàn)槲以谑褂眠^(guò)程中發(fā)現(xiàn)有些zip解包后會(huì)混在一起 # 在平時(shí)大家手動(dòng)解壓時(shí)可能也會(huì)遇到提示是否覆蓋的問(wèn)題 # 下面的兩個(gè)函數(shù)解決這一問(wèn)題 # 開(kāi)始要先創(chuàng)建一個(gè)大文件夾 與壓縮包名字相同 # 避免后期混亂和麻煩 def start_dir_make(root, dirname): os.chdir(root) os.mkdir(dirname) return os.path.join(root, dirname) # 去除多余文件夾 def rem_dir_extra(root, father_dir_name): # 遞歸要注意信息的正常處理 搞不好上一個(gè)調(diào)用已經(jīng)改變了東西 而下面的調(diào)用還是使用之前的數(shù)據(jù) try: # 判斷文件夾重名 開(kāi)始 for item in os.listdir(os.path.join(root, father_dir_name)): # 第一步判斷是不是一個(gè)文件夾,如果不是則跳過(guò)本次循環(huán) if not os.path.isdir(os.path.join(root, father_dir_name, item)): continue # 判斷是否要脫掉一層目錄結(jié)構(gòu) # 文件夾名字要相同,且子目錄中只有單獨(dú)的一個(gè)文件夾 if item == father_dir_name and len( os.listdir(os.path.join(root, father_dir_name))) == 1: # 改變工作目錄 os.chdir(root) # 將無(wú)用文件夾重命名,因?yàn)橹苯右苿?dòng)會(huì)有重名錯(cuò)誤 os.rename(father_dir_name, father_dir_name + '-old') # 移動(dòng)文件后刪除空文件夾 shutil.move(os.path.join(root, father_dir_name + '-old', item), os.path.join(root)) os.rmdir(os.path.join(root, father_dir_name + '-old')) # 將去掉一層目錄結(jié)構(gòu)后的文件夾繼續(xù)作為父本遞歸處理下去 # 這里要注意,上面已經(jīng)發(fā)生過(guò)數(shù)據(jù)的改動(dòng),所以下面遞歸傳參一定要正確! rem_dir_extra(root, item) else: # 處理那些不滿足上面條件的文件夾 rem_dir_extra(os.path.join(root, father_dir_name), item) except Exception as e: # 打印錯(cuò)誤信息 print("清除文件夾出錯(cuò)" + str(e)) # 入口 if __name__ == '__main__': flag = 1 while flag: # 循環(huán)遍歷文件夾 for root, dirs, files in os.walk(parent_path): # 讀取文件名 for name in files: if name.endswith(file_flag): # 創(chuàng)建文件夾 new_ws = start_dir_make(root, name.replace(file_flag, '')) # zip文件地址 zip_path = os.path.join(root, name) # 解壓 flag = decompress(zip_path, new_ws) # 刪除解壓后的文件 # 有點(diǎn)危險(xiǎn) # 但不刪除又可能會(huì)重復(fù)運(yùn)行 # 一定要備份或先測(cè)試,不然可能會(huì)涼,自己選擇修改 del_old_zip(zip_path) # 去掉多余的文件結(jié)構(gòu) rem_dir_extra(root, name.replace(file_flag, '')) print(f'{root}\\{name}'.join(['文件:', '\n解壓完成\n'])) # 由于解壓可能解了好幾次 所以可能會(huì)有已經(jīng)解壓好的父級(jí)目錄重名無(wú)法處理 這里要再處理一次 rem_dir_extra(os.path.split(parent_path)[0], os.path.split(parent_path)[1]) print("解壓完成啦,記得檢查有沒(méi)有zip格式之外的呀!\n\n其他格式需要自己改一下了")
總結(jié)
以上所述是小編給大家介紹的python批量解壓zip文件的方法,希望對(duì)大家有所幫助,如果大家有任何疑問(wèn)歡迎給我留言,小編會(huì)及時(shí)回復(fù)大家的!
相關(guān)文章
python3中的logging記錄日志實(shí)現(xiàn)過(guò)程及封裝成類的操作
這篇文章主要介紹了python3中的logging記錄日志實(shí)現(xiàn)過(guò)程及封裝成類的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-05-05python射線法判斷檢測(cè)點(diǎn)是否位于區(qū)域外接矩形內(nèi)
這篇文章主要為大家詳細(xì)介紹了python射線法判斷檢測(cè)點(diǎn)是否位于區(qū)域外接矩形內(nèi),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-06-06django之用戶、用戶組及權(quán)限設(shè)置方式
這篇文章主要介紹了django之用戶、用戶組及權(quán)限設(shè)置方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-05-05Python opencv醫(yī)學(xué)處理的實(shí)現(xiàn)過(guò)程
這篇文章主要介紹了Python opencv醫(yī)學(xué)處理的實(shí)現(xiàn)過(guò)程,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-05-05python中urllib.unquote亂碼的原因與解決方法
這篇文章主要給大家介紹了python中urllib.unquote亂碼的原因與解決方法,文中介紹的非常詳細(xì),對(duì)大家具有一定的參考價(jià)值,需要的朋友可以參考學(xué)習(xí),下面跟著小編一起來(lái)學(xué)習(xí)學(xué)習(xí)吧。2017-04-04Python?內(nèi)置logging?使用詳細(xì)介紹
提供日志記錄的接口和眾多處理模塊,供用戶存儲(chǔ)各種格式的日志,幫助調(diào)試程序或者記錄程序運(yùn)行過(guò)程中的輸出信息,這篇文章主要介紹了Python?內(nèi)置logging?使用講解,需要的朋友可以參考下2022-07-07Python實(shí)現(xiàn)去除代碼前行號(hào)的方法
這篇文章主要介紹了Python實(shí)現(xiàn)去除代碼前行號(hào)的方法,實(shí)例分析了Python操作字符的技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下2015-03-03移除Selenium中window.navigator.webdriver值
這篇文章主要為大家介紹了如何正確的移除Selenium中window.navigator.webdriver的值方法步驟,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-06-06python+gdal+遙感圖像拼接(mosaic)的實(shí)例
這篇文章主要介紹了python+gdal+遙感圖像拼接(mosaic)的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-03-03Pycharm學(xué)習(xí)教程(4) Python解釋器的相關(guān)配置
這篇文章主要為大家詳細(xì)介紹了最全的Pycharm學(xué)習(xí)教程第四篇,Python解釋器配置,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-05-05