解決Python復(fù)雜zip文件的解壓?jiǎn)栴}
廢話不多說(shuō),直接看問(wèn)題,使用過(guò)?Python
?中的標(biāo)準(zhǔn)庫(kù)?zipfile
?解壓過(guò)?zip
?格式壓縮包的朋友們,可能遇到過(guò),當(dāng)壓縮文件中的目錄或文件名中包含中文等常見(jiàn)?unicode
?字符時(shí),典型如下面的例子:
使用?zipfile
?的?extract()
?或?extractall()
?方法直接解壓時(shí),產(chǎn)生的解壓結(jié)果名充斥著亂碼,這一點(diǎn)我們通過(guò)調(diào)用?namelist()
?方法就可以看出來(lái):
from zipfile import ZipFile # 讀入壓縮包文件 file = ZipFile('示例壓縮包.zip') # 查看壓縮包內(nèi)目錄、文件名稱(chēng) file.namelist()
這是因?yàn)?zipfile
?中針對(duì)壓縮包內(nèi)容的編碼兼容性差,但我們可以通過(guò)下面的函數(shù)自行矯正:
def recode(raw: str) -> str: ''' 編碼修正 ''' try: return raw.encode('cp437').decode('gbk') except: return raw.encode('utf-8').decode('utf-8') for file_or_path in file.namelist(): print(file_or_path, ' -------> ' , recode(file_or_path))
解決了文件名亂碼的問(wèn)題后,接下來(lái)我們就可以配合?shutil
?與?os
?標(biāo)準(zhǔn)庫(kù)中的相關(guān)功能,實(shí)現(xiàn)將指定任意?zip
?壓縮包,完好地解壓到指定的目錄中,代碼如下:
def zip_extract_all(src_zip_file: ZipFile, target_path: str) -> None: # 遍歷壓縮包內(nèi)所有內(nèi)容 for file_or_path in file.namelist(): # 若當(dāng)前節(jié)點(diǎn)是文件夾 if file_or_path.endswith('/'): try: # 基于當(dāng)前文件夾節(jié)點(diǎn)創(chuàng)建多層文件夾 os.makedirs(os.path.join(target_path, recode(file_or_path))) except FileExistsError: # 若已存在則跳過(guò)創(chuàng)建過(guò)程 pass # 否則視作文件進(jìn)行寫(xiě)出 else: # 利用shutil.copyfileobj,從壓縮包io流中提取目標(biāo)文件內(nèi)容寫(xiě)出到目標(biāo)路徑 with open(os.path.join(target_path, recode(file_or_path)), 'wb') as z: # 這里基于Zipfile.open()提取文件內(nèi)容時(shí)需要使用原始的亂碼文件名 shutil.copyfileobj(src_zip_file.open(file_or_path), z) # 向已存在的指定文件夾完整解壓當(dāng)前讀入的zip文件 zip_extract_all(file, '解壓測(cè)試')
可以看到,效果完美 :
到此這篇關(guān)于Python復(fù)雜zip文件的解壓的文章就介紹到這了,更多相關(guān)Python zip文件的解壓內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python接口自動(dòng)化淺析logging封裝及實(shí)戰(zhàn)操作
本篇文章主要給大家介紹將了logging常用配置放入yaml配置文件、logging日志封裝及結(jié)合登錄用例,講解日志如何在接口測(cè)試中運(yùn)用的實(shí)例操作2021-08-08Pandas的MultiIndex多層索引使用說(shuō)明
這篇文章主要介紹了Pandas的MultiIndex多層索引使用說(shuō)明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-09-09Python爬蟲(chóng)之App爬蟲(chóng)視頻下載的實(shí)現(xiàn)
這篇文章主要介紹了Python爬蟲(chóng)之App爬蟲(chóng)視頻下載的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-12-12學(xué)習(xí)python處理python編碼問(wèn)題
概括從python開(kāi)始就處理unicode字符,python源文件的編碼與解碼,我們寫(xiě)的python程序從產(chǎn)生到執(zhí)行的過(guò)程如下2011-03-03Python中處理表格數(shù)據(jù)的Tablib庫(kù)詳解
這篇文章主要介紹了Python中處理表格數(shù)據(jù)的Tablib庫(kù)詳解,Tablib 是一個(gè) MIT 許可的格式不可知的表格數(shù)據(jù)集庫(kù),用 Python 編寫(xiě),它允許您導(dǎo)入、導(dǎo)出和操作表格數(shù)據(jù)集,需要的朋友可以參考下2023-08-08python之pyqt5通過(guò)按鈕改變Label的背景顏色方法
今天小編就為大家分享一篇python之pyqt5通過(guò)按鈕改變Label的背景顏色方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-06-06flask + pymysql操作Mysql數(shù)據(jù)庫(kù)的實(shí)例
下面小編就為大家?guī)?lái)一篇flask + pymysql操作Mysql數(shù)據(jù)庫(kù)的實(shí)例。小編覺(jué)得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2017-11-11python-str,list,set間的轉(zhuǎn)換實(shí)例
今天小編就為大家分享一篇python-str,list,set間的轉(zhuǎn)換實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-06-06