詳解python解壓壓縮包的五種方法
這里討論使用Python解壓例如以下五種壓縮文件:
.gz .tar .tgz .zip .rar
簡單介紹
gz: 即gzip。通常僅僅能壓縮一個(gè)文件。與tar結(jié)合起來就能夠?qū)崿F(xiàn)先打包,再壓縮。
tar: linux系統(tǒng)下的打包工具。僅僅打包。不壓縮
tgz:即tar.gz。先用tar打包,然后再用gz壓縮得到的文件
zip: 不同于gzip。盡管使用相似的算法,能夠打包壓縮多個(gè)文件。只是分別壓縮文件。壓縮率低于tar。
rar:打包壓縮文件。最初用于DOS,基于window操作系統(tǒng)。
壓縮率比zip高,但速度慢。隨機(jī)訪問的速度也慢。
關(guān)于zip于rar之間的各種比較??梢姡?/p>
http://www.comicer.com/stronghorse/water/software/ziprar.htm
gz
因?yàn)間z一般僅僅壓縮一個(gè)文件,全部常與其它打包工具一起工作。比方能夠先用tar打包為XXX.tar,然后在壓縮為XXX.tar.gz
解壓gz,事實(shí)上就是讀出當(dāng)中的單一文件,Python方法例如以下:
import gzip import os def un_gz(file_name): """ungz zip file""" f_name = file_name.replace(".gz", "") #獲取文件的名稱,去掉 g_file = gzip.GzipFile(file_name) #創(chuàng)建gzip對象 open(f_name, "w+").write(g_file.read()) #gzip對象用read()打開后,寫入open()建立的文件里。 g_file.close() #關(guān)閉gzip對象
tar
XXX.tar.gz解壓后得到XXX.tar,還要進(jìn)一步解壓出來。
*注:tgz與tar.gz是同樣的格式,老版本號(hào)DOS擴(kuò)展名最多三個(gè)字符,故用tgz表示。
因?yàn)檫@里有多個(gè)文件,我們先讀取全部文件名稱。然后解壓。例如以下:
import tarfile def un_tar(file_name): untar zip file""" tar = tarfile.open(file_name) names = tar.getnames() if os.path.isdir(file_name + "_files"): pass else: os.mkdir(file_name + "_files") #因?yàn)榻鈮汉笫呛芏辔募?,預(yù)先建立同名目錄 for name in names: tar.extract(name, file_name + "_files/") tar.close()
*注:tgz文件與tar文件同樣的解壓方法。
zip
與tar類似,先讀取多個(gè)文件名稱,然后解壓。例如以下:
import zipfile def un_zip(file_name): """unzip zip file""" zip_file = zipfile.ZipFile(file_name) if os.path.isdir(file_name + "_files"): pass else: os.mkdir(file_name + "_files") for names in zip_file.namelist(): zip_file.extract(names,file_name + "_files/") zip_file.close()
rar
由于rar通常為window下使用,須要額外的Python包rarfile。
可用地址: http://sourceforge.net/projects/rarfile.berlios/files/rarfile-2.4.tar.gz/download
解壓到Python安裝文件夾的/Scripts/文件夾下,在當(dāng)前窗體打開命令行,
輸入Python setup.py install
安裝完畢。
import rarfile import os def un_rar(file_name): """unrar zip file""" rar = rarfile.RarFile(file_name) if os.path.isdir(file_name + "_files"): pass else: os.mkdir(file_name + "_files") os.chdir(file_name + "_files"): rar.extractall() rar.close()
tar打包
在寫打包代碼的過程中,使用tar.add()添加文件時(shí),會(huì)把文件本身的路徑也加進(jìn)去,加上arcname就能依據(jù)自己的命名規(guī)則將文件添加tar包
打包代碼:
#!/usr/bin/env /usr/local/bin/python # encoding: utf-8 import tarfile import os import time start = time.time() tar=tarfile.open('/path/to/your.tar,'w') for root,dir,files in os.walk('/path/to/dir/'): for file in files: fullpath=os.path.join(root,file) tar.add(fullpath,arcname=file) tar.close() print time.time()-start
在打包的過程中能夠設(shè)置壓縮規(guī)則,如想要以gz壓縮的格式打包
tar=tarfile.open('/path/to/your.tar.gz','w:gz')
其它格式例如以下表:
tarfile.open的mode有非常多種:
mode action
tar解包
tar解包也能夠依據(jù)不同壓縮格式來解壓。
#!/usr/bin/env /usr/local/bin/python # encoding: utf-8 import tarfile import time start = time.time() t = tarfile.open("/path/to/your.tar", "r:") t.extractall(path = '/path/to/extractdir/') t.close() print time.time()-start
上面的代碼是解壓全部的,也能夠挨個(gè)起做不同的處理,但要假設(shè)tar包內(nèi)文件過多,小心內(nèi)存哦~
tar = tarfile.open(filename, 'r:gz') for tar_info in tar: file = tar.extractfile(tar_info) do_something_with(file)
ps:python實(shí)現(xiàn)rar文件解壓
1.pip3 install rarfile
安裝rarfile庫
(注意是解壓,壓縮這個(gè)方法不支持)
#coding=utf-8 import rarfile path = "E:\\New\\New.rar" path2 = "E:\\New" rf = rarfile.RarFile(path) #待解壓文件 rf.extractall(path2) #解壓指定文件路徑
總結(jié)
以上所述是小編給大家介紹的python解壓壓縮包的五種方法,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
如果你覺得本文對你有幫助,歡迎轉(zhuǎn)載,煩請注明出處,謝謝!
相關(guān)文章
基于Python+OpenCV實(shí)現(xiàn)自動(dòng)掃雷功能
相信許多人很早就知道有掃雷這么一款經(jīng)典的游(顯卡測試)戲(軟件),掃雷作為一款在Windows9x時(shí)代就已經(jīng)誕生的經(jīng)典游戲,從過去到現(xiàn)在依然都有著它獨(dú)特的魅力,所以本文小編給大家介紹了如何使用Python+OpenCV實(shí)現(xiàn)自動(dòng)掃雷效果,感興趣的朋友可以參考下2023-12-12Python實(shí)現(xiàn)發(fā)送聲情并茂的郵件內(nèi)容和附件
Python是一種高級(jí)編程語言,它可以用于編寫各種類型的應(yīng)用程序,包括發(fā)送電子郵件。本文就來演示如何使用Python發(fā)送HTML格式的電子郵件,感興趣的可以了解一下2023-04-04淺談Tensorflow加載Vgg預(yù)訓(xùn)練模型的幾個(gè)注意事項(xiàng)
這篇文章主要介紹了淺談Tensorflow加載Vgg預(yù)訓(xùn)練模型的幾個(gè)注意事項(xiàng)說明,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-05-05