欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

基于Python實現(xiàn)文件的壓縮與解壓縮

 更新時間:2022年03月30日 10:44:35   作者:Python編程學(xué)習(xí)圈  
在日常工作中,除了會涉及到使用Python處理文本文件,有時候還會涉及對壓縮文件的處理。本文為大家總結(jié)了利用Python可以實現(xiàn)的幾種文件壓縮與解壓縮實現(xiàn)代碼,需要的可以參考一下

在日常工作中,除了會涉及到使用Python處理文本文件,有時候還會涉及對壓縮文件的處理。

通常會涉及到的壓縮文件格式有:

  • rar:Windows 環(huán)境下用的比較多的壓縮,比較著名的GUI工具是winrar
  • tar: Linux系統(tǒng)下的打包工具,只打包,不壓縮
  • gz:即gzip,通常只能壓縮一個文件。與tar結(jié)合起來就可以實現(xiàn)先打包,再壓縮。
  • tgz:即gz。先用tar打包,然后再用gz壓縮得到的文件
  • zip:不同于gzip,雖然使用相似的算法,可以打包壓縮多個文件,不過分別壓縮文件,壓縮率低于tar
  • 7z:7zip壓縮軟件支持的格式,壓縮效率較高。

當(dāng)然除了使用Python外,你還可以選擇使用壓縮解壓縮軟件或命令手動進(jìn)行處理。

zip文件

zipfile是Python里用來做zip格式編碼的壓縮和解壓縮的module,zipfile里有兩個非常重要的class:ZipFile和ZipInfo。ZipFile是主要的類,用來創(chuàng)建和讀取zip文件,而ZipInfo是存儲的zip文件的每個文件的信息。

示例代碼

import os
import zipfile


# 壓縮
def make_zip(source_dir, output_filename):
    zipf = zipfile.ZipFile(output_filename, 'w')
    pre_len = len(os.path.dirname(source_dir))
    for parent, dirnames, filenames in os.walk(source_dir):
        for filename in filenames:
            print(filename)
            pathfile = os.path.join(parent, filename)
            arcname = pathfile[pre_len:].strip(os.path.sep)  # 相對路徑
            zipf.write(pathfile, arcname)
        print()
    zipf.close()


# 解壓縮
def un_zip(file_name):
    """unzip zip file"""
    zip_file = zipfile.ZipFile(file_name)
    if os.path.isdir(file_name + "_files"):
        pass
    else:
        os.mkdir(file_name + "_files")
    for names in zip_file.namelist():
        zip_file.extract(names, file_name + "_files/")
    zip_file.close()


if __name__ == '__main__':
    make_zip(r"E:python_samplelibstest_tar_fileslibs", "test.zip")
    un_zip("test.zip")

tar.gz文件

tarfile 模塊可以用來讀寫 tar 歸檔,包括使用 gzip, bz2 和 lzma 壓縮的歸檔。在使用tarfile是必須了解模式:

mode 必須是 ‘filemode[:compression]’ 形式的字符串,其默認(rèn)值為 ‘r’。以下是模式組合的完整列表:

模式動作
‘r’ or ‘r:*’打開和讀取使用透明壓縮(推薦)。
‘r:’打開和讀取不使用壓縮。
‘r:gz’打開和讀取使用gzip 壓縮。
‘r:bz2’打開和讀取使用bzip2 壓縮。
‘r:xz’打開和讀取使用lzma 壓縮。
‘x’ 或 ‘x:’創(chuàng)建tarfile不進(jìn)行壓縮。如果文件已經(jīng)存在,則拋出 FileExistsError 異常。
‘x:gz’使用gzip壓縮創(chuàng)建tarfile。如果文件已經(jīng)存在,則拋出 FileExistsError 異常。
‘x:bz2’使用bzip2 壓縮創(chuàng)建tarfile。如果文件已經(jīng)存在,則拋出 FileExistsError 異常。
‘x:xz’使用lzma 壓縮創(chuàng)建tarfile。如果文件已經(jīng)存在,則拋出 FileExistsError 異常。
‘a’ or ‘a:’打開以便在沒有壓縮的情況下追加。如果文件不存在,則創(chuàng)建該文件。
‘w’ or ‘w:’打開用于未壓縮的寫入。
‘w:gz’打開用于 gzip 壓縮的寫入。
‘w:bz2’打開用于 bzip2 壓縮的寫入。
‘w:xz’打開用于 lzma 壓縮的寫入。

針對特殊的目的,還存在第二種 mode 格式: ‘filemode|[compression]’。tarfile.open() 將返回一個將其數(shù)據(jù)作為數(shù)據(jù)塊流來處理的 TarFile 對象:

模式動作
‘r|*’打開 tar 塊的 流 以進(jìn)行透明壓縮讀取。
‘r|’打開一個未壓縮的 tar 塊的 stream 用于讀取。
‘r|gz’打開一個 gzip 壓縮的 stream 用于讀取。
‘r|bz2’打開一個 bzip2 壓縮的 stream 用于讀取。
‘r|xz’打開一個 lzma 壓縮 stream 用于讀取。
‘w|’打開一個未壓縮的 stream 用于寫入。
‘w|gz’打開一個 gzip 壓縮的 stream 用于寫入。
‘w|bz2’打開一個 bzip2 壓縮的 stream 用于寫入。
‘w|xz’打開一個 lzma 壓縮的 stream 用于寫入。

代碼示例:

import os
import tarfile
import gzip


# 一次性打包整個根目錄??兆幽夸洉淮虬?。
# 如果只打包不壓縮,將"w:gz"參數(shù)改為"w:"或"w"即可。
def make_targz(output_filename, source_dir):
    with tarfile.open(output_filename, "w:gz") as tar:
        tar.add(source_dir, arcname=os.path.basename(source_dir))


# 逐個添加文件打包,未打包空子目錄??蛇^濾文件。
# 如果只打包不壓縮,將"w:gz"參數(shù)改為"w:"或"w"即可。
def make_targz_one_by_one(output_filename, source_dir):
    tar = tarfile.open(output_filename, "w:gz")
    for root, dir, files in os.walk(source_dir):
        for file in files:
            pathfile = os.path.join(root, file)
            tar.add(pathfile)
    tar.close()


def un_gz(file_name):
    """ungz zip file"""
    f_name = file_name.replace(".gz", "")
    # 獲取文件的名稱,去掉
    g_file = gzip.GzipFile(file_name)
    # 創(chuàng)建gzip對象
    open(f_name, "wb+").write(g_file.read())
    # gzip對象用read()打開后,寫入open()建立的文件里。
    g_file.close()  # 關(guān)閉gzip對象


def un_tar(file_name):
    # untar zip file
    tar = tarfile.open(file_name)
    names = tar.getnames()
    if os.path.isdir(file_name + "_files"):
        pass
    else:
        os.mkdir(file_name + "_files")
    # 由于解壓后是許多文件,預(yù)先建立同名文件夾
    for name in names:
        tar.extract(name, file_name + "_files/")
    tar.close()


if __name__ == '__main__':
    make_targz('test.tar.gz', "E:python_samplelibs")
    make_targz_one_by_one('test01.tgz', "E:python_samplelibs")
    un_gz("test.tar.gz")
    un_tar("test.tar")

rar文件

我們可以使用rarfile來解壓.rar的文件,但是不支持用rarfile來壓縮rar文件。rarfile以下unrar組件,但是使用pip install unrar安裝后發(fā)現(xiàn)會報如下錯誤:

Couldn’t find path to unrar library…

這是因為 Python下的 unrar 還依賴了RAR官方的庫。

Windows的安裝

  • 到RARLab官方下載庫文件,然后安裝。
  • 安裝是最好選擇默認(rèn)路徑,一般在 C:Program Files (x86)UnrarDLL 目錄下。
  • 添加環(huán)境變量,在系統(tǒng)變量中新建變量名UNRAR_LIB_PATH,如果是64位系統(tǒng),就輸入 C:Program Files (x86)UnrarDLLx64UnRAR64.dll,如果是32位系統(tǒng)就是 C:Program Files (x86)UnrarDLLUnRAR.dll。
  • 確定保存環(huán)境變量后,在進(jìn)行 pip install unrar 安裝,這時代碼再運行就不會報錯了。

Linux的安裝

  • 下載rar源文件
  • 解壓安裝包,進(jìn)入安裝包目錄,編譯安裝,生成so 文件
  • 配置環(huán)境變量,完成后,在進(jìn)行 pip install unrar 安裝
# cd /usr/local/src/
# wget https://www.rarlab.com/rar/unrarsrc-6.0.3.tar.gz
# tar zxvf unrarsrc-6.0.3.tar.gz
# cd unrar
# make lib
# make install-lib  //生成libunrar.so 文件
# vim /etc/profile
export UNRAR_LIB_PATH=/usr/lib/libunrar.so
# source /etc/profile

代碼示例:

import rarfile


def unrar(rar_file, dir_name):
    # rarfile需要unrar支持, linux下pip install unrar, windows下在winrar文件夾找到unrar,加到path里
    rarobj = rarfile.RarFile(rar_file.decode('utf-8'))
    rarobj.extractall(dir_name.decode('utf-8'))

7z文件

要壓縮和解壓縮.7z文件需要用到py7zr組件。代碼示例:

import py7zr

# 壓縮
with py7zr.SevenZipFile("Archive.7z", 'r') as archive:
    archive.extractall(path="/tmp")

# 解壓縮
with py7zr.SevenZipFile("Archive.7z", 'w') as archive:
    archive.writeall("target/")

以上就是基于Python實現(xiàn)文件的壓縮與解壓縮的詳細(xì)內(nèi)容,更多關(guān)于Python文件壓縮的資料請關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • Python PO設(shè)計模式的具體使用

    Python PO設(shè)計模式的具體使用

    這篇文章主要介紹了Python PO設(shè)計模式的具體使用,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-08-08
  • pyenv虛擬環(huán)境管理python多版本和軟件庫的方法

    pyenv虛擬環(huán)境管理python多版本和軟件庫的方法

    這篇文章主要介紹了pyenv虛擬環(huán)境管理python多版本和軟件庫,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-12-12
  • python和pyqt-tools安裝位置圖文詳解

    python和pyqt-tools安裝位置圖文詳解

    查詢Python安裝位置可通過命令行輸入import sys和sys.path實現(xiàn),而Python-tools的安裝位置則可在Python文件夾內(nèi)找到,本文介紹了如何查詢Python及其工具包PyQt-tools的安裝位置,便于用戶進(jìn)行相關(guān)設(shè)置或調(diào)試,更多關(guān)于Python安裝和配置的內(nèi)容,可查閱腳本之家的相關(guān)文章
    2024-09-09
  • python合并已經(jīng)存在的sheet數(shù)據(jù)到新sheet的方法

    python合并已經(jīng)存在的sheet數(shù)據(jù)到新sheet的方法

    今天小編就為大家分享一篇python合并已經(jīng)存在的sheet數(shù)據(jù)到新sheet的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-12-12
  • Python文件讀寫處理日常任務(wù)終極工具實例

    Python文件讀寫處理日常任務(wù)終極工具實例

    Python文件的讀寫操作時,有很多需要考慮的細(xì)節(jié),這包括文件打開方式、讀取和寫入數(shù)據(jù)的方法、異常處理等,在本文中,將深入探討Python中的文件操作,旨在提供全面的指南,幫你充分了解Python文件的讀寫
    2023-11-11
  • Python/JS實現(xiàn)常見加密算法的示例代碼

    Python/JS實現(xiàn)常見加密算法的示例代碼

    這篇文章主要為大家詳細(xì)介紹了常見的一些JS加密,并記錄了JS和Python的實現(xiàn)方式,主要有base64編碼偽加密、MD5、SHAI等,需要的可以參考一下
    2022-11-11
  • python 實現(xiàn)音頻疊加的示例

    python 實現(xiàn)音頻疊加的示例

    這篇文章主要介紹了python 實現(xiàn)音頻疊加的示例,幫助大家更好的理解和使用python處理聲音文件,感興趣的朋友可以了解下
    2020-10-10
  • python禁用鍵鼠與提權(quán)代碼實例

    python禁用鍵鼠與提權(quán)代碼實例

    這篇文章主要介紹了python禁用鍵鼠與提權(quán)代碼實例,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2019-08-08
  • Python Pygame實戰(zhàn)之飛機(jī)大戰(zhàn)的實現(xiàn)

    Python Pygame實戰(zhàn)之飛機(jī)大戰(zhàn)的實現(xiàn)

    飛機(jī)大戰(zhàn)想必是很多人童年時期的經(jīng)典游戲,這篇文章主要給大家介紹了關(guān)于如何利用python中的Pygame模塊寫一個簡單的飛機(jī)大戰(zhàn)小游戲的相關(guān)資料,需要的朋友可以參考下
    2022-03-03
  • python中numpy?常用操作總結(jié)

    python中numpy?常用操作總結(jié)

    這篇文章主要介紹了python中numpy常用操作總結(jié),NumPy是Python語言的一個擴(kuò)充程序庫,支持大量高維度數(shù)組與矩陣運算,此外也針對數(shù)組運算提供大量的數(shù)學(xué)函數(shù)庫
    2022-09-09

最新評論