Python在后臺自動解壓各種壓縮文件的實現(xiàn)方法

更新時間：2020年11月10日 16:21:46 投稿：mrr

這篇文章主要介紹了Python在后臺自動解壓各種壓縮文件的實現(xiàn)方法,本文通過實例代碼給大家介紹的非常詳細，對大家的學習或工作具有一定的參考借鑒價值，需要的朋友可以參考下

1.需求描述

編寫一個 Python 程序，每次下載壓縮包形式的文件后，自動將內(nèi)部文件解壓到當前文件夾后將壓縮包刪除，通過本案例可以學到的知識點：

os 模塊綜合應用
glob 模塊綜合應用
利用 gzip zipfile rarfile tarfile 模塊解壓文件

2.步驟分析和前置知識

碼代碼之前需要將復雜問題解釋成多個明確的要求，即這個程序?qū)崿F(xiàn)的邏輯為：

定時檢測某個文件夾（如 download 文件夾）是否存在壓縮文件
如果有新出現(xiàn)的壓縮文件則將其解壓到當前文件夾內(nèi)的新文件夾中刪除壓縮文件
提到壓縮文件就要分不同壓縮格式進行討論，主要有以下4種：

提到壓縮文件就要分不同壓縮格式進行討論，主要有以下4種：

.gz: 即 gzip，通常只能壓縮一個文件
.tar: 本質(zhì)上不是壓縮工具而是打包工具，可以跟 .gz 配合形成 .tar.gz 的打包壓縮格式 .zip: 和 .tar.gz 很類似但可以打包壓縮多個文件
.rar: 打包壓縮文件，最初用于 DOS

因此，文件是否為壓縮文件的判斷邏輯可以如下：

建立一個含壓縮包后綴的列表 compressed_lst = ['gz', 'tar', 'zip', 'rar']
目標文件夾下的所有文件名運行 filename.split(.)[-1] 獲取后綴名
判斷后綴名是否在 compressed_lst 中，如果存在則運行后續(xù)的解壓代碼
如果是以 gz 結(jié)尾的文件，解壓后需要再次判斷是否是以 .tar 結(jié)尾，并進行相應處理

不同壓縮文件的解壓代碼各不相同，在后續(xù)代碼操作中具體展開。

3.代碼實現(xiàn)

首先是獲取 download 文件夾下所有文件的文件名

import glob
import os

path = r'C:\xxxx\download'
file_lst = glob.glob(path + '/*')
# 列表推導式
filename_lst = [os.path.basename(i) for i in file_lst]

print(filename_lst)

接下來根據(jù)文件的后綴名判斷是否需要壓縮，先看一下代碼框架

for i in filename_lst:
 if '.' in i:
  # 獲取后綴名
  suffix = i.split('.')[-1]
  # 逐個將后綴名和各格式的壓縮后綴匹配
  if suffix == 'gz':
   pass
   if ...: # 再次判斷新產(chǎn)生的文件名是否以 .tar 結(jié)尾
    pass
  if suffix == 'tar':
   pass
  if suffix == 'zip':
   pass
  if suffix == 'rar':
   pass

這里有2個注意點：

有些文件沒有后綴名，因此可能不存在 .，這時用 filename.split('.')[-1]會報錯，因此需要先判斷
以.gz 結(jié)尾的文件，解壓后需要再次判斷是否是以 .tar 結(jié)尾，然后我們就可以分別將四種壓縮文件的解壓代碼寫成函數(shù)，符合時候單獨調(diào)用即可
1、處理.gz 文件

import gzip

def ungz(filename):
 filename = filename[:-3] # gz文件的單文件解壓就是去掉 filename 后面的 .gz
 gz_file = gzip.GzipFile(filename)
 with open(filename, "w+") as file:
  file.write(gz_file.read())
  return filename # 這個gzip的函數(shù)需要返回值以進一步配合untar函數(shù)

前面反復提及的 gz 文件有可能跟 tar 文件配合，因此解壓 gz 文件后需要再判斷是否有必要解開 tar 文件
這里就可以先把 tar 文件的函數(shù)寫出來
2、處理.tar文件

import tarfile

def untar(filename):
 tar = tarfile.open(filename)
 names = tar.getnames()
 # tar本身是將文件打包，解除打包會產(chǎn)生很多文件，因此需要建立文件夾存放
 if not os.path.isdir(filename + "_dir"):
  os.mkdir(filename + "_dir")
 for name in names:
  tar.extract(name, filename + "_dir/")
 tar.close()

3、處理.zip文件

import zipfile

def unzip(filename):
 zip_file = zipfile.ZipFile(filename)
 # 類似tar解除打包，建立文件夾存放解壓的多個文件
 if not os.path.isdir(filename + "_dir"):
  os.mkdir(filename + "_dir")
 for names in zip_file.namelist():
  zip_file.extract(names, filename + "_dir/")
 zip_file.close()

4、處理.rar文件

import rarfile

def unrar(filename):
 rar = rarfile.RarFile(filename)
 if not os.path.isdir(filename + "_dir"):
  os.mkdir(filename + "_dir")
 os.chdir(filename + "_dir")
 rar.extractall()
 rar.close()

可以看到，四種解壓代碼略有不同，推薦大家實際演示中自己體會一下差別，解壓后配合 os.remove() 就可以刪除壓縮包，現(xiàn)在看看邏輯框架補上解壓函數(shù)后的內(nèi)容：

for filename in filename_lst:
 if '.' in filename:
  suffix = filename.split('.')[-1]
  if suffix == 'gz':
   new_filename = ungz(filename)
   os.remove(filename)
   if new_filename.split('.')[-1] == 'tar':
    untar(new_filename)
    os.remove(new_filename) 
  if suffix == 'tar':
   untar(filename)
   os.remove(filename)
  if suffix == 'zip':
   unzip(filename)
   os.remove(filename)
  if suffix == 'rar':
   unrar(filename)
   os.remove(filename)

5、實現(xiàn)實時檢測

比較簡單的方法就是建立 while True 死循環(huán)配合 time.sleep()睡眠，框架如下：

import time

while True:
 func()
 time.sleep(5) # 睡眠秒數(shù)可以設置大一點避免過度占用資源

最后將第二步的實現(xiàn)代碼改為函數(shù)并放在循環(huán)框架中就可以完成本次需求，完整代碼如下

import glob
import os
import gzip
import tarfile
import zipfile
import rarfile
import time

path = r'C:\xxxx\download'
file_lst = glob.glob(path + '/*')
filename_lst = [os.path.basename(i) for i in file_lst]

def ungz(filename):
 filename = filename[:-3]
 gz_file = gzip.GzipFile(filename)
 with open(filename, "w+") as file:
  file.write(gz_file.read())
 return filename

def untar(filename):
 tar = tarfile.open(filename)
 names = tar.getnames()
 if not os.path.isdir(filename + "_dir"):
  os.mkdir(filename + "_dir")
 for name in names:
  tar.extract(name, filename + "_dir/")
 tar.close()

def unzip(filename):
 zip_file = zipfile.ZipFile(filename)
 if not os.path.isdir(filename + "_dir"):
  os.mkdir(filename + "_dir")
 for names in zip_file.namelist():
  zip_file.extract(names, filename + "_dir/")
 zip_file.close()

def unrar(filename):
 rar = rarfile.RarFile(filename)
 if not os.path.isdir(filename + "_dir"):
  os.mkdir(filename + "_dir")
 os.chdir(filename + "_dir")
 rar.extractall()
 rar.close()

def unzip_files():
 for filename in filename_lst:
  if '.' in filename:
   suffix = filename.split('.')[-1]
   if suffix == 'gz':
    new_filename = ungz(filename)
    os.remove(filename)
    if new_filename.split('.')[-1] == 'tar':
     untar(new_filename)
     os.remove(new_filename)
   if suffix == 'tar':
    untar(filename)
    os.remove(filename)
   if suffix == 'zip':
    unzip(filename)
    os.remove(filename)
   if suffix == 'rar':
    unrar(filename)
    os.remove(filename)

while True:
 unzip_files()
 time.sleep(5)

到此這篇關于Python在后臺自動解壓各種壓縮文件的實現(xiàn)方法的文章就介紹到這了,更多相關Python自動解壓各種壓縮文件內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: