Python如何拆分ZIP文件
Python拆分ZIP文件
同事接到個(gè)任務(wù),每周拆分下發(fā)zip文件。
文件樣子如下
目錄下有很多文件,要按網(wǎng)點(diǎn)下發(fā)。這個(gè)總不能每次都手工做吧。 python 腳本搞起!
需要 2個(gè)庫
import os import zipfile
先解壓到臨時(shí)目錄,再遍歷壓縮成新zip文件。注意中文字符問題。
上代碼
# encoding: utf-8 """ @author: 陳年椰子 @contact: hndm@qq.com @version: 1.0 @project:MyTools @file: zip_work.py @time: 2021-9-13 15:48 說明 """ import os import zipfile def dfs_get_zip_file(input_path,result): # 遍歷目錄列表 files = os.listdir(input_path) for file in files: if os.path.isdir(input_path+'/'+file): dfs_get_zip_file(input_path+'/'+file,result) else: result.append(input_path+'/'+file) def zip_path(input_path,output_path,output_name,up_path=""): # input_path 要壓縮的目錄 # output_path zip文件存放目錄 # output_name zip文件名 # up_path zip包需要剔除的父目錄,避免壓縮包內(nèi)目錄過深 f = zipfile.ZipFile(output_path+'/'+output_name,'w',zipfile.ZIP_DEFLATED) filelists = [] dfs_get_zip_file(input_path,filelists) for file in filelists: f.write(file,file.replace(up_path,'')) f.close() return output_path+r"/"+output_name def get_category_dir_zip(filepath, ext_dir, up_path = ""): #遍歷filepath下所有文件,包括子目錄 , 找到網(wǎng)點(diǎn)目錄,壓縮成zip文件 # 按需要修改壓縮邏輯 , 我這里是按網(wǎng)點(diǎn)機(jī)構(gòu)分別壓縮 cate_dict = {'469030':'21', '469035':'23', '469031':'24', '469027':'19', '469003':'13', '469025':'17', '469007':'16', '460101':'11', '469033':'25', '469028':'26', '469034':'27', '469002':'14', '469036':'28', '460201':'12', '469026':'22', '469006':'20', '469005':'18', '469001':'15', } files = os.listdir(filepath) if os.path.isdir(ext_dir): pass else: os.mkdir(ext_dir) for fi in files: fi_d = os.path.join(filepath,fi) if os.path.isdir(fi_d): if fi.find("46")==0: zip_file_cnt = 0 ctg_dir_list = os.listdir(filepath) for ci in ctg_dir_list: ctg_dir = os.path.join(filepath, ci) if os.path.isdir(ctg_dir): zip_file = "{}.zip".format(ci[:6]) zip_file_dir = os.path.join(ext_dir, zip_file) if os.path.exists(zip_file_dir): # 如果文件存在 刪除文件 os.remove(zip_file_dir) print('壓縮', ctg_dir, zip_file_dir, ext_dir) zip_path(ctg_dir, ext_dir, zip_file, up_path) zip_file_cnt = zip_file_cnt + 1 return zip_file_cnt else: return get_category_dir_zip(fi_d, ext_dir) def sfp_unzip(file_path, ext_dir): """unzip zip file""" zip_file = zipfile.ZipFile(file_path) if os.path.isdir(ext_dir): pass else: os.mkdir(ext_dir) zip_i = 0 for names in zip_file.namelist(): zip_i = zip_i + 1 # 避免中文出現(xiàn)亂碼 gbk_names = names.encode('cp437').decode('gbk') file_size = zip_file.getinfo(names).file_size new_path = os.path.join(ext_dir, gbk_names) # 判斷文件是文件夾還是文件 if file_size > 0: # 是文件,通過open創(chuàng)建文件,寫入數(shù)據(jù) with open(file=new_path, mode='wb') as f: # zf.read 是讀取壓縮包里的文件內(nèi)容 f.write(zip_file.read(names)) else: # 是文件夾,就創(chuàng)建 os.mkdir(new_path) zip_file.close() return zip_i if __name__=="__main__": # 解壓文件 file_cnt = sfp_unzip("zip/xyk.zip", "D:/zip/tmp") if file_cnt > 0: # 按網(wǎng)點(diǎn)壓縮打包文件 zip_file_cnt = get_category_dir_zip("D:/zip/tmp", "D:/zip/data") print("拆分建立{}個(gè)zip文件。".format(zip_file_cnt)) else: print("zip文件為空,未拆分建立zip文件。")
Python ZIP 裝包 拆包
裝包
zip函數(shù)可以將兩個(gè)列表“縫合起來”,比如:
a=[1,2,3] b=['x','y','z'] c=list(zip(a,b)) print(c)
這里的含義是a里面的第一個(gè)元素跟b里面的第一個(gè)元素配對(duì),放到一個(gè)元組里面;a里面的第二個(gè)元素跟b里面的第二個(gè)元素配對(duì),放到另外一個(gè)元組里面;以此類推。
現(xiàn)在,另外在a里面增加一個(gè)元素,再使用zip的結(jié)果會(huì)怎么樣呢?
a.append(4) c=list(zip(a,b)) print(c)
從上面截圖可以看出,列表是作為參數(shù)被傳入zip函數(shù)中,而zip函數(shù)在遍歷列表(或者其他的可迭代數(shù)據(jù)類型 Iterable data type)時(shí),遍歷到最短的那個(gè)列表后,遍歷結(jié)束。
在上面a和b的例子中,b列表長度是3,a列表長度是4,所以最終產(chǎn)生的列表c的長度也只有3。
拆包
拆包是裝包的方向操作
d=list(zip(*c)) print(d)
上述拆包的核心是在zip(*c)里面,這里不是太好理解。從結(jié)果來看,是產(chǎn)生了兩個(gè)元組,d和e。其分別的內(nèi)容和a及b這兩個(gè)列表元素一樣。
這里重點(diǎn)看下*c,不太好理解。其實(shí)可以打印出來:
print(*c)
從上圖可以看出 *c是把c列表里面的三個(gè)參數(shù)分別拆了出來,然后作為參數(shù)傳入了zip函數(shù)里面。可以做另一個(gè)試驗(yàn)驗(yàn)證一下。
p1=(1,'x') p2=(2,'y') p3=(3,'z') p=list(zip(p1,p2,p3)) p==d
從上面的驗(yàn)證可以看出拆包時(shí)候的*c,其實(shí)就c列表里面三個(gè)作為元組的元素分別傳入zip函數(shù)中。
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
python通過nmap掃描在線設(shè)備并嘗試AAA登錄(實(shí)例代碼)
這篇文章主要介紹了python通過nmap掃描在線設(shè)備并嘗試AAA登錄,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-12-12python 請(qǐng)求服務(wù)器的實(shí)現(xiàn)代碼(http請(qǐng)求和https請(qǐng)求)
本篇文章主要介紹了python 請(qǐng)求服務(wù)器的實(shí)現(xiàn)代碼(http請(qǐng)求和https請(qǐng)求),小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2018-05-05詳解pycharm2020.1.1專業(yè)版安裝指南(推薦)
這篇文章主要介紹了pycharm2020.1.1專業(yè)版安裝指南,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-08-08Python高級(jí)應(yīng)用實(shí)例對(duì)比:高效計(jì)算大文件中的最長行的長度
在操作某個(gè)很多進(jìn)程都要頻繁用到的大文件的時(shí)候,應(yīng)該盡早釋放文件資源(f.close()),只有這樣才能算是一則高效率的代碼,下面我們就來分析下這3種方法的優(yōu)劣2014-06-06Python3模擬curl發(fā)送post請(qǐng)求操作示例
這篇文章主要介紹了Python3模擬curl發(fā)送post請(qǐng)求操作,結(jié)合實(shí)例形式分析了Python3使用Request請(qǐng)求模擬curl發(fā)送post相關(guān)操作技巧,需要的朋友可以參考下2019-05-05Python復(fù)制Excel帶有條件格式的單元格sheet實(shí)現(xiàn)步驟
這篇文章主要為大家介紹了Python復(fù)制Excel帶有條件格式的單元格sheet實(shí)現(xiàn)步驟,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-07-07淺析python 動(dòng)態(tài)庫m.so.1.0錯(cuò)誤問題
這篇文章主要介紹了python 動(dòng)態(tài)庫m.so.1.0錯(cuò)誤問題,文中給大家提到了python中使用動(dòng)態(tài)庫的方法,通過實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-05-05