欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python解析壓縮包內(nèi)部文件的后綴名并分類存放

 更新時(shí)間:2024年12月24日 08:48:33   作者:一晌小貪歡  
這篇文章主要為大家詳細(xì)介紹了如何使用Python解析壓縮包內(nèi)部文件的后綴名并分類存放,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下

1、背景

我們有很多壓縮包文件,假設(shè)壓縮包的種類只有【.7z】,【.rar】,【.zip】,壓縮包里面有一個(gè)文件,文件可以是不同的格式(后綴),我們希望通過壓縮包內(nèi)的文件后綴,自動(dòng)創(chuàng)建文件夾,讓后將壓縮包進(jìn)行批量移動(dòng)

如下圖:每一個(gè)壓縮包內(nèi)都有一個(gè)文件(不同類型\也可以相同類型)

預(yù)期結(jié)果,如下圖

2、庫的安裝

用途安裝
py7zr壓縮包.7z操作pip install py7zr -i https://pypi.tuna.tsinghua.edu.cn/simple/
rarfile壓縮包.rar操作pip install rarfile -i https://pypi.tuna.tsinghua.edu.cn/simple/
zipfile壓縮包.rar操作內(nèi)置庫無需安裝
os獲取絕對路徑內(nèi)置庫無需安裝

3、核心代碼

if zipfile.is_zipfile(archive_path):
    with zipfile.ZipFile(archive_path, 'r') as zip_ref:
        for file_info in zip_ref.infolist():
            ext = os.path.splitext(file_info.filename)[1].lower()
            if ext:
                extensions.add(ext[1:])  # 去掉點(diǎn)號

elif rarfile.is_rarfile(archive_path):
    with rarfile.RarFile(archive_path) as rar_ref:
        for file_info in rar_ref.infolist():
            ext = os.path.splitext(file_info.filename)[1].lower()
            if ext:
                extensions.add(ext[1:])

elif py7zr.is_7zfile(archive_path):
    with py7zr.SevenZipFile(archive_path, mode='r') as z7_ref:
        for filename in z7_ref.getnames():
            ext = os.path.splitext(filename)[1].lower()
            if ext:
                extensions.add(ext[1:])

4、完整代碼

# -*- coding: UTF-8 -*-
'''
@Project :測試 
@File    :main.py
@IDE     :PyCharm 
@Author  :一晌小貪歡(278865463@qq.com)
@Date    :2024/12/23 15:32 
'''


import os
import zipfile
import py7zr
import rarfile
import shutil

# 設(shè)置源文件夾和目標(biāo)文件夾
source_folder = '壓縮包數(shù)據(jù)源'
target_folder = '分類文件夾'

# 檢查目標(biāo)文件夾是否存在,不存在則創(chuàng)建
if not os.path.exists(target_folder):
    os.makedirs(target_folder)


def create_folder(folder_name):
    folder_path = os.path.join(target_folder, folder_name)
    if not os.path.exists(folder_path):
        os.makedirs(folder_path)
    return folder_path


def get_archive_extensions(archive_path):
    extensions = set()

    try:
        if zipfile.is_zipfile(archive_path):
            with zipfile.ZipFile(archive_path, 'r') as zip_ref:
                for file_info in zip_ref.infolist():
                    ext = os.path.splitext(file_info.filename)[1].lower()
                    if ext:
                        extensions.add(ext[1:])  # 去掉點(diǎn)號

        elif rarfile.is_rarfile(archive_path):
            with rarfile.RarFile(archive_path) as rar_ref:
                for file_info in rar_ref.infolist():
                    ext = os.path.splitext(file_info.filename)[1].lower()
                    if ext:
                        extensions.add(ext[1:])

        elif py7zr.is_7zfile(archive_path):
            with py7zr.SevenZipFile(archive_path, mode='r') as z7_ref:
                for filename in z7_ref.getnames():
                    ext = os.path.splitext(filename)[1].lower()
                    if ext:
                        extensions.add(ext[1:])
    except Exception as e:
        print(f"讀取文件 {archive_path} 時(shí)出錯(cuò): {str(e)}")
        return set()

    return extensions


# 主程序
for filename in os.listdir(source_folder):
    file_path = os.path.join(source_folder, filename)

    if os.path.isfile(file_path):
        # 獲取壓縮包內(nèi)所有文件的擴(kuò)展名
        extensions = get_archive_extensions(file_path)

        if extensions:
            # 如果只有一種文件類型,移動(dòng)到對應(yīng)文件夾
            if len(extensions) == 1:
                ext = extensions.pop()
                dest_folder = create_folder(ext)
                dest_path = os.path.join(dest_folder, filename)
                shutil.move(file_path, dest_path)
                print(f"移動(dòng) {filename} 到 {ext} 文件夾")
            else:
                # 如果有多種文件類型,移動(dòng)到 mixed 文件夾
                dest_folder = create_folder('mixed')
                dest_path = os.path.join(dest_folder, filename)
                shutil.move(file_path, dest_path)
                print(f"移動(dòng) {filename} 到 mixed 文件夾 (包含文件類型: {', '.join(extensions)})")
        else:
            print(f"跳過文件: {filename} (無法讀取或沒有有效文件)")

到此這篇關(guān)于Python解析壓縮包內(nèi)部文件的后綴名并分類存放的文章就介紹到這了,更多相關(guān)Python解析文件后綴名內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • python try except返回異常的信息字符串代碼實(shí)例

    python try except返回異常的信息字符串代碼實(shí)例

    這篇文章主要介紹了python try except返回異常的信息字符串代碼實(shí)例,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-08-08
  • 用Python編寫一個(gè)鼠標(biāo)自動(dòng)點(diǎn)擊程序詳細(xì)過程

    用Python編寫一個(gè)鼠標(biāo)自動(dòng)點(diǎn)擊程序詳細(xì)過程

    這篇文章主要給大家介紹了關(guān)于如何使用Python編寫一個(gè)鼠標(biāo)自動(dòng)點(diǎn)擊程序,通過使用pyautogui庫,可以實(shí)現(xiàn)模擬鼠標(biāo)點(diǎn)擊的功能,文章還介紹了如何使用time庫和threading庫來控制點(diǎn)擊間隔時(shí)間和實(shí)現(xiàn)多線程,需要的朋友可以參考下
    2024-11-11
  • Python3實(shí)現(xiàn)并發(fā)檢驗(yàn)代理池地址的方法

    Python3實(shí)現(xiàn)并發(fā)檢驗(yàn)代理池地址的方法

    這篇文章主要介紹了Python3實(shí)現(xiàn)并發(fā)檢驗(yàn)代理池地址的方法,實(shí)例分析了Python3基于線程的代理檢驗(yàn)操作相關(guān)技巧,需要的朋友可以參考下
    2016-09-09
  • Python繪圖Turtle庫的安裝問題解決

    Python繪圖Turtle庫的安裝問題解決

    這篇文章主要介紹了Python繪圖中解決Turtle的安裝問題示例分析,也遇到過相同問題的同學(xué)可以借鑒參考下,希望能夠解決你的問題
    2021-10-10
  • Python錯(cuò)誤+異常+模塊總結(jié)

    Python錯(cuò)誤+異常+模塊總結(jié)

    這篇文章主要介紹了Python錯(cuò)誤+異常+模塊總結(jié),在編程時(shí)遇見錯(cuò)誤信息在所難免,Python中會(huì)也有很多種錯(cuò)誤信息,常見的兩種就是語法錯(cuò)誤和邏輯錯(cuò)誤,下文我們就來總結(jié)一下那些常見的異常,需要的小伙伴可以參考一下
    2022-05-05
  • pandas 實(shí)現(xiàn)分組后取第N行

    pandas 實(shí)現(xiàn)分組后取第N行

    這篇文章主要介紹了pandas 實(shí)現(xiàn)分組后取第N行的操作,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2021-03-03
  • python中g(shù)eopandas庫安裝出現(xiàn)各種問題的解決辦法

    python中g(shù)eopandas庫安裝出現(xiàn)各種問題的解決辦法

    這篇文章主要介紹了關(guān)于python中g(shù)eopandas庫安裝出現(xiàn)各種問題的解決辦法,總結(jié)了在Windows下兩種安裝geopandas庫的方法,方法一是在新環(huán)境下使用conda命令安裝,方法二通過離線安裝GDAL、Fiona、Pyproj、Rtree、Shapely五個(gè)庫,再用pip安裝geopandas,需要的朋友可以參考下
    2024-11-11
  • Python實(shí)現(xiàn)提取Excel指定關(guān)鍵詞的行數(shù)據(jù)

    Python實(shí)現(xiàn)提取Excel指定關(guān)鍵詞的行數(shù)據(jù)

    這篇文章主要為大家介紹了如何利用Python實(shí)現(xiàn)提取Excel指定關(guān)鍵詞的行數(shù)據(jù),文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起動(dòng)手試一試
    2022-03-03
  • Python?Asyncio中Coroutines,Tasks,Future可等待對象的關(guān)系及作用

    Python?Asyncio中Coroutines,Tasks,Future可等待對象的關(guān)系及作用

    這篇文章主要介紹了Python?Asyncio中Coroutines,Tasks,Future可等待對象的關(guān)系及作用,文章圍繞主題展開詳細(xì)的內(nèi)容介紹,需要的小伙伴可以參考一下
    2022-06-06
  • python爬蟲豆瓣網(wǎng)的模擬登錄實(shí)現(xiàn)

    python爬蟲豆瓣網(wǎng)的模擬登錄實(shí)現(xiàn)

    這篇文章主要介紹了python爬蟲豆瓣網(wǎng)的模擬登錄實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-08-08

最新評論