欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python實現(xiàn)的刪除重復(fù)文件或圖片功能示例【去重】

 更新時間:2019年04月23日 10:36:33   作者:loveliuzz  
這篇文章主要介紹了Python實現(xiàn)的刪除重復(fù)文件或圖片功能,結(jié)合實例形式分析了Python基于os與hashlib模塊針對文件的讀取、hash計算及重復(fù)性判定等相關(guān)操作技巧,需要的朋友可以參考下

本文實例講述了Python實現(xiàn)的刪除重復(fù)文件或圖片功能。分享給大家供大家參考,具體如下:

通過python爬蟲或其他方式保存的圖片文件通常包含一些重復(fù)的圖片或文件,

通過下面的python代碼可以將重復(fù)的文件刪除以達(dá)到去重的目的。其中,文件目錄結(jié)構(gòu)如下圖:

# /usr/bin/env python
# -*- coding:utf-8 -*-
# 運(yùn)行的代碼文件要放到刪除重復(fù)的文件或圖片所包含的目錄中
import os
import hashlib
def filecount():
  filecount = int(os.popen('dir /B |find /V /C ""').read())
  return (filecount)
def md5sum(filename):
  f = open(filename, 'rb')
  md5 = hashlib.md5()
  while True:
    fb = f.read(8096)
    if not fb:
      break
    md5.update(fb)
  f.close()
  return (md5.hexdigest())
def delfile():
  all_md5 = {}
  filedir = os.walk(os.getcwd())
  for i in filedir:
    for tlie in i[2]:
      if md5sum(tlie) in all_md5.values():
        os.remove(tlie)
      else:
        all_md5[tlie] = md5sum(tlie)
if __name__ == '__main__':
  oldf = filecount()
  print('去重前有', oldf, '個文件\n\n\n請稍等正在刪除重復(fù)文件...')
  delfile()
  print('\n\n去重后剩', filecount(), '個文件')
  print('\n\n一共刪除了', oldf - filecount(), '個文件\n\n')

更多關(guān)于Python相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《Python文件與目錄操作技巧匯總》、《Python文本文件操作技巧匯總》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》及《Python入門與進(jìn)階經(jīng)典教程

希望本文所述對大家Python程序設(shè)計有所幫助。

相關(guān)文章

  • Flask框架實現(xiàn)debug模式下計算pin碼

    Flask框架實現(xiàn)debug模式下計算pin碼

    pin碼也就是flask在開啟debug模式下,進(jìn)行代碼調(diào)試模式的進(jìn)入密碼。本文為大家整理了Flask框架在debug模式下計算pin碼的方法,需要的可以參考一下
    2023-02-02
  • PyTorch中topk函數(shù)的用法詳解

    PyTorch中topk函數(shù)的用法詳解

    今天小編就為大家分享一篇PyTorch中topk函數(shù)的用法詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-01-01
  • 如何在向量化NumPy數(shù)組上進(jìn)行移動窗口

    如何在向量化NumPy數(shù)組上進(jìn)行移動窗口

    這篇文章主要介紹了如何在向量化NumPy數(shù)組上進(jìn)行移動窗口的操作,具有很好的參考價值,希望對大家有所幫助。
    2021-05-05
  • python Zmail模塊簡介與使用示例

    python Zmail模塊簡介與使用示例

    這篇文章主要介紹了python Zmail模塊簡介與使用示例,幫助大家利用python收發(fā)郵件,感興趣的朋友可以了解下
    2020-12-12
  • python對excel文檔去重及求和的實例

    python對excel文檔去重及求和的實例

    下面小編就為大家分享一篇python對excel文檔去重及求和的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-04-04
  • Python實現(xiàn)五子棋人機(jī)對戰(zhàn)?和人人對戰(zhàn)

    Python實現(xiàn)五子棋人機(jī)對戰(zhàn)?和人人對戰(zhàn)

    這篇文章主要介紹了Python實現(xiàn)五子棋人機(jī)對戰(zhàn)?和人人對戰(zhàn),通過定義黑白子,落子位置以及獲勝規(guī)則展開詳細(xì)內(nèi)容,需要的小伙伴可以參考一下
    2022-05-05
  • 關(guān)于Python中的main方法教程

    關(guān)于Python中的main方法教程

    估計很多人跟我一樣初學(xué)python看代碼的時候先找一下main()方法,從main往下看。但事實上python中是沒有你理解中的“main()”方法的,一起來看看吧
    2023-03-03
  • Python工具腳本調(diào)用外層模塊的操作方法

    Python工具腳本調(diào)用外層模塊的操作方法

    今天有同學(xué)問我,這種情況應(yīng)該怎么調(diào)用,才能讓remove_outdated_data.py正確導(dǎo)入models里面的模塊,下面通過本文介紹下Python工具腳本調(diào)用外層模塊的方法,感興趣的朋友一起看看吧
    2024-02-02
  • plt.figure()參數(shù)使用詳解及運(yùn)行演示

    plt.figure()參數(shù)使用詳解及運(yùn)行演示

    這篇文章主要介紹了plt.figure()參數(shù)使用詳解及運(yùn)行演示,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-01-01
  • python如何用columns參數(shù)獲取DataFrame各列的表頭名

    python如何用columns參數(shù)獲取DataFrame各列的表頭名

    這篇文章主要介紹了python如何用columns參數(shù)獲取DataFrame各列的表頭名問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
    2024-03-03

最新評論