欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python查找重復圖片并刪除(圖片去重)

 更新時間:2019年07月16日 10:52:03   作者:eggie1988  
這篇文章主要為大家詳細介紹了python查找重復圖片并刪除,識別不同尺寸大小一致的圖片,具有一定的參考價值,感興趣的小伙伴們可以參考一下

本文實例為大家分享了python查找重復圖片并刪除的具體代碼,供大家參考,具體內容如下

和網絡爬蟲配套的,也可單獨使用,從網上爬下來的圖片重復太多,代碼支持識別不同尺寸大小一致的圖片,并把重復的圖片刪除,只保留第一份。

# -*- coding: utf-8 -*-
import cv2
import numpy as np
import os,sys,types

def cmpandremove2(path):
  dirs = os.listdir(path)
  dirs.sort()
  if len(dirs) <= 0:
    return
  dict={}
  for i in dirs:
    prepath = path + "/" + i
    preimg = cv2.imread(prepath)
    if type(preimg) is types.NoneType:
      continue
    preresize = cv2.resize(preimg, (8,8))
    pregray = cv2.cvtColor(preresize, cv2.COLOR_BGR2GRAY)
    premean = cv2.mean(pregray)[0]
    prearr = np.array(pregray.data)
    for j in range(0,len(prearr)):
      if prearr[j] >= premean:
        prearr[j] = 1
      else:
        prearr[j] = 0
    print "get", prepath
    dict[i] = prearr
  dictkeys = dict.keys()
  dictkeys.sort()
  index = 0
  while True:
    if index >= len(dictkeys):
      break
    curkey = dictkeys[index]
    dellist=[]
    print curkey
    index2 = index
    while True:
      if index2 >= len(dictkeys):
        break
      j = dictkeys[index2]
      if curkey == j:
        index2 = index2 + 1
        continue
      arr1 = dict[curkey]
      arr2 = dict[j]
      diff = 0
      for k in range(0,len(arr2)):
        if arr1[k] != arr2[k]:
          diff = diff + 1
      if diff <= 5:
        dellist.append(j)
      index2 = index2 + 1
    if len(dellist) > 0:
      for j in dellist:
        file = path + "/" + j
        print "remove", file
        os.remove(file)
        dict.pop(j)
      dictkeys = dict.keys()
      dictkeys.sort()
    index = index + 1


def cmpandremove(path):
  index = 0
  flag = 0
  dirs = os.listdir(path)
  dirs.sort()
  if len(dirs) <= 0:
    return 0
  while True:
    if index >= len(dirs):
      break
    prepath = path + dirs[index]
    print prepath
    index2 = 0
    preimg = cv2.imread(prepath)
    if type(preimg) is types.NoneType:
      index = index + 1
      continue
    preresize = cv2.resize(preimg, (8, 8))
    pregray = cv2.cvtColor(preresize, cv2.COLOR_BGR2GRAY)
    premean = cv2.mean(pregray)[0]
    prearr = np.array(pregray.data)
    for i in range(0, len(prearr)):
      if prearr[i] >= premean:
        prearr[i] = 1
      else:
        prearr[i] = 0
    removepath = []
    while True:
      if index2 >= len(dirs):
        break
      if index2 != index:
        curpath = path + dirs[index2]
        # print curpath
        curimg = cv2.imread(curpath)
        if type(curimg) is types.NoneType:
          index2 = index2 + 1
          continue
        curresize = cv2.resize(curimg, (8, 8))
        curgray = cv2.cvtColor(curresize, cv2.COLOR_BGR2GRAY)
        curmean = cv2.mean(curgray)[0]
        curarr = np.array(curgray.data)
        for i in range(0, len(curarr)):
          if curarr[i] >= curmean:
            curarr[i] = 1
          else:
            curarr[i] = 0
        diff = 0
        for i in range(0, len(curarr)):
          if curarr[i] != prearr[i]:
            diff = diff + 1
        if diff <= 5:
          print 'the same'
          removepath.append(curpath)
          flag = 1
      index2 = index2 + 1
    index = index + 1
    if len(removepath) > 0:
      for file in removepath:
        print "remove", file
        os.remove(file)
      dirs = os.listdir(path)
      dirs.sort()
      if len(dirs) <= 0:
        return 0
        # index = 0
  return flag


path = 'pics/'
cmpandremove(path)

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。

相關文章

  • Django中QuerySet查詢優(yōu)化之prefetch_related詳解

    Django中QuerySet查詢優(yōu)化之prefetch_related詳解

    prefetch_related()和select_related()的設計目的很相似,都是為了減少SQL查詢的數量,但是實現的方式不一樣,下面這篇文章主要給大家介紹了關于Django中QuerySet查詢優(yōu)化之prefetch_related的相關資料,需要的朋友可以參考下
    2022-11-11
  • 淺談PyTorch中in-place operation的含義

    淺談PyTorch中in-place operation的含義

    這篇文章主要介紹了淺談PyTorch中in-place operation的含義,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-06-06
  • python中openpyxl庫用法詳解

    python中openpyxl庫用法詳解

    openpyxl模塊是一個讀寫Excel 文檔的Python庫,openpyxl是一個比較綜合的工具,能夠同時讀取和修改Excel文檔,這篇文章主要介紹了python中openpyxl庫用法詳解,需要的朋友可以參考下
    2022-09-09
  • Tensorflow 利用tf.contrib.learn建立輸入函數的方法

    Tensorflow 利用tf.contrib.learn建立輸入函數的方法

    這篇文章主要介紹了Tensorflow 利用tf.contrib.learn建立輸入函數的方法,小編覺得挺不錯的,現在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-02-02
  • python讀取txt文件,去掉空格計算每行長度的方法

    python讀取txt文件,去掉空格計算每行長度的方法

    今天小編就為大家分享一篇python讀取txt文件,去掉空格計算每行長度的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-12-12
  • python 如何將字典寫為json文件

    python 如何將字典寫為json文件

    這篇文章主要介紹了python 如何將字典寫為json文件的操作,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2021-09-09
  • 基于Python正確讀取資源文件

    基于Python正確讀取資源文件

    這篇文章主要介紹了基于Python正確讀取資源文件,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2020-09-09
  • 詳解使用Python處理文件目錄的相關方法

    詳解使用Python處理文件目錄的相關方法

    這篇文章主要介紹了使用Python處理文件目錄的相關方法,使用到了os模塊,需要的朋友可以參考下
    2015-10-10
  • Python?copy()與deepcopy()方法之間有什么區(qū)別

    Python?copy()與deepcopy()方法之間有什么區(qū)別

    這篇文章主要介紹了Python中的copy()和deepcopy(),下面詳細介紹該內容并附上詳細代碼,需要的朋友可以參考一下文章的具體內容,希望對你有所幫助
    2022-10-10
  • 詳解python with 上下文管理器

    詳解python with 上下文管理器

    這篇文章主要介紹了python with和上下文管理器的相關資料,幫助大家更好的理解和學習python,感興趣的朋友可以了解下
    2020-09-09

最新評論