欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python實現(xiàn)圖像檢索的三種(直方圖/OpenCV/哈希法)

 更新時間:2019年08月08日 14:37:36   作者:Mengwei_Ren  
這篇文章主要介紹了python實現(xiàn)圖像檢索的三種(直方圖/OpenCV/哈希法),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

簡介:

本文介紹了圖像檢索的三種實現(xiàn)方式,均用python完成,其中前兩種基于直方圖比較,哈希法基于像素分布。
檢索方式是:提前導入圖片庫作為檢索范圍,給出待檢索的圖片,將其與圖片庫中的圖片進行比較,得出所有相似度后進行排序,從而檢索結(jié)果為相似度由高到低的圖片。由于工程中還包含Qt界面類、觸發(fā)函數(shù)等其他部分,在該文檔中只給出關(guān)鍵函數(shù)的代碼。

開發(fā)系統(tǒng):MacOS
實現(xiàn)方式:Qt + Python

方法一:自定義的直方圖比較算法

a) 基本思路

遍歷圖片像素點,提取R\G\B值并進行對應的計數(shù),得到原始直方圖,但由于0-255的范圍太大,因此每一個像素值的統(tǒng)計量均偏小,因此分別將R\G\B的256個像素值映射到0-31共32個像素值上,將像素值范圍由256*3縮小到32*3。記錄像素值采用的數(shù)據(jù)結(jié)構(gòu)為一維數(shù)組,第1到32個值為R的像素直方圖,第33到第64個值為G的像素統(tǒng)計,第65到96個值為B的像素統(tǒng)計。得到直方圖后,計算待檢索圖的直方圖和圖片庫中圖像的直方圖之間的相似性。

b) 具體實現(xiàn)

用到的函數(shù):

  • split_Img()
  • calc_Hist(img)
  • calc_Similar(h1,h2)
  • calc_Similar_Split(h1,h2)

遍歷圖片的像素點以計算直方圖:calc_Hist(img)

嘗試了兩種方式,第一種是對圖像遍歷時逐個調(diào)用getpixel()來獲取R,G,B的值,但發(fā)現(xiàn)這種方式的速度太慢。第二種采用的是內(nèi)存讀取,利用load()函數(shù)一次性讀取圖像的像素值,然后對像素值進行遍歷,該方法的速度比逐個提取更快。

#統(tǒng)計直方圖,用load()載入圖片的像素pix,再分別讀取每個像素點的R\G\B值進行統(tǒng)計(分別為0-255)
#將256個顏色值的統(tǒng)計情況投影到32個,返回R\G\B投影后的統(tǒng)計值數(shù)組,共32*3=96個元素
def calc_Hist(img):
  '''
  #120張圖片,4.43s
  w,h = img.size
  pix = img.load() #載入圖片,pix存的是像素
  calcR = [0 for i in range(0,32)]
  calcG = [0 for i in range(0,32)]
  calcB = [0 for i in range(0,32)]
  for i in range(0,w):
    for j in range(0,h):
      (r,g,b) = pix[i,j]
      #print (r,g,b)
      calcR[r/8] += 1
      calcG[g/8] += 1
      calcB[b/8] += 1
  calcG.extend(calcB)
  calcR.extend(calcG)

  return calcR
  '''
  #120張圖,3.49s

  w,h = img.size
  pix = img.load() #載入圖片,pix存的是像素
  calcR = [0 for i in range(0,256)]
  calcG = [0 for i in range(0,256)]
  calcB = [0 for i in range(0,256)]
  for i in range(0,w):
    for j in range(0,h):
      (r,g,b) = pix[i,j]
      #print (r,g,b)
      calcR[r] += 1
      calcG[g] += 1
      calcB[b] += 1
  calcG.extend(calcB)
  calcR.extend(calcG) #256*3

  #calc存放最終結(jié)果,32*3
  calc = [0 for i in range(0,96)]
  step = 0 #calc的下標,0~95
  start = 0 #每次統(tǒng)計的開始位置
  while step < 96:
    for i in range(start,start+8): #8個值為1組,統(tǒng)計值相加,eg:色彩值為0~7的統(tǒng)計值全部轉(zhuǎn)換為色彩值為0的統(tǒng)計值
      calc[step] += calcR[i]
    start = start+8
    step += 1
  #print calc 
  return calc 

直方圖比較 calc_Similar(h1,h2)

采用的公式是: 

其中N為顏色級數(shù),Sim越靠近1則兩幅圖像的相似度越高。

c) 問題和改進

簡單實現(xiàn)直方圖比較后,檢索的結(jié)果并不好,和預期相比誤差較大。分析原因,直方圖比較主要依靠整幅圖像的色彩統(tǒng)計來進行比較,而對像素的位置并沒有很好的記錄,因此會造成誤判。

同時增加calc_Similar_Split(h1,h2)函數(shù),加入分塊比較的部分,計算方法是:對每個小塊調(diào)用calc_Similar(h1,h2),累加計算結(jié)果,最后除以16取平均值。

測試發(fā)現(xiàn)效果顯著提升,基于顏色相似的同時保留了形狀信息。

函數(shù)如下:

#該函數(shù)用于統(tǒng)一圖片大小為256*256,并且分割為16個塊,返回值是16個局部圖像句柄的數(shù)組
def split_Img(img, size = (64,64)):
  img = img.resize((256,256)).convert('RGB')
  w,h = img.size
  sw,sh = size
  return [img.crop((i,j,i+sw,j+sh)).copy() for i in xrange(0,w,sw) for j in xrange(0,h,sh)]

#計算兩個直方圖之間的相似度,h1和h2為直方圖,zip表示同步遍歷
def calc_Similar(h1,h2):
  return sum(1 - (0 if g==s else float(abs(g-s))/max(g,s)) for g,s in zip(h1,h2)) / len(h1)

方法二:openCV庫的直方圖比較算法實現(xiàn)

openCV開源庫已經(jīng)集成了直方圖提取、直方圖均衡化以及直方圖比較的功能,調(diào)用方便。為了進一步了解直方圖比較的各類實現(xiàn)方法,利用openCV重新進行了實驗。

a) 基本思路

對圖片庫中每個圖片提取直方圖并均衡化,然后調(diào)用cv庫函數(shù)進行直方圖比較,結(jié)果進行排序,并顯示。

b) 具體實現(xiàn)

首先調(diào)用cv2.imread()讀取圖像,然后調(diào)用cv2.calcHist()計算直方圖,cv2.normalize()均衡化后進入比較階段,調(diào)用cv2.compareHist(),比較待檢索圖和圖片庫圖像之間的直方圖差異,然后調(diào)用DisplayTotalPics()進行顯示。

關(guān)鍵代碼如下:

results = {} #記錄結(jié)果
reverse = True #correlation/intersection方法reverse為true,另外兩種為false

imgCV = cv2.imread(self.testImg.encode('utf-8'))
#self.testImg為待匹配圖片
testHist = cv2.calcHist([imgCV],[0,1,2],None,[8,8,8],[0,256,0,256,0,256])
#提取直方圖
testHist = cv2.normalize(testHist,testHist,0,255,cv2.NORM_MINMAX).flatten()
#均衡化

#計算self.testImg和其他圖片的直方圖差異,INTERSECTION方法效果比較好
for (k, hist) in self.index_cv.items(): 
#self.index_cv保存的是圖片庫中圖片的直方圖信息
  d = cv2.compareHist(testHist,hist, cv2.cv.CV_COMP_INTERSECT)
  results[k] = d
  #對結(jié)果排序,以v即上面的d作為關(guān)鍵字
  results = sorted([(v, k) for (k, v) in results.items()], reverse = reverse) 
  end = time.time()
  print 'OpenCV Time:'
  print end-start     
self.DisplayTotalPics(results)

c) 問題與解決

openCV中的compareHist函數(shù)中提供了4中比較方法:
1.相關(guān)系數(shù)標準(method=CV_COMP_CORREL) 值越大,相關(guān)度越高,最大值1,最小值0
2.卡方系數(shù)標準(method=CV_COMP_CHISQR) 值越小,相關(guān)度越高,無上限,最小值0
3.相交系數(shù)標準(method=CV_COMP_INTERSECT)值大,相關(guān)度越高,最大9.455319,最小0
4.巴氏系數(shù)的標準(method=CV_COMP_BHATTACHARYYA) 值小,相關(guān)度越高,最大值1,最小值0

測試后選擇的是method = cv2.cv.CV_COMP_INTERSECT

另外,該方法的速度很快,完全基于圖像的色彩分布,但在一些情況下精度并不高。

方法三:平均哈希值比較算法實現(xiàn)

用到的函數(shù):getKey(),getCode(),cmpCode()

a) 基本思路

平均哈希值的比較算法是基于像素分布的,比較對象是灰度圖的圖像指紋。圖像指紋的計算通過比較每個圖的像素值和平均像素值來計算,然后計算圖像指紋之間的漢明距離,排序后得到相似圖像。

b) 具體實現(xiàn)

具體方法是:計算進行灰度處理后圖片的所有像素點的平均值,然后遍歷灰度圖片每一個像素,如果大于平均值記錄為1,否則為0,這一步通過定義函數(shù)getCode(img)完成。接著計算編碼之間的漢明距離,即一組二進制數(shù)據(jù)變?yōu)榱硪唤M數(shù)據(jù)所需的步驟數(shù),漢明距離越小,說明圖像指紋的相似度越高。計算漢明距離可以通過簡單的遍歷和計數(shù)來完成,函數(shù)為compCode(code1,code2),其中code1和code2為getCode得到的圖像指紋。

關(guān)鍵函數(shù)代碼如下:

#獲取排序時的關(guān)鍵值(即漢明距離)    
def getKey(x): 
  return int(x[1])

#由灰度圖得到2值“指紋”,從而計算漢明距離
def getCode(img):
  w,h = img.size
  pixel = []
  for i in range(0,w):
    for j in range(0,h):
      pixel_value = img.getpixel((i,j))
      pixel.append(pixel_value) #加入pixel數(shù)組
  avg = sum(pixel)/len(pixel) #計算像素平均值

  cp = [] #二值數(shù)組
  for px in pixel:
    if px > avg:
      cp.append(1)
    else:
      cp.append(0)
  return cp

#計算兩個編碼之間的漢明距離
def compCode(code1,code2):
  num = 0
  for index in range(0,len(code1)):
    if code1[index] != code2[index]:
      num+=1
  #print num
  #print '\n'
  return num 

c) 問題與優(yōu)化

我們發(fā)現(xiàn)在數(shù)據(jù)量大時,該方法的檢索速度較慢,因此我們將圖像指紋也作為圖像的屬性存在self.hashCode中,在importFolder時計算好,避免后續(xù)操作中的冗余重復計算。

以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • python實現(xiàn)靜態(tài)服務器

    python實現(xiàn)靜態(tài)服務器

    這篇文章主要為大家詳細介紹了python實現(xiàn)靜態(tài)服務器,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2019-09-09
  • python開發(fā)之str.format()用法實例分析

    python開發(fā)之str.format()用法實例分析

    這篇文章主要介紹了python開發(fā)之str.format()用法,結(jié)合實例形式較為詳細的分析了str.format()函數(shù)的功能,使用方法與相關(guān)注意事項,代碼包含詳盡的注釋說明,需要的朋友可以參考下
    2016-02-02
  • tensorflow estimator 使用hook實現(xiàn)finetune方式

    tensorflow estimator 使用hook實現(xiàn)finetune方式

    今天小編就為大家分享一篇tensorflow estimator 使用hook實現(xiàn)finetune方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-01-01
  • Python實戰(zhàn)之疫苗研發(fā)情況可視化

    Python實戰(zhàn)之疫苗研發(fā)情況可視化

    2020年底以來,歐美,印度,中國,俄羅斯等多國得制藥公司紛紛推出了針對新冠/肺炎的疫苗,這部分主要分析了2020年以來全球疫情形勢,各類疫苗在全球的地理分布,疫苗在各國的接種進度進行可視化展示,需要的朋友可以參考下
    2021-05-05
  • 關(guān)于如何把Python對象存儲為文件的方法詳解

    關(guān)于如何把Python對象存儲為文件的方法詳解

    本文將給大家介紹如何把Python對象存儲為文件的方法,pickle可以用二進制表示并讀寫python數(shù)據(jù),這個功能并不安全,如果把一個pickle暴露給別人,有被植入惡意程序的風險,文中通過代碼給大家講解的非常詳細,需要的朋友可以參考下
    2024-01-01
  • 詳解windows python3.7安裝numpy問題的解決方法

    詳解windows python3.7安裝numpy問題的解決方法

    這篇文章主要介紹了windows python3.7安裝numpy問題的解決方法,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-08-08
  • Python連接MySQL并使用fetchall()方法過濾特殊字符

    Python連接MySQL并使用fetchall()方法過濾特殊字符

    這篇文章主要介紹了Python連接MySQL的方法并講解了如何使用fetchall()方法過濾特殊字符,示例環(huán)境為Ubuntu操作系統(tǒng),需要的朋友可以參考下
    2016-03-03
  • python如何爬取網(wǎng)站數(shù)據(jù)并進行數(shù)據(jù)可視化

    python如何爬取網(wǎng)站數(shù)據(jù)并進行數(shù)據(jù)可視化

    這篇文章主要介紹了python爬取拉勾網(wǎng)數(shù)據(jù)并進行數(shù)據(jù)可視化,爬取拉勾網(wǎng)關(guān)于python職位相關(guān)的數(shù)據(jù)信息,并將爬取的數(shù)據(jù)已csv各式存入文件,然后對csv文件相關(guān)字段的數(shù)據(jù)進行清洗,并對數(shù)據(jù)可視化展示,包括柱狀圖展示、直方圖展示,需要的朋友可以參考下
    2019-07-07
  • 解決Building?wheel?for?wrapt?(setup.py)?...?error的問題

    解決Building?wheel?for?wrapt?(setup.py)?...?error的問題

    這篇文章主要介紹了解決Building?wheel?for?wrapt?(setup.py)?...?error的問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-12-12
  • python探索之BaseHTTPServer-實現(xiàn)Web服務器介紹

    python探索之BaseHTTPServer-實現(xiàn)Web服務器介紹

    這篇文章主要介紹了python探索之BaseHTTPServer-實現(xiàn)Web服務器介紹,小編覺得還是挺不錯的,這里分享給大家,供需要的朋友參考。
    2017-10-10

最新評論