應(yīng)用OpenCV和Python進(jìn)行SIFT算法的實現(xiàn)詳解
應(yīng)用OpenCV和Python進(jìn)行SIFT算法的實現(xiàn)
如下圖為進(jìn)行測試的gakki101和gakki102,分別驗證基于BFmatcher、FlannBasedMatcher等的SIFT算法,對比其優(yōu)劣。為體現(xiàn)出匹配效果對于旋轉(zhuǎn)特性的優(yōu)勢,將圖gakki101做成具有旋轉(zhuǎn)特性的效果。

基于BFmatcher的SIFT實現(xiàn)
BFmatcher(Brute-Force Matching)暴力匹配,應(yīng)用BFMatcher.knnMatch( )函數(shù)來進(jìn)行核心的匹配,knnMatch(k-nearest neighbor classification)k近鄰分類算法。
kNN算法則是從訓(xùn)練集中找到和新數(shù)據(jù)最接近的k條記錄,然后根據(jù)他們的主要分類來決定新數(shù)據(jù)的類別。該算法涉及3個主要因素:訓(xùn)練集、距離或相似的衡量、k的大小。kNN算法的核心思想是如果一個樣本在特征空間中的k個最相鄰的樣本中的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別,并具有這個類別上樣本的特性。該方法在確定分類決策上只依據(jù)最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。
kNN方法在類別決策時,只與極少量的相鄰樣本有關(guān)。由于kNN方法主要靠周圍有限的鄰近的樣本,而不是靠判別類域的方法來確定所屬類別的,因此對于類域的交叉或重疊較多的待分樣本集來說,kNN方法較其他方法更為適合。
經(jīng)檢驗 BFmatcher在做匹配時會耗費(fèi)大量的時間。
代碼段如下:
import numpy as np
import cv2
from matplotlib import pyplot as plt
imgname1 = 'E:/other/gakki101.jpg'
imgname2 = 'E:/other/gakki102.jpg'
sift = cv2.xfeatures2d.SIFT_create()
img1 = cv2.imread(imgname1)
gray1 = cv2.cvtColor(img1, cv2.COLOR_BGR2GRAY) #灰度處理圖像
kp1, des1 = sift.detectAndCompute(img1,None) #des是描述子
img2 = cv2.imread(imgname2)
gray2 = cv2.cvtColor(img2, cv2.COLOR_BGR2GRAY)#灰度處理圖像
kp2, des2 = sift.detectAndCompute(img2,None) #des是描述子
hmerge = np.hstack((gray1, gray2)) #水平拼接
cv2.imshow("gray", hmerge) #拼接顯示為gray
cv2.waitKey(0)
img3 = cv2.drawKeypoints(img1,kp1,img1,color=(255,0,255)) #畫出特征點,并顯示為紅色圓圈
img4 = cv2.drawKeypoints(img2,kp2,img2,color=(255,0,255)) #畫出特征點,并顯示為紅色圓圈
hmerge = np.hstack((img3, img4)) #水平拼接
cv2.imshow("point", hmerge) #拼接顯示為gray
cv2.waitKey(0)
# BFMatcher解決匹配
bf = cv2.BFMatcher()
matches = bf.knnMatch(des1,des2, k=2)
# 調(diào)整ratio
good = []
for m,n in matches:
if m.distance < 0.75*n.distance:
good.append([m])
img5 = cv2.drawMatchesKnn(img1,kp1,img2,kp2,matches,None,flags=2)
cv2.imshow("BFmatch", img5)
cv2.waitKey(0)
cv2.destroyAllWindows()
首先是針對圖像的灰度化顯示:

之后完成特征點的標(biāo)注,用紅色圓圈表示:

在cv2.drawMatchesKnn(img1,kp1,img2,kp2,matches,None,flags=2)下的匹配效果,比較雜亂,且會出錯。

如果更換為cv2.drawMatchesKnn(img1,kp1,img2,kp2,good,None,flags=2),明顯優(yōu)于上面的匹配,并且為預(yù)想的匹配區(qū)域,其效果為:

基于FlannBasedMatcher的SIFT實現(xiàn)
FLANN(Fast_Library_for_Approximate_Nearest_Neighbors)快速最近鄰搜索包,它是一個對大數(shù)據(jù)集和高維特征進(jìn)行最近鄰搜索的算法的集合,而且這些算法都已經(jīng)被優(yōu)化過了。在面對大數(shù)據(jù)集時它的效果要好于 BFMatcher。
經(jīng)驗證,F(xiàn)LANN比其他的最近鄰搜索軟件快10倍。使用 FLANN 匹配,我們需要傳入兩個字典作為參數(shù)。這兩個用來確定要使用的算法和其他相關(guān)參數(shù)等。
第一個是 IndexParams。
index_params = dict(algorithm = FLANN_INDEX_KDTREE, trees = 5) 。
這里使用的是KTreeIndex配置索引,指定待處理核密度樹的數(shù)量(理想的數(shù)量在1-16)。
第二個字典是SearchParams。
search_params = dict(checks=100)用它來指定遞歸遍歷的次數(shù)。值越高結(jié)果越準(zhǔn)確,但是消耗的時間也越多。實際上,匹配效果很大程度上取決于輸入。
5kd-trees和50checks總能取得合理精度,而且短時間完成。在之下的代碼中,丟棄任何距離大于0.7的值,則可以避免幾乎90%的錯誤匹配,但是好的匹配結(jié)果也會很少。
import numpy as np
import cv2
from matplotlib import pyplot as plt
imgname1 = 'E:/other/gakki101.jpg'
imgname2 = 'E:/other/gakki102.jpg'
sift = cv2.xfeatures2d.SIFT_create()
# FLANN 參數(shù)設(shè)計
FLANN_INDEX_KDTREE = 0
index_params = dict(algorithm = FLANN_INDEX_KDTREE, trees = 5)
search_params = dict(checks=50)
flann = cv2.FlannBasedMatcher(index_params,search_params)
img1 = cv2.imread(imgname1)
gray1 = cv2.cvtColor(img1, cv2.COLOR_BGR2GRAY) #灰度處理圖像
kp1, des1 = sift.detectAndCompute(img1,None)#des是描述子
img2 = cv2.imread(imgname2)
gray2 = cv2.cvtColor(img2, cv2.COLOR_BGR2GRAY)
kp2, des2 = sift.detectAndCompute(img2,None)
hmerge = np.hstack((gray1, gray2)) #水平拼接
cv2.imshow("gray", hmerge) #拼接顯示為gray
cv2.waitKey(0)
img3 = cv2.drawKeypoints(img1,kp1,img1,color=(255,0,255))
img4 = cv2.drawKeypoints(img2,kp2,img2,color=(255,0,255))
hmerge = np.hstack((img3, img4)) #水平拼接
cv2.imshow("point", hmerge) #拼接顯示為gray
cv2.waitKey(0)
matches = flann.knnMatch(des1,des2,k=2)
matchesMask = [[0,0] for i in range(len(matches))]
good = []
for m,n in matches:
if m.distance < 0.7*n.distance:
good.append([m])
img5 = cv2.drawMatchesKnn(img1,kp1,img2,kp2,matches,None,flags=2)
cv2.imshow("FLANN", img5)
cv2.waitKey(0)
cv2.destroyAllWindows()
首先是針對圖像的灰度化顯示:

之后完成特征點的標(biāo)注,用紅色圓圈表示:

在cv2.drawMatchesKnn(img1,kp1,img2,kp2,matches,None,flags=2)下的匹配效果,比較雜亂,且會出錯。

如果更換為cv2.drawMatchesKnn(img1,kp1,img2,kp2,good,None,flags=2),明顯優(yōu)于上面的匹配,并且為預(yù)想的匹配區(qū)域,其效果為:

修改if m.distance < 0.7*n.distance:為 if m.distance < 1*n.distance:,顯示效果為:

可見,雖然值越大,匹配的線條越密集,但錯誤匹配點也會增多,在lowe論文中,Lowe推薦ratio的閾值為0.8,但作者對大量任意存在尺度、旋轉(zhuǎn)和亮度變化的兩幅圖片進(jìn)行匹配,結(jié)果表明ratio取值在0. 4~0. 6 之間最佳,小于0. 4的很少有匹配點,大于0. 6的則存在大量錯誤匹配點,所以建議ratio的取值原則如下:
ratio=0. 4:對于準(zhǔn)確度要求高的匹配;
ratio=0. 6:對于匹配點數(shù)目要求比較多的匹配;
ratio=0. 5:一般情況下。
基于FlannBasedMatcher的SURF實現(xiàn)
SURF全稱為“加速穩(wěn)健特征”(Speeded Up Robust Feature),不僅是尺度不變特征,而且是具有較高計算效率的特征。可被認(rèn)為SURF是尺度不變特征變換算法(SIFT算法)的加速版。SURF最大的特征在于采用了haar特征以及積分圖像的概念,SIFT采用的是DoG圖像,而SURF采用的是Hessian矩陣(SURF算法核心)行列式近似值圖像。SURF借鑒了SIFT算法中簡化近似的思想,實驗證明,SURF算法較SIFT算法在運(yùn)算速度上要快3倍,綜合性優(yōu)于SIFT算法。
import numpy as np
import cv2
from matplotlib import pyplot as plt
imgname1 = 'E:/other/gakki101.jpg'
imgname2 = 'E:/other/gakki102.jpg'
surf = cv2.xfeatures2d.SURF_create()
FLANN_INDEX_KDTREE = 0
index_params = dict(algorithm = FLANN_INDEX_KDTREE, trees = 5)
search_params = dict(checks=50)
flann = cv2.FlannBasedMatcher(index_params,search_params)
img1 = cv2.imread(imgname1)
gray1 = cv2.cvtColor(img1, cv2.COLOR_BGR2GRAY) #灰度處理圖像
kp1, des1 = surf.detectAndCompute(img1,None)#des是描述子
img2 = cv2.imread(imgname2)
gray2 = cv2.cvtColor(img2, cv2.COLOR_BGR2GRAY)
kp2, des2 = surf.detectAndCompute(img2,None)
hmerge = np.hstack((gray1, gray2)) #水平拼接
cv2.imshow("gray", hmerge) #拼接顯示為gray
cv2.waitKey(0)
img3 = cv2.drawKeypoints(img1,kp1,img1,color=(255,0,255))
img4 = cv2.drawKeypoints(img2,kp2,img2,color=(255,0,255))
hmerge = np.hstack((img3, img4)) #水平拼接
cv2.imshow("point", hmerge) #拼接顯示為gray
cv2.waitKey(0)
matches = flann.knnMatch(des1,des2,k=2)
good = []
for m,n in matches:
if m.distance < 0.7*n.distance:
good.append([m])
img5 = cv2.drawMatchesKnn(img1,kp1,img2,kp2,good,None,flags=2)
cv2.imshow("SURF", img5)
cv2.waitKey(0)
cv2.destroyAllWindows()
在cv2.drawMatchesKnn(img1,kp1,img2,kp2,matches,None,flags=2)下的匹配效果,比較雜亂,且會出錯。

如果更換為cv2.drawMatchesKnn(img1,kp1,img2,kp2,good,None,flags=2),明顯優(yōu)于上面的匹配,并且為預(yù)想的匹配區(qū)域,其效果為:

但就其錯誤點數(shù)量和匹配效果而言,并沒有SIFT來的理想。
基于BFMatcher的ORB實現(xiàn)
ORB(Oriented Fast and Rotated BRIEF),結(jié)合Fast與Brief算法,并給Fast特征點增加了方向性,使得特征點具有旋轉(zhuǎn)不變性,并提出了構(gòu)造金字塔方法,解決尺度不變性,但文章中沒有具體詳述。特征提取是由FAST(Features from Accelerated Segment Test)算法發(fā)展來的,特征點描述是根據(jù)BRIEF(Binary Robust Independent Elementary Features)特征描述算法改進(jìn)的。ORB特征是將FAST特征點的檢測方法與BRIEF特征描述子結(jié)合起來,并在它們原來的基礎(chǔ)上做了改進(jìn)與優(yōu)化。ORB主要解決BRIEF描述子不具備旋轉(zhuǎn)不變性的問題。實驗證明,ORB遠(yuǎn)優(yōu)于之前的SIFT與SURF算法,ORB算法的速度是sift的100倍,是surf的10倍。
import numpy as np
import cv2
from matplotlib import pyplot as plt
imgname1 = 'E:/other/gakki101.jpg'
imgname2 = 'E:/other/gakki102.jpg'
orb = cv2.ORB_create()
img1 = cv2.imread(imgname1)
gray1 = cv2.cvtColor(img1, cv2.COLOR_BGR2GRAY) #灰度處理圖像
kp1, des1 = orb.detectAndCompute(img1,None)#des是描述子
img2 = cv2.imread(imgname2)
gray2 = cv2.cvtColor(img2, cv2.COLOR_BGR2GRAY)
kp2, des2 = orb.detectAndCompute(img2,None)
hmerge = np.hstack((gray1, gray2)) #水平拼接
cv2.imshow("gray", hmerge) #拼接顯示為gray
cv2.waitKey(0)
img3 = cv2.drawKeypoints(img1,kp1,img1,color=(255,0,255))
img4 = cv2.drawKeypoints(img2,kp2,img2,color=(255,0,255))
hmerge = np.hstack((img3, img4)) #水平拼接
cv2.imshow("point", hmerge) #拼接顯示為gray
cv2.waitKey(0)
# BFMatcher解決匹配
bf = cv2.BFMatcher()
matches = bf.knnMatch(des1,des2, k=2)
# 調(diào)整ratio
good = []
for m,n in matches:
if m.distance < 0.75*n.distance:
good.append([m])
img5 = cv2.drawMatchesKnn(img1,kp1,img2,kp2,good,None,flags=2)
cv2.imshow("ORB", img5)
cv2.waitKey(0)
cv2.destroyAllWindows()
經(jīng)顯示觀察到,ORB算法在特征點標(biāo)記時數(shù)量較少,如圖:

在cv2.drawMatchesKnn(img1,kp1,img2,kp2,matches,None,flags=2)下的匹配效果,比較雜亂,且會出錯。

如果更換為cv2.drawMatchesKnn(img1,kp1,img2,kp2,good,None,flags=2),明顯優(yōu)于上面的匹配,并且為預(yù)想的匹配區(qū)域,其效果為:

但同樣會出現(xiàn)在同樣的匹配方式上,效果不如SIFT的現(xiàn)象。
如下為使用FAST作為特征描述的關(guān)鍵代碼和提取圖像顯示:
import numpy as np
import cv2
from matplotlib import pyplot as plt
img = cv2.imread('E:/other/gakki102.',0)
fast=cv2.FastFeatureDetector_create()#獲取FAST角點探測器
kp=fast.detect(img,None)#描述符
img = cv2.drawKeypoints(img,kp,img,color=(255,255,0))#畫到img上面
print ("Threshold: ", fast.getThreshold())#輸出閾值
print ("nonmaxSuppression: ", fast.getNonmaxSuppression())#是否使用非極大值抑制
print ("Total Keypoints with nonmaxSuppression: ", len(kp))#特征點個數(shù)
cv2.imshow('fast',img)
cv2.waitKey(0)
如圖為FAST特征提取的圖像顯示:

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Python多線程編程threading模塊使用最佳實踐及常見問題解析
這篇文章主要為大家介紹了Python多線程編程threading模塊使用最佳實踐及常見問題解析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2024-01-01
Python pandas對excel的操作實現(xiàn)示例
這篇文章主要介紹了Python pandas對excel的操作實現(xiàn)示例,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-07-07
python-OpenCV 實現(xiàn)將數(shù)組轉(zhuǎn)換成灰度圖和彩圖
今天小編就為大家分享一篇python-OpenCV 實現(xiàn)將數(shù)組轉(zhuǎn)換成灰度圖和彩圖,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-01-01
python 深度學(xué)習(xí)中的4種激活函數(shù)
這篇文章主要介紹了python深度學(xué)習(xí)中的4種激活函數(shù),幫助大家更好的進(jìn)行深度學(xué)習(xí),感興趣的朋友可以了解下2020-09-09
解決Jupyter Notebook使用parser.parse_args出現(xiàn)錯誤問題
這篇文章主要介紹了解決Jupyter Notebook使用parser.parse_args出現(xiàn)錯誤問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-04-04
Python基于內(nèi)置庫pytesseract實現(xiàn)圖片驗證碼識別功能
這篇文章主要介紹了Python基于內(nèi)置庫pytesseract實現(xiàn)圖片驗證碼識別功能,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-02-02
Python樹莓派學(xué)習(xí)筆記之UDP傳輸視頻幀操作詳解
這篇文章主要介紹了Python樹莓派學(xué)習(xí)筆記之UDP傳輸視頻幀操作,結(jié)合實例形式詳細(xì)分析了Python樹莓派編程中使用UDP協(xié)議進(jìn)行視頻幀傳輸?shù)南嚓P(guān)操作技巧與注意事項,需要的朋友可以參考下2019-11-11

