利用python實(shí)現(xiàn)AR教程
先了解如何利用python語(yǔ)言實(shí)現(xiàn)以平面和標(biāo)記物進(jìn)行姿態(tài)估計(jì)
本實(shí)驗(yàn)只是先實(shí)現(xiàn)一個(gè)簡(jiǎn)單的小例子。簡(jiǎn)單來(lái)說(shuō)就是先識(shí)別出圖像中的參考面,再拍攝一張目標(biāo)圖像,將參考面頂部的3D模型投影到目標(biāo)圖像上。
大致步驟如下:
識(shí)別參考平面
在這一步中,我們所需要做的事就是提取參考圖像和目標(biāo)圖像的sift特征,然后使用RANSAC算法穩(wěn)健地估計(jì)單應(yīng)性矩陣。
代碼如下:
#計(jì)算特征
sift.process_image('D:輸入圖片/book_frontal.JPG', 'im0.sift')
l0, d0 = sift.read_features_from_file('im0.sift')
sift.process_image('D:輸入圖片/book_per.JPG', 'im1.sift')
l1, d1 = sift.read_features_from_file('im1.sift')
#匹配特征,并計(jì)算單應(yīng)性矩陣
matches = sift.match_twosided(d0, d1)
ndx = matches.nonzero()[0]
fp = homography.make_homog(l0[ndx, :2].T)
ndx2 = [int(matches[i]) for i in ndx]
tp = homography.make_homog(l1[ndx2, :2].T)
model = homography.RansacModel()
H, inliers = homography.H_from_ransac(fp, tp, model)
由上面代碼可得到單應(yīng)性矩陣,它能夠?qū)⒁环鶊D像中標(biāo)記物的點(diǎn)映射到另一幅圖像中的對(duì)應(yīng)點(diǎn)。還需要建立X-Y(Z=0)三維坐標(biāo)系,標(biāo)記物在Z=0平面上,原點(diǎn)在標(biāo)記物的某個(gè)位置上。
從單應(yīng)性推導(dǎo)出從參考面坐標(biāo)系到目標(biāo)圖像坐標(biāo)系的轉(zhuǎn)換
在進(jìn)行坐標(biāo)轉(zhuǎn)換之前,為了檢驗(yàn)單應(yīng)性矩陣結(jié)果的正確性,需要將一些三維物體放置在目標(biāo)圖像上,本實(shí)驗(yàn)使用了一個(gè)立方體。產(chǎn)生立方體的代碼如下:
def cube_points(c, wid): p = [] p.append([c[0]-wid, c[1]-wid, c[2]-wid]) p.append([c[0]-wid, c[1]+wid, c[2]-wid]) p.append([c[0]+wid, c[1]+wid, c[2]-wid]) p.append([c[0]+wid, c[1]-wid, c[2]-wid]) p.append([c[0]-wid, c[1]-wid, c[2]-wid]) p.append([c[0]-wid, c[1]-wid, c[2]+wid]) p.append([c[0]-wid, c[1]+wid, c[2]+wid]) p.append([c[0]+wid, c[1]+wid, c[2]+wid]) p.append([c[0]+wid, c[1]-wid, c[2]+wid]) p.append([c[0]-wid, c[1]-wid, c[2]+wid]) p.append([c[0]-wid, c[1]-wid, c[2]+wid]) p.append([c[0]-wid, c[1]+wid, c[2]+wid]) p.append([c[0]-wid, c[1]+wid, c[2]-wid]) p.append([c[0]+wid, c[1]+wid, c[2]-wid]) p.append([c[0]+wid, c[1]+wid, c[2]+wid]) p.append([c[0]+wid, c[1]-wid, c[2]+wid]) p.append([c[0]+wid, c[1]-wid, c[2]-wid] return array(p).T
先計(jì)算出照相機(jī)的標(biāo)定矩陣,就可以得出兩個(gè)視圖間的相對(duì)變換
代碼如下:
#計(jì)算照相機(jī)標(biāo)定矩陣,使用圖像的分辨率為747*1000 K = my_calibration((747, 1000)) #位于邊長(zhǎng)為0.2,Z=0平面上的三維點(diǎn) box = cube_points([0, 0, 0.1], 0.1) #投影第一幅圖像上底部的正方形 cam1 = camera.Camera(hstack((K, dot(K, array([[0], [0], [-1]]))))) #底部正方形上的點(diǎn) box_cam1 = cam1.project(homography.make_homog(box[:, :5])) #使用H將點(diǎn)變換到第二幅圖像上 box_trans = homography.normalize(dot(H,box_cam1)) #從cam1和H中計(jì)算第二個(gè)照相機(jī)矩陣 cam2 = camera.Camera(dot(H, cam1.P)) A = dot(linalg.inv(K), cam2.P[:, :3]) A = array([A[:, 0], A[:, 1], cross(A[:, 0], A[:, 1])]).T cam2.P[:, :3] = dot(K, A) #使用第二個(gè)照相機(jī)矩陣投影 box_cam2 = cam2.project(homography.make_homog(box))
在圖像(像素空間)中投影我們的3D模型并繪制它。
#底部正方形的二維投影
figure()
imshow(im0)
plot(box_cam1[0, :], box_cam1[1, :], linewidth=3)
title('2D projection of bottom square')
axis('off')
#使用H對(duì)二維投影進(jìn)行變換
figure()
imshow(im1)
plot(box_trans[0, :], box_trans[1, :], linewidth=3)
title('2D projection transfered with H')
axis('off')
#三維立方體
figure()
imshow(im1)
plot(box_cam2[0, :], box_cam2[1, :], linewidth=3)
title('3D points projected in second image')
axis('off')
實(shí)驗(yàn)結(jié)果如下

什么是AR
AR全稱Augmented Reality,意為增強(qiáng)現(xiàn)實(shí)技術(shù)。
它是一種將真實(shí)世界信息和虛擬世界信息“無(wú)縫”集成的新技術(shù),是把原本在現(xiàn)實(shí)世界的一定時(shí)間空間范圍內(nèi)很難體驗(yàn)到的實(shí)體信息(視覺(jué)信息,聲音,味道,觸覺(jué)等),通過(guò)電腦等科學(xué)技術(shù),模擬仿真后再疊加,將虛擬的信息應(yīng)用到真實(shí)世界,被人類感官所感知,從而達(dá)到超越現(xiàn)實(shí)的感官體驗(yàn)。真實(shí)的環(huán)境和虛擬的物體實(shí)時(shí)地疊加到了同一個(gè)畫(huà)面或空間同時(shí)存在。
增強(qiáng)現(xiàn)實(shí)技術(shù),不僅展現(xiàn)了真實(shí)世界的信息,而且將虛擬的信息同時(shí)顯示出來(lái),兩種信息相互補(bǔ)充、疊加。在視覺(jué)化的增強(qiáng)現(xiàn)實(shí)中,用戶利用頭盔顯示器,把真實(shí)世界與電腦圖形多重合成在一起,便可以看到真實(shí)的世界圍繞著它。
增強(qiáng)現(xiàn)實(shí)技術(shù)包含了多媒體、三維建模、實(shí)時(shí)視頻顯示及控制、多傳感器融合、實(shí)時(shí)跟蹤及注冊(cè)、場(chǎng)景融合等新技術(shù)與新手段。增強(qiáng)現(xiàn)實(shí)提供了在一般情況下,不同于人類可以感知的信息。
如何利用python實(shí)現(xiàn)AR
步驟和實(shí)現(xiàn)姿態(tài)估計(jì)無(wú)太大差別。由上述內(nèi)容計(jì)算出照相機(jī)的位置和姿態(tài),使用這些信息來(lái)放置計(jì)算機(jī)圖像學(xué)模型。這里我們放置了一個(gè)紅色的小茶壺。
在運(yùn)行代碼之前,我們需要先安裝PyGame和PyOpenGL,下載鏈接(https://www.lfd.uci.edu/~gohlke/pythonlibs/)。
核心代碼如下:
def set_projection_from_camera(K):
#從照相機(jī)標(biāo)定矩陣中獲得視圖
glMatrixMode(GL_PROJECTION)
glLoadIdentity()
fx = K[0,0]
fy = K[1,1]
fovy = 2*math.atan(0.5*height/fy)*180/math.pi
aspect = (width*fy)/(height*fx)
near = 0.1
far = 100.0
gluPerspective(fovy,aspect,near,far)
glViewport(0,0,width,height)
def set_modelview_from_camera(Rt):
#從照相機(jī)姿態(tài)中獲取模擬視圖矩陣
glMatrixMode(GL_MODELVIEW)
glLoadIdentity()
Rx = np.array([[1,0,0],[0,0,-1],[0,1,0]])
R = Rt[:,:3]
U,S,V = np.linalg.svd(R)
R = np.dot(U,V)
R[0,:] = -R[0,:]
t = Rt[:,3]
M = np.eye(4)
M[:3,:3] = np.dot(R,Rx)
M[:3,3] = t
M = M.T
m = M.flatten()
glLoadMatrixf(m)
def draw_background(imname):
#使用四邊形繪制背景圖像
bg_image = pygame.image.load(imname).convert()
bg_data = pygame.image.tostring(bg_image,"RGBX",1)
glMatrixMode(GL_MODELVIEW)
glLoadIdentity()
glClear(GL_COLOR_BUFFER_BIT | GL_DEPTH_BUFFER_BIT)
glEnable(GL_TEXTURE_2D)
glBindTexture(GL_TEXTURE_2D,glGenTextures(1))
glTexImage2D(GL_TEXTURE_2D,0,GL_RGBA,width,height,0,GL_RGBA,GL_UNSIGNED_BYTE,bg_data)
glTexParameterf(GL_TEXTURE_2D,GL_TEXTURE_MAG_FILTER,GL_NEAREST)
glTexParameterf(GL_TEXTURE_2D,GL_TEXTURE_MIN_FILTER,GL_NEAREST)
glBegin(GL_QUADS)
glTexCoord2f(0.0,0.0); glVertex3f(-1.0,-1.0,-1.0)
glTexCoord2f(1.0,0.0); glVertex3f( 1.0,-1.0,-1.0)
glTexCoord2f(1.0,1.0); glVertex3f( 1.0, 1.0,-1.0)
glTexCoord2f(0.0,1.0); glVertex3f(-1.0, 1.0,-1.0)
glEnd()
glDeleteTextures(1)
def draw_teapot(size):
#在原點(diǎn)處繪制紅色茶壺
glEnable(GL_LIGHTING)
glEnable(GL_LIGHT0)
glEnable(GL_DEPTH_TEST)
glClear(GL_DEPTH_BUFFER_BIT)
glMaterialfv(GL_FRONT,GL_AMBIENT,[0,0,0,0])
glMaterialfv(GL_FRONT,GL_DIFFUSE,[0.5,0.0,0.0,0.0])
glMaterialfv(GL_FRONT,GL_SPECULAR,[0.7,0.6,0.6,0.0])
glMaterialf(GL_FRONT,GL_SHININESS,0.25*128.0)
glutSolidTeapot(size)
width,height = 1000,747
def setup():
pygame.init()
pygame.display.set_mode((width,height),OPENGL | DOUBLEBUF)
pygame.display.set_caption("OpenGL AR demo")
實(shí)驗(yàn)結(jié)果如圖:

運(yùn)行代碼遇到的錯(cuò)誤及解決方案
錯(cuò)誤如下:An error ocurred while starting the kernelfreeglut ERROR: Function called without first calling ‘glutInit'.
原因:經(jīng)大神指點(diǎn)得知這個(gè)錯(cuò)誤是freeglut和glut共存的緣故,它們倆定義了相同的方法,這個(gè)是動(dòng)態(tài)鏈接庫(kù)的重疊問(wèn)題,我的在ana\Lib\site-packages\OpenGL\DLLS文件夾里面。

你需要?jiǎng)h除freeglut.vc15.dll這個(gè)文件。我這是已經(jīng)刪除完的樣子。
以上這篇利用python實(shí)現(xiàn)AR教程就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
python實(shí)現(xiàn) 獲取b站主播直播間 粉絲牌信息的方法
這篇文章主要介紹了python實(shí)現(xiàn) 獲取b站主播直播間粉絲牌信息 ,用于實(shí)現(xiàn)通過(guò)牌子逆向查主播信息這個(gè)功能,本文結(jié)合實(shí)例代碼給大家介紹的非常詳細(xì),需要的朋友可以參考下2023-02-02
python使用Apriori算法進(jìn)行關(guān)聯(lián)性解析
這篇文章主要為大家分享了python使用Apriori算法進(jìn)行關(guān)聯(lián)性的解析,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-12-12
python通過(guò)函數(shù)名調(diào)用函數(shù)的幾種方法總結(jié)
今天帶大家學(xué)習(xí)的是怎么使用python通過(guò)函數(shù)名調(diào)用函數(shù),文中對(duì)python通過(guò)函數(shù)名調(diào)用函數(shù)的幾種方法有非常詳細(xì)的介紹,需要的朋友可以參考下2021-06-06
python使用celery實(shí)現(xiàn)訂單超時(shí)取消
這篇文章主要為大家詳細(xì)介紹了python使用celery實(shí)現(xiàn)訂單超時(shí)取消,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-03-03
Python Pytorch深度學(xué)習(xí)之圖像分類器
今天小編就為大家分享一篇關(guān)于Pytorch圖像分類器的文章,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-10-10
python實(shí)現(xiàn)DES加密解密方法實(shí)例詳解
這篇文章主要介紹了python實(shí)現(xiàn)DES加密解密方法,以實(shí)例形式較為詳細(xì)的分析了基于Python實(shí)現(xiàn)的DES加密與解密技巧,需要的朋友可以參考下2015-06-06
python 將numpy維度不同的數(shù)組相加相乘操作
這篇文章主要介紹了python 將numpy維度不同的數(shù)組相加相乘操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-03-03
Python制作簡(jiǎn)易注冊(cè)登錄系統(tǒng)
這篇文章主要為大家詳細(xì)介紹了Python簡(jiǎn)易注冊(cè)登錄系統(tǒng)的制作方法,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2016-12-12

