快捷導(dǎo)航

利用python實(shí)現(xiàn)AR教程

更新時(shí)間：2019年11月20日 09:39:50 作者：不吃香菜--

今天小編就為大家分享一篇利用python實(shí)現(xiàn)AR教程，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧

先了解如何利用python語(yǔ)言實(shí)現(xiàn)以平面和標(biāo)記物進(jìn)行姿態(tài)估計(jì)

本實(shí)驗(yàn)只是先實(shí)現(xiàn)一個(gè)簡(jiǎn)單的小例子。簡(jiǎn)單來(lái)說(shuō)就是先識(shí)別出圖像中的參考面，再拍攝一張目標(biāo)圖像，將參考面頂部的3D模型投影到目標(biāo)圖像上。

大致步驟如下：

識(shí)別參考平面

在這一步中，我們所需要做的事就是提取參考圖像和目標(biāo)圖像的sift特征，然后使用RANSAC算法穩(wěn)健地估計(jì)單應(yīng)性矩陣。

代碼如下:

#計(jì)算特征
sift.process_image('D:輸入圖片/book_frontal.JPG', 'im0.sift')
l0, d0 = sift.read_features_from_file('im0.sift')

sift.process_image('D:輸入圖片/book_per.JPG', 'im1.sift')
l1, d1 = sift.read_features_from_file('im1.sift')

#匹配特征，并計(jì)算單應(yīng)性矩陣
matches = sift.match_twosided(d0, d1)
ndx = matches.nonzero()[0]
fp = homography.make_homog(l0[ndx, :2].T)
ndx2 = [int(matches[i]) for i in ndx]
tp = homography.make_homog(l1[ndx2, :2].T)

model = homography.RansacModel()
H, inliers = homography.H_from_ransac(fp, tp, model)

由上面代碼可得到單應(yīng)性矩陣，它能夠?qū)⒁环鶊D像中標(biāo)記物的點(diǎn)映射到另一幅圖像中的對(duì)應(yīng)點(diǎn)。還需要建立X-Y(Z=0)三維坐標(biāo)系，標(biāo)記物在Z=0平面上，原點(diǎn)在標(biāo)記物的某個(gè)位置上。

從單應(yīng)性推導(dǎo)出從參考面坐標(biāo)系到目標(biāo)圖像坐標(biāo)系的轉(zhuǎn)換

在進(jìn)行坐標(biāo)轉(zhuǎn)換之前，為了檢驗(yàn)單應(yīng)性矩陣結(jié)果的正確性，需要將一些三維物體放置在目標(biāo)圖像上，本實(shí)驗(yàn)使用了一個(gè)立方體。產(chǎn)生立方體的代碼如下:

def cube_points(c, wid):

  p = []
  p.append([c[0]-wid, c[1]-wid, c[2]-wid])
  p.append([c[0]-wid, c[1]+wid, c[2]-wid])
  p.append([c[0]+wid, c[1]+wid, c[2]-wid])
  p.append([c[0]+wid, c[1]-wid, c[2]-wid])
  p.append([c[0]-wid, c[1]-wid, c[2]-wid])

  p.append([c[0]-wid, c[1]-wid, c[2]+wid])
  p.append([c[0]-wid, c[1]+wid, c[2]+wid])
  p.append([c[0]+wid, c[1]+wid, c[2]+wid])
  p.append([c[0]+wid, c[1]-wid, c[2]+wid])
  p.append([c[0]-wid, c[1]-wid, c[2]+wid])

  p.append([c[0]-wid, c[1]-wid, c[2]+wid])
  p.append([c[0]-wid, c[1]+wid, c[2]+wid])
  p.append([c[0]-wid, c[1]+wid, c[2]-wid])
  p.append([c[0]+wid, c[1]+wid, c[2]-wid])
  p.append([c[0]+wid, c[1]+wid, c[2]+wid])
  p.append([c[0]+wid, c[1]-wid, c[2]+wid])
  p.append([c[0]+wid, c[1]-wid, c[2]-wid]

 return array(p).T

先計(jì)算出照相機(jī)的標(biāo)定矩陣，就可以得出兩個(gè)視圖間的相對(duì)變換

代碼如下:

#計(jì)算照相機(jī)標(biāo)定矩陣，使用圖像的分辨率為747*1000
K = my_calibration((747, 1000))

#位于邊長(zhǎng)為0.2，Z=0平面上的三維點(diǎn)
box = cube_points([0, 0, 0.1], 0.1)

#投影第一幅圖像上底部的正方形
cam1 = camera.Camera(hstack((K, dot(K, array([[0], [0], [-1]])))))
#底部正方形上的點(diǎn)
box_cam1 = cam1.project(homography.make_homog(box[:, :5]))

#使用H將點(diǎn)變換到第二幅圖像上
box_trans = homography.normalize(dot(H,box_cam1))

#從cam1和H中計(jì)算第二個(gè)照相機(jī)矩陣
cam2 = camera.Camera(dot(H, cam1.P))
A = dot(linalg.inv(K), cam2.P[:, :3])
A = array([A[:, 0], A[:, 1], cross(A[:, 0], A[:, 1])]).T
cam2.P[:, :3] = dot(K, A)

#使用第二個(gè)照相機(jī)矩陣投影
box_cam2 = cam2.project(homography.make_homog(box))

在圖像（像素空間）中投影我們的3D模型并繪制它。

#底部正方形的二維投影
figure()
imshow(im0)
plot(box_cam1[0, :], box_cam1[1, :], linewidth=3)
title('2D projection of bottom square')
axis('off')

#使用H對(duì)二維投影進(jìn)行變換
figure()
imshow(im1)
plot(box_trans[0, :], box_trans[1, :], linewidth=3)
title('2D projection transfered with H')
axis('off')

#三維立方體
figure()
imshow(im1)
plot(box_cam2[0, :], box_cam2[1, :], linewidth=3)
title('3D points projected in second image')
axis('off')

實(shí)驗(yàn)結(jié)果如下

什么是AR

AR全稱Augmented Reality，意為增強(qiáng)現(xiàn)實(shí)技術(shù)。

它是一種將真實(shí)世界信息和虛擬世界信息“無(wú)縫”集成的新技術(shù)，是把原本在現(xiàn)實(shí)世界的一定時(shí)間空間范圍內(nèi)很難體驗(yàn)到的實(shí)體信息（視覺(jué)信息，聲音，味道，觸覺(jué)等），通過(guò)電腦等科學(xué)技術(shù)，模擬仿真后再疊加，將虛擬的信息應(yīng)用到真實(shí)世界，被人類感官所感知，從而達(dá)到超越現(xiàn)實(shí)的感官體驗(yàn)。真實(shí)的環(huán)境和虛擬的物體實(shí)時(shí)地疊加到了同一個(gè)畫面或空間同時(shí)存在。

增強(qiáng)現(xiàn)實(shí)技術(shù)，不僅展現(xiàn)了真實(shí)世界的信息，而且將虛擬的信息同時(shí)顯示出來(lái)，兩種信息相互補(bǔ)充、疊加。在視覺(jué)化的增強(qiáng)現(xiàn)實(shí)中，用戶利用頭盔顯示器，把真實(shí)世界與電腦圖形多重合成在一起，便可以看到真實(shí)的世界圍繞著它。

增強(qiáng)現(xiàn)實(shí)技術(shù)包含了多媒體、三維建模、實(shí)時(shí)視頻顯示及控制、多傳感器融合、實(shí)時(shí)跟蹤及注冊(cè)、場(chǎng)景融合等新技術(shù)與新手段。增強(qiáng)現(xiàn)實(shí)提供了在一般情況下，不同于人類可以感知的信息。

如何利用python實(shí)現(xiàn)AR

步驟和實(shí)現(xiàn)姿態(tài)估計(jì)無(wú)太大差別。由上述內(nèi)容計(jì)算出照相機(jī)的位置和姿態(tài)，使用這些信息來(lái)放置計(jì)算機(jī)圖像學(xué)模型。這里我們放置了一個(gè)紅色的小茶壺。

在運(yùn)行代碼之前，我們需要先安裝PyGame和PyOpenGL，下載鏈接(https://www.lfd.uci.edu/~gohlke/pythonlibs/)。

核心代碼如下:

def set_projection_from_camera(K): 
#從照相機(jī)標(biāo)定矩陣中獲得視圖

 glMatrixMode(GL_PROJECTION) 
 glLoadIdentity()
 fx = K[0,0] 
 fy = K[1,1] 
 fovy = 2*math.atan(0.5*height/fy)*180/math.pi 
 aspect = (width*fy)/(height*fx)
 near = 0.1 
 far = 100.0
 gluPerspective(fovy,aspect,near,far) 
 glViewport(0,0,width,height)

def set_modelview_from_camera(Rt): 
#從照相機(jī)姿態(tài)中獲取模擬視圖矩陣

 glMatrixMode(GL_MODELVIEW) 
 glLoadIdentity()
 Rx = np.array([[1,0,0],[0,0,-1],[0,1,0]])
 R = Rt[:,:3] 
 U,S,V = np.linalg.svd(R) 
 R = np.dot(U,V) 
 R[0,:] = -R[0,:]
 t = Rt[:,3]
 M = np.eye(4) 
 M[:3,:3] = np.dot(R,Rx) 
 M[:3,3] = t
 M = M.T
 m = M.flatten()
 glLoadMatrixf(m)

def draw_background(imname):
#使用四邊形繪制背景圖像

 bg_image = pygame.image.load(imname).convert() 
 bg_data = pygame.image.tostring(bg_image,"RGBX",1)
 glMatrixMode(GL_MODELVIEW) 
 glLoadIdentity()

 glClear(GL_COLOR_BUFFER_BIT | GL_DEPTH_BUFFER_BIT)
 glEnable(GL_TEXTURE_2D) 
 glBindTexture(GL_TEXTURE_2D,glGenTextures(1)) 
 glTexImage2D(GL_TEXTURE_2D,0,GL_RGBA,width,height,0,GL_RGBA,GL_UNSIGNED_BYTE,bg_data) 
 glTexParameterf(GL_TEXTURE_2D,GL_TEXTURE_MAG_FILTER,GL_NEAREST) 
 glTexParameterf(GL_TEXTURE_2D,GL_TEXTURE_MIN_FILTER,GL_NEAREST)
 glBegin(GL_QUADS) 
 glTexCoord2f(0.0,0.0); glVertex3f(-1.0,-1.0,-1.0) 
 glTexCoord2f(1.0,0.0); glVertex3f( 1.0,-1.0,-1.0) 
 glTexCoord2f(1.0,1.0); glVertex3f( 1.0, 1.0,-1.0) 
 glTexCoord2f(0.0,1.0); glVertex3f(-1.0, 1.0,-1.0) 
 glEnd()
 glDeleteTextures(1)

def draw_teapot(size):
#在原點(diǎn)處繪制紅色茶壺

 glEnable(GL_LIGHTING) 
 glEnable(GL_LIGHT0) 
 glEnable(GL_DEPTH_TEST) 
 glClear(GL_DEPTH_BUFFER_BIT)
 glMaterialfv(GL_FRONT,GL_AMBIENT,[0,0,0,0]) 
 glMaterialfv(GL_FRONT,GL_DIFFUSE,[0.5,0.0,0.0,0.0]) 
 glMaterialfv(GL_FRONT,GL_SPECULAR,[0.7,0.6,0.6,0.0]) 
 glMaterialf(GL_FRONT,GL_SHININESS,0.25*128.0) 
 glutSolidTeapot(size)

width,height = 1000,747
def setup():
 pygame.init() 
 pygame.display.set_mode((width,height),OPENGL | DOUBLEBUF) 
 pygame.display.set_caption("OpenGL AR demo")

實(shí)驗(yàn)結(jié)果如圖：