AR技術(shù)概述
顧名思義,增強現(xiàn)實是對現(xiàn)實的增強。從廣義上講,增強現(xiàn)實已經(jīng)涵蓋了生活的各個方面,比如樹干LED燈,創(chuàng)造藝術(shù)效果;例如,在鬼屋里放一些聲源,營造一種可怕的氛圍;甚至噴香水,都是為了增強現(xiàn)實,增強視覺、聽覺、嗅覺等感官感覺,當然,這些都是為了增強現(xiàn)實,似乎沒有那么科技的感覺。
一般來說,增強現(xiàn)實是指通過屏幕或投影設備顯示虛擬內(nèi)容的視覺增強。例如,手機相機預覽中常見的顯示3D動畫(如QQ傳火炬),微軟HoloLens,Google的Tango,還有Magic Leap等等。
總體上看,AR技術(shù)的關(guān)鍵在于設備對周圍環(huán)境的感知和理解:最基本的是確定設備本身的空間位置;更先進的是實時重建環(huán)境(SLAM);更先進的是識別、認知和交互。在這方面,定位是最基本的。只有準確確定設備本身的位置(和方向),虛擬內(nèi)容才能與現(xiàn)實很好地結(jié)合起來,以達到足夠的現(xiàn)實感,過程需要實時進行。這也是VR關(guān)鍵技術(shù)之一。
目前用于移動設備的AR主要有兩類:基于圖片標記的AR和基于IMU的AR,
QQ基于圖片標記的傳火炬是典型的AR,用手機拍攝特定圖像(另一個用戶手機上顯示的火炬圖片),在預覽圖片中疊加3D動畫效果,移動或旋轉(zhuǎn)手機,3D動畫始終與火炬圖片保持固定的位置關(guān)系,從而增強現(xiàn)實體驗。Pokemon Go則是基于IMU AR典型的是通過設備本身的陀螺儀、加速度計等傳感器數(shù)據(jù)進行定位,通過陀螺儀可以測量設備旋轉(zhuǎn),通過加速度計可以測量位移。基于IMU的AR實現(xiàn)相對簡單,但精度低,drift嚴重(累積誤差越來越大),適用場景有限。
本系列文章主要討論基于平面圖記的文章AR技術(shù)實現(xiàn)可分為兩類:Marker和Markerless,兩者的區(qū)別主要在于圖片標記是否規(guī)則:
Marker:通常是黑白方格按一定編碼的圖片;Markerless:普通圖片。與普通圖片相比,具體編碼Marker識別和跟蹤更簡單,但應用有限,所以現(xiàn)在主流AR應用都是Markerless是的,識別一張普通的平面圖,然后在上面疊加3D內(nèi)容,如QQ傳火炬。
二、原理正如前面所說,AR關(guān)鍵在于設備本身的定位,基于圖片標記AR,即通過相機拍攝已知圖片,根據(jù)圖片在相機圖片中的位置確定相機的空間位置,即設備的空間位置。下圖的主要過程包括拍攝圖像、圖像處理和更新虛擬內(nèi)容三個階段,其中圖像處理是核心。圖像處理完成后,獲得相機外參(Extrinsic,相機坐標系與世界坐標系的變換關(guān)系),然后應用于預覽圖片的疊加層(如OpenGL或3D發(fā)動機環(huán)境),更新虛擬內(nèi)容的位置,完成整個幀的處理過程,然后不斷重復這個過程,使虛擬內(nèi)容在設備移動后始終顯示在正確的位置。
以圖像處理過程為核心,還包括一些子過程,如相機內(nèi)參標定、預覽幀特征提取、匹配、相機外參標定等。
1.相機內(nèi)參標定
相機的成像過程可以看作是將空間點轉(zhuǎn)換到圖像點的過程。如果忽略了相機畸變的影響,整個轉(zhuǎn)換過程是線性的。相機中設定的參數(shù)的目標是找到轉(zhuǎn)換參數(shù)(包括畸變),以便通過數(shù)學計算準確地描述相機的成像過程。
不考慮鏡頭畸變,相機成像的變換模型可以表示如下:
A是相機的內(nèi)參矩陣,包括x、y方向焦距fx、fy和圖像中心cx、cy。空間點M首先通過相機外參[R|t]將坐標系轉(zhuǎn)換為設備(相機)(DCS),然后通過相機內(nèi)參A轉(zhuǎn)換到圖像坐標系(ICS),成像在(u, v)處。確定相機內(nèi)參的過程為內(nèi)參標定,內(nèi)參與相機的焦距、硬件工藝通常可以離線完成。內(nèi)部參考標定常采用張正友棋盤格標定法,操作簡單,精度高:只需從不同角度拍攝同一棋盤格的圖片即可完成標定。詳見此。
2.圖像特征提取與匹配
圖像特征點(Key Point)又稱興趣點,可以認為是圖像上具有特定特征的局部位置標記和特征描述(Descriptor)表示該特征的特征量,可用于區(qū)分和匹配不同的特征點。良好的特征點應具有以下特征:
重復性:在不同的條件下(如旋轉(zhuǎn)、尺度、光線),兩幅圖像中對應的特征越多越好。獨特性:特征的振幅模式需要多樣性,才能區(qū)分和匹配。數(shù)量:一般來說,必須檢測到更多的特征,但在圖像檢索中,過多的特征會對檢索的實時性產(chǎn)生一定的影響。理想情況下,檢測到的特征數(shù)量在較大范圍內(nèi),然后可以通過簡單的閾值進行調(diào)整。準確性:應能夠準確定位特征,包括圖像空間和尺度空間的準確定位。效率:檢測和描述時間越短越好,以便后續(xù)實時應用。旋轉(zhuǎn)不變性和尺度不變性是可重復性的關(guān)鍵,SIFT改進算法SURF特征提取算法常用,F(xiàn)AST它以快速而聞名,適用于實時場景。詳情請參考本博客。
特征匹配是指在提取兩張圖的特征點后,根據(jù)特征點的描述子進行匹配,并獲得匹配點對集,用于后續(xù)的單應矩陣計算。特征匹配可以看作是一個分類過程,如簡單的漢明距離匹配,或基于k近鄰算法通過比率測試減少錯誤匹配。FLANN匹配開源庫的常用特征。
3.相機外參標定
相機外參標定在上述相機成像公式中求取[R|t],在已知相機內(nèi)參的情況下,根據(jù)兩個圖像之間的特征點,可以找到兩個圖像之間的空間位置關(guān)系(旋轉(zhuǎn)R和平移t),如果其中一個圖像是輸入的標記圖像,則設置在世界坐標原點,則該過程在計算機視覺中PnP(Perspectire-n-Point)問題,也可以看作是相機的外參標定過程。這個問題可以基于直接線性轉(zhuǎn)換DLT(Direct Linear Transfor ** tion)結(jié)合最小二乘法求解,也可以通過迭代方法根據(jù)初始值求解。這個問題可以基于直接線性轉(zhuǎn)換DLT(Direct Linear Transfor ** tion)結(jié)合最小二乘法求解,也可以根據(jù)初始值通過迭代求解。外參標定過程的重點是去除誤匹配,常用RANSAC本文可參考算法。
三、結(jié)語VR讓人體驗不同的世界,AR它是為了讓現(xiàn)實世界更美好,有人把它帶走AR作為一個新的計算平臺,這并不過分。想象一下,最早的尋呼機和功能機只提供一維通知、電話或短信服務。在智能機器時代,隨著大屏幕的出現(xiàn),二維圖像和音頻和視頻已經(jīng)成為主流。下一個時代可能是3D技術(shù)、AR它將是計算設備的核心能力之一。
上海西陸信息科技有限公司 承接各類微信小程序開發(fā)制作、小程序定制、APP 網(wǎng)站 開發(fā)制作,聯(lián)系電話 18221533805、15900430334
區(qū)塊鏈技術(shù)本身不是全新的技術(shù),那是什么技術(shù)呢?
海洋技術(shù)|聲納技術(shù)的發(fā)展道路
機械加工技術(shù),微型機械加工技術(shù)快速成形技術(shù)精密超精密加工技術(shù)
CHP 熱電聯(lián)產(chǎn)技術(shù)(CHP) 技術(shù)
技術(shù)方案溝通之技術(shù)要素的提取
什么是技術(shù)創(chuàng)新?什么又是技術(shù)?
揭秘3D打印技術(shù)之按需滴落技術(shù)(DOD技術(shù))
繼劉強東“技術(shù)技術(shù)技術(shù)”后首次打造跨部門項目 京東技術(shù)布局邁入變現(xiàn)階段
什么是技術(shù)貿(mào)易中的技術(shù)商品?
什么是信息技術(shù)?信息技術(shù)主要包括哪幾種技術(shù)?
非技術(shù)人看技術(shù)崗位選擇
補牙新技術(shù)--樹脂滲透技術(shù)
DSP系統(tǒng)技術(shù)架構(gòu)參考【技術(shù)類】
技術(shù)分析4:K線技術(shù)
海鮮粥培訓 早點技術(shù) 包子技術(shù) 早餐早點技術(shù)培訓
射頻技術(shù)秘籍 - 射頻技術(shù)升級
技術(shù)干貨|容器與虛擬化技術(shù)
揭秘3D打印技術(shù)之融化擠壓成型技術(shù)(MEM技術(shù))
華轉(zhuǎn)網(wǎng):技術(shù)入股、技術(shù)許可和技術(shù)轉(zhuǎn)讓有什么區(qū)別?
本田EDT技術(shù) 地球夢想技術(shù)淺釋

聯(lián)系我們