如今科技發(fā)展日新月異,諸如機器人、AR/VR等前沿科技產(chǎn)品已走入了大眾生活當(dāng)中。但是想在這些領(lǐng)域讓用戶有更好的體驗,就需要很多底層技術(shù)的支持,SLAM就是其中之一。如果說機器人離開了SLAM,就相當(dāng)于人類失去了雙眼一樣。
一、什么是視覺SLAM?
SLAM的英文全稱是Simultaneous Localization and Mapping,中文稱作「即時定位與地圖創(chuàng)建」,而視覺SLAM就是用攝像頭來完成環(huán)境的感知工作。
舉個例子,當(dāng)你第一天去上大學(xué)的時候,為了迅速熟悉校園環(huán)境并且找到宿舍時,你會做以下的事情:
1.用眼睛一直觀察周圍的教學(xué)樓、籃球場、噴泉等標(biāo)志性建筑物,并且記住它們的特征。(特征提?。?/p>
2.根據(jù)你剛才眼睛觀察到的信息,在腦海里把這些有特征的標(biāo)志性建筑物建立成一個地圖。(建圖)
3.在繼續(xù)行走時,又看到了一些如咖啡店、健身房等新的標(biāo)志性建筑物,再把它們加到腦海中的地圖里面校對一下。(狀態(tài)更新)
4.根據(jù)你前一段時間行走獲得的標(biāo)志性建筑物,確定自己的位置。(路徑規(guī)劃)
5.當(dāng)無意中走了很長一段路的時候,和腦海中的以往標(biāo)志性建筑物進行匹配,看一看是否走回了原路。(回環(huán)檢測)
其實上面你做的這些事情,就是視覺SLAM里面的幾個部分。
二、視覺SLAM的分類
視覺SLAM研究主要分為三大類:單目、雙目(或多目)、RGBD。
單目僅用一支攝像頭就能完成SLAM。最大的優(yōu)點是傳感器簡單且成本低廉,但同時也有個大問題,就是不能確切的得到深度,存在尺寸不確定的現(xiàn)象,比如丟失深度信息的相片中,我們能見到“手捏太陽”“借位拍照”這樣的現(xiàn)象。
一方面是由于絕對深度未知,單目SLAM不能得到機器人運動軌跡及地圖的真實大小,如果把軌跡和房間同時放大兩倍,單目看到的像是一樣的,因此,單目SLAM只能估計一個相對深度。另一方面,單目相機無法依靠一張圖像獲得圖像中物體離自己的相對距離。為了估計這個相對深度,單目SLAM要靠運動中的三角測量,來求解相機運動并估計像素的空間位置。即是說,它的軌跡和地圖,只有在相機運動之后才能收斂,如果相機不進行運動時,就無法得知像素的位置。同時,相機運動還不能是純粹的旋轉(zhuǎn),這就給單目SLAM的應(yīng)用帶來了一些麻煩。
雙目(多目)顧名思義是由兩個或多個攝像頭來完成SLAM,其普遍為雙目視覺方案。雙目視覺既可以在運動時估計深度,亦可在靜止時估計,雙目視覺融合兩個攝像頭獲得的圖像并觀察它們之間的差別,獲得明顯的深度感,建立特征間的對應(yīng)關(guān)系,將同一空間物理點在不同圖像中的映像點對應(yīng)起來。并且可以精準(zhǔn)感知周圍的物體和自身移動的軌跡,從而對周圍環(huán)境形成三維立體的認(rèn)識,解決了上面提到的問題。不過通過雙目圖像計算像素距離,計算量大,而且在特征少的白墻或暗光環(huán)境易丟失目標(biāo)。
目前雙目的應(yīng)用程度明顯較高,針對雙目方案拓展應(yīng)用場景上,大多融和了IMU或者IR等傳感器,比如國內(nèi)立體視覺方案公司indemind推出的雙目視覺慣性模組,采用了“雙目攝像頭+IMU”多傳感器融合架構(gòu)與微秒級時間同步機制,可提供精準(zhǔn)穩(wěn)定數(shù)據(jù)源;并且內(nèi)置了自研高精度Vi-SLAM算法,以滿足SLAM研究、智能機器人、無人機避障、室內(nèi)外導(dǎo)航定位等使用需求。
RGBD相機是2010年左右開始興起的一種相機,它最大的特點是可以通過紅外結(jié)構(gòu)光或Time-of-Flight原理,直接測出圖像中各像素離相機的距離。因此,它比傳統(tǒng)相機能夠提供更豐富的信息,也不必像單目或雙目那樣費時費力地計算深度。
目前常用的RGBD相機有Kinect/Kinect V2等等。不過,現(xiàn)在多數(shù)RGBD相機還存在測量范圍窄、噪聲大、視野小、受陽光,墻面反光等諸多問題。出于量程的限制,主要用于室內(nèi)SLAM。
目前,視覺SLAM主要被運用于無人機、無人駕駛、機器人、AR、智能家居等領(lǐng)域,單目需要靠運動估計深度導(dǎo)致避障效率不高,RGBD存在量程的限制,主要用于室內(nèi)SLAM。因此,目前在視覺SLAM中,雙目的應(yīng)用程度和落地前景都是最高的。
不管是哪種視覺SLAM方案,都是作為人工智能的眼睛,獲取地圖數(shù)據(jù),并構(gòu)建地圖,規(guī)避路程中遇到的障礙物,實現(xiàn)路徑的規(guī)劃。
隨著城市物聯(lián)網(wǎng)和智能系統(tǒng)的完善,視覺SLAM必是大勢所趨。雖然目前視覺SLAM技術(shù)方面還存在著一些問題,但這些都會隨著消費刺激和產(chǎn)業(yè)鏈的發(fā)展逐步解決、趨于完善。
lw
-
人工智能
+關(guān)注
關(guān)注
1811文章
49488瀏覽量
258009 -
SLAM
+關(guān)注
關(guān)注
24文章
448瀏覽量
32965 -
無人駕駛
+關(guān)注
關(guān)注
99文章
4226瀏覽量
125418
發(fā)布評論請先 登錄
全新輕量級ViSTA-SLAM系統(tǒng)介紹

一種適用于動態(tài)環(huán)境的自適應(yīng)先驗場景-對象SLAM框架

基于深度學(xué)習(xí)的增強版ORB-SLAM3詳解

一種適用于動態(tài)環(huán)境的實時RGB-D SLAM系統(tǒng)

三維高斯?jié)姙R大規(guī)模視覺SLAM系統(tǒng)解析

【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】視覺實現(xiàn)的基礎(chǔ)算法的應(yīng)用
【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】+ROS2應(yīng)用案例
一種基于點、線和消失點特征的單目SLAM系統(tǒng)設(shè)計

一種基于MASt3R的實時稠密SLAM系統(tǒng)
用于任意排列多相機的通用視覺里程計系統(tǒng)

利用VLM和MLLMs實現(xiàn)SLAM語義增強


探索 SLAM 技術(shù)賦能的 MR 混合現(xiàn)實應(yīng)用場景 #可視化 #MR #混合現(xiàn)實 #SLAM
激光雷達在SLAM算法中的應(yīng)用綜述

MG-SLAM:融合結(jié)構(gòu)化線特征優(yōu)化高斯SLAM算法

評論