chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

SLAM/SfM相似非回環(huán)場景應該如何處理?

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-09-20 15:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:泡椒味的口香糖

0. 筆者個人體會

相似結(jié)構(gòu)一直是SLAM和SfM中很難處理卻又不得不處理的問題,如果機器人遇到了非常相似但實際不同的結(jié)構(gòu),很容易因為匹配數(shù)量足夠多而引發(fā)假陽性回環(huán)和重建失敗。傳統(tǒng)方法更多的還是利用匹配數(shù)量的閾值或者和其他幾何關(guān)系的比值閾值來判斷,這種方法在遇到高對稱結(jié)構(gòu)時很容易失敗。

今天筆者將為大家?guī)磉@個問題新的解決思路,也就是ICCV 2023 Oral提出的Doppelgangers,能夠自動判斷兩個視圖是相同的,還是僅僅是相似的。這個方案實際上是將視覺消歧問題建模為圖像對上的二分類任務,并開發(fā)了基于學習的解決方案和數(shù)據(jù)集。

1. 效果展示

以下是一些典型的相似結(jié)構(gòu),即便是使用人眼觀看,也很容易認為是相同場景。而在SLAM和SfM遇到這類場景時,很容易觸發(fā)假陽性回環(huán)而導致跟蹤丟失或重建失敗。

Doppelgangers這篇文章主要解決的就是這類場景下的匹配和重建問題,即便用來重建的場景具有高度對稱和相似的結(jié)構(gòu),仍然可以進行完整的三維重建,不會憑空多或者少一些結(jié)構(gòu)。

618d9074-569d-11ee-939d-92fbcf53809c.png

61a4543a-569d-11ee-939d-92fbcf53809c.png

2. 摘要

我們考慮視覺消歧任務,即判斷一對視覺相似的圖像是否描繪了相同或不同的三維表面(例如,對稱建筑物的同側(cè)或?qū)?cè))。虛假圖像匹配,即兩幅圖像觀察到不同但視覺上相似的3D表面,對人類區(qū)分具有挑戰(zhàn)性,也會導致3D重建算法產(chǎn)生錯誤的結(jié)果。我們提出了一種基于學習的視覺消歧方法,將其建模為圖像對上的二分類任務。為此,我們?yōu)樵搯栴}引入了一個新的數(shù)據(jù)集Doppelgangers,該數(shù)據(jù)集包含了具有真實標簽的相似結(jié)構(gòu)的圖像對。我們還設計了一種網(wǎng)絡架構(gòu),將局部關(guān)鍵點和匹配的空間分布作為輸入,從而可以更好地對局部和全局線索進行推理。我們的評估表明,我們的方法可以在困難的情況下區(qū)分誤匹配,并且可以集成到SfM流水線中,以產(chǎn)生正確的、無二義性的三維重建。

3. 算法解析

現(xiàn)在一步步來拆解任務:我們希望在做SLAM和SfM時,即便遇到了結(jié)構(gòu)非常相似的場景,也能夠正確進行三維重建和跟蹤,不能出現(xiàn)誤匹配導致重建結(jié)果突然多了一塊或少了一塊,更不能出現(xiàn)假陽性回環(huán)。

具體任務描述:

給定兩幅非常相似的圖像,判斷它們是同一個結(jié)構(gòu)的同一個表面,還是兩個不同的3D結(jié)構(gòu)(作者將其稱為doppelgangers)。主要發(fā)生在對稱建筑物、重復視覺元素、以及多個相同地標場景中。

分析發(fā)現(xiàn),雖然從高度對稱建筑拍攝的兩幅圖像整體很相似,很難直接通過圖像對來進行正負判別,但是它內(nèi)部還是有一些細節(jié)是不同的。這些細節(jié)所在的區(qū)域在進行圖像匹配時的匹配關(guān)系很少,利用這種細微差異就可以區(qū)分圖像。其實這樣很符合人類"找不同"的思路。

基于這個發(fā)現(xiàn),作者就提出了一種基于學習的方法來消除視覺歧義,并且還公開了一個具有相似結(jié)構(gòu)的數(shù)據(jù)集,數(shù)據(jù)集還有GT標簽。

這個相似場景識別算法的原理是,首先使用RANSAC估計基礎(chǔ)矩陣并過濾異常匹配(具體實驗是直接使用LoFTR+RANSAC計算匹配),將原圖、提取的特征點、匹配到的特征點輸入到網(wǎng)絡中,輸出為相似圖像的概率,將相似性識別轉(zhuǎn)換為一個二分類問題。

這個算法的思想是使用關(guān)鍵點和匹配位置為網(wǎng)絡提供信息,這樣網(wǎng)絡不僅知道哪些關(guān)鍵點被匹配了,也可以知道哪些關(guān)鍵點沒有匹配,這樣對應的區(qū)域可能就代表信息缺失或者不同目標,相當于利用了關(guān)鍵點和匹配的空間分布信息。很明顯,視覺上具有相似結(jié)構(gòu)區(qū)域的匹配會更稠密,但不同結(jié)構(gòu)的區(qū)域匹配更稀疏。

而且為了更好得比較不同結(jié)構(gòu)區(qū)域,作者還對輸入圖像對進行了幾何對齊,也就是估計仿射變換,然后warp圖像和二值mask。當然,這個對齊不一定特別準,只不過希望能夠更好得聯(lián)系將兩個重疊區(qū)域。

到具體訓練這一塊,作者還使用了Focal loss。這個也很容易理解,相似結(jié)構(gòu)的特征點匹配肯定是正負樣本不平衡的,使用Focal loss可以提高難分樣本的貢獻。

4. 實驗

用來做二分類的網(wǎng)絡結(jié)構(gòu)很簡單,就是3個殘差模塊,一個平均池化,再加上一個全連接層。也僅僅訓練了10個epoch,batch size設置為16,學習率從0.0005降低到0.000005。

實驗主要是在他們提出的Doppelgangers數(shù)據(jù)集上評估消除視覺歧義的性能,然后將訓練的圖像二分類器集成到SfM中,通過重建效果來評估消歧性能,最后搞了一個消融實驗來證明每個模塊都是有用的。

首先是僅使用局部特征匹配來預測圖像對是否為正(真)的匹配,對比的baseline包括SIFT+RANSAC、LoFTR、以及DINO-ViT(自監(jiān)督SOTA分類/分割器)。作者使用的匹配方式包括兩種:( 1 )對幾何驗證后的匹配數(shù)量進行閾值化處理;( 2 )對匹配數(shù)量與關(guān)鍵點數(shù)量的比值進行閾值化處理。( 2 )背后的思想是,如果相對于關(guān)鍵點的數(shù)量,有很少的匹配,則很可能是誤匹配。作者訓練的模型AP為95.2 %,ROC AUC為93.8 %。DINO結(jié)果不太好,主要是因為它生成的特征很適合語義分類任務,但不適合視覺消歧。

61e80f22-569d-11ee-939d-92fbcf53809c.png

測試的圖像對和對應的正匹配概率,這個定性對比還是很詳細的,實驗的場景很多。左欄表示負對匹配關(guān)系(錯誤),右欄表示正對(正確)。比較亮眼的是,在不同光照、視角變化、天氣變化等挑戰(zhàn)性情況下,也可正確分類正負匹配關(guān)系。

后面就開始搞三維重建了,作者將他們訓練的二分類器集成到COLMAP中,以此來評估在重復/對稱場景中的三維重建效果。使用的landmark有兩類,包含13個由于對稱和重復結(jié)構(gòu)而難以重建的landmark,還有與訓練數(shù)據(jù)有顯著差異的3個具有重復結(jié)構(gòu)的場景,主要是為了測試泛化性。

下面這個表就是SfM的重建結(jié)果,第二列代表數(shù)據(jù)集中的場景數(shù)量,其他的√和代表是否重建成功,是否成功是與谷歌地球中相應結(jié)構(gòu)對比得到的(評估三維重建效果的新點?)。

621846c4-569d-11ee-939d-92fbcf53809c.png

下面是直接使用COLMAP重建的模型和作者提出方法重建效果的對比。顯然,直接使用COLMAP會憑空產(chǎn)生很多多余的塔樓、穹頂?shù)冉Y(jié)構(gòu)。但是作者提出的方法可以很好得消除這種對稱相似結(jié)構(gòu)的"語義歧義",從而重建完整的三維模型。

622c8f80-569d-11ee-939d-92fbcf53809c.png

最后是一個消融實驗,就沒啥可說的了,主要對比了使用不同的網(wǎng)絡結(jié)構(gòu)做二分類器、書否有數(shù)據(jù)增強,以及不同網(wǎng)絡輸入帶來的性能對比。

6249b1f0-569d-11ee-939d-92fbcf53809c.png

5. 總結(jié)

Doppelgangers是解決特定任務的一篇文章,實現(xiàn)了相似結(jié)構(gòu)的二分類,解決的問題很重要。雖然Doppelgangers的實驗更多的面向圖像匹配和SfM,但筆者個人覺得也很容易應用到SLAM場景中,感興趣的小伙伴可以做進一步的嘗試。

編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    30556

    瀏覽量

    219332
  • SLAM
    +關(guān)注

    關(guān)注

    24

    文章

    453

    瀏覽量

    33176
  • 分類器
    +關(guān)注

    關(guān)注

    0

    文章

    153

    瀏覽量

    13669
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1229

    瀏覽量

    26031

原文標題:ICCV 2023 oral | 一文看懂SLAM/ SfM遇到相似非回環(huán)場景應該如何處理

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    貿(mào)澤電子開售醫(yī)療用Sensirion SFM3003和SFM3013流量計

    貿(mào)澤電子 (Mouser Electronics) 即日起開售Sensirion的SFM全系列數(shù)字流量計,包括SFM3003和SFM3013流量計。
    發(fā)表于 12-21 14:05 ?2354次閱讀
    貿(mào)澤電子開售醫(yī)療用Sensirion <b class='flag-5'>SFM</b>3003和<b class='flag-5'>SFM</b>3013流量計

    淺談SLAM回環(huán)檢測技術(shù)

    回環(huán)的,對于SLAM來說也可以通過對比當前幀與過去關(guān)鍵幀的相似度,如相似度超過某一閥值時就可以被認為是檢測到回環(huán)?,F(xiàn)在,問題的關(guān)鍵就在于如
    發(fā)表于 10-23 17:47

    SLAM技術(shù)的應用及發(fā)展現(xiàn)狀

    應用行業(yè)也可分為兩大類,即工業(yè)領(lǐng)域和商業(yè)領(lǐng)域。商業(yè)用途方面,目前應用最為成熟的應該是掃地機行業(yè),而掃地機也算機器人里最早用到SLAM技術(shù)這一批了,國內(nèi)的科沃斯、塔米掃地機、嵐豹掃地機通過用SLAM算法
    發(fā)表于 12-06 10:25

    讓機器人完美建圖的SLAM 3.0到底是何方神圣?

    圖引擎,讓機器人在復雜、大面積的場景下也能輕松應對,穩(wěn)定發(fā)揮,完成定位導航任務?!鹘y(tǒng)SLAMSLAM 3.0的建圖對比:    -建圖精度高,圖優(yōu)化式建圖  - 主動閉環(huán)修正  - 建圖穩(wěn)定、不
    發(fā)表于 01-21 10:57

    SLAM大法之回環(huán)檢測

    SLAM 3.0 算是提升機器人回環(huán)檢測能力的一大突破?! ?b class='flag-5'>SLAM 3.0采用圖優(yōu)化的方式進行建圖,進行了圖片集成與優(yōu)化處理,當機器人運動到已經(jīng)探索過的原環(huán)境時,
    發(fā)表于 03-06 15:38

    超全SLAM技術(shù)及應用介紹

    運動恢復結(jié)構(gòu)(SfM)和 SLAM 所解決的問題非常相似,但 SfM 傳統(tǒng)上是以離線形式進行的,而 SLAM 則已經(jīng)慢慢走向了低功耗/實時/
    的頭像 發(fā)表于 11-22 14:34 ?1.8w次閱讀
    超全<b class='flag-5'>SLAM</b>技術(shù)及應用介紹

    VIL-SLAM系統(tǒng)可實現(xiàn)獲得更好的回環(huán)約束

    本文提出的立體視覺+慣導+激光雷達的SLAM系統(tǒng),在比如隧道一些復雜場景下能夠?qū)崿F(xiàn)良好性能。VIL-SLAM通過將緊密耦合的立體視覺慣性里程計(VIO)與激光雷達建圖和激光雷達增強視覺環(huán)路閉合相結(jié)合
    發(fā)表于 02-18 17:59 ?2801次閱讀
    VIL-<b class='flag-5'>SLAM</b>系統(tǒng)可實現(xiàn)獲得更好的<b class='flag-5'>回環(huán)</b>約束

    一種適用于動態(tài)場景SLAM方法

    的目標檢測算法引入到經(jīng)典ORB_SLAM2方法中,將特征點分為潛在動態(tài)特征點和潛在動態(tài)特征點,基于潛在動態(tài)特征點計算運動模型,篩選岀應用場景中的靜態(tài)特征點并實現(xiàn)位姿跟蹤,利用
    發(fā)表于 03-18 10:39 ?21次下載
    一種適用于動態(tài)<b class='flag-5'>場景</b>的<b class='flag-5'>SLAM</b>方法

    移動機器人視覺SLAM回環(huán)檢測原理、現(xiàn)狀及趨勢

    目前視覺SLAM回環(huán)檢測主要方式有傳統(tǒng)的詞袋模型以及基于概率和詞袋模型的一些改進算法,但是傳統(tǒng)方式依然存在過多的人工干預,對于場景中動態(tài)對象的處理不是十分理想,并且計算量較大,響應比較
    的頭像 發(fā)表于 11-09 12:38 ?2951次閱讀

    關(guān)于視覺SLAM直接法的介紹

    而關(guān)于SLAM,它是英文“同時定位與建圖”的縮寫。而有時候,我們還會聽到VO,SfM等概念,而因此容易混淆。
    的頭像 發(fā)表于 11-30 09:22 ?1723次閱讀

    Global SfM和ncremental SfM知識講解

    Sfm 可以分為以下幾類:Global SfM、Incremental SfM、Hybrid SfM、Distributed SfM,這里主
    的頭像 發(fā)表于 12-30 09:16 ?2905次閱讀

    OV2SLAM(高速視覺slam)簡析

    視覺里程計最近幾年越來越受到學術(shù)界以及工業(yè)界的認可,以ORB和VINS為代表的視覺SLAM已經(jīng)可以滿足絕大多數(shù)場景,而OV2SLAM在其他VSLAM中脫穎而出,其實時性以及具體的回環(huán)
    的頭像 發(fā)表于 03-21 17:16 ?2563次閱讀

    基于特征點的SfM在弱紋理場景下的表現(xiàn)

    SfM是指給定一組無序圖像,恢復出相機位姿以及場景點云。通用場景下的SfM效果已經(jīng)很好,而且COLMAP這類框架也很好用。但是弱紋理和無紋理場景
    的頭像 發(fā)表于 08-21 09:22 ?3067次閱讀
    基于特征點的<b class='flag-5'>SfM</b>在弱紋理<b class='flag-5'>場景</b>下的表現(xiàn)

    3D重建的SLAM方案算法解析

    GO-SLAM主要還是基于NeRF進行稠密重建,可以發(fā)現(xiàn)相較于NICE-SLAM這些SOTA方案,GO-SLAM重建場景的全局一致性更好,這主要是因為它引入了
    發(fā)表于 09-11 10:03 ?2277次閱讀
    3D重建的<b class='flag-5'>SLAM</b>方案算法解析

    導熱油管道漏油應該何處理

    電子發(fā)燒友網(wǎng)站提供《導熱油管道漏油應該何處理.docx》資料免費下載
    發(fā)表于 03-06 15:41 ?0次下載