chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種基于多次觀測融合的可交互三維高斯場景重建框架

地平線HorizonRobotics ? 來源:地平線HorizonRobotics ? 2025-09-29 11:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

IGFuse基于多次觀測融合的可交互三維高斯場景重建

計(jì)算機(jī)視覺機(jī)器人領(lǐng)域,如何完整、真實(shí)地重建一個(gè)可交互的三維場景,一直是一個(gè)難題。傳統(tǒng)方法往往依賴復(fù)雜的多階段流程,比如先做分割,再進(jìn)行背景補(bǔ)全或修復(fù),或者需要對每個(gè)物體進(jìn)行密集掃描。這些方式不僅成本高、容易出錯(cuò),而且很難擴(kuò)展到大規(guī)模的應(yīng)用場景。

我們提出的IGFuse提供了一種新的思路:通過多次場景掃描的融合來重建三維高斯場景。在不同掃描中,物體布局的自然移動(dòng)能夠“揭示”那些在單次掃描里被遮擋的區(qū)域,從而幫助恢復(fù)完整的場景。為了保證重建的質(zhì)量,我們構(gòu)建了具有語義信息的高斯場,并在不同掃描之間保持光度和語義上的一致。同時(shí),我們設(shè)計(jì)了一種偽中間場景狀態(tài)來解決多次掃描之間的對齊問題,并通過協(xié)同剪枝策略不斷優(yōu)化幾何結(jié)構(gòu)。

概述

可交互三維場景重建是推動(dòng)計(jì)算機(jī)視覺與機(jī)器人智能發(fā)展的關(guān)鍵。然而,真實(shí)世界的頻繁遮擋使單次掃描無法完整捕捉場景信息,也因此限制了后續(xù)的全面交互。傳統(tǒng)方法往往依賴復(fù)雜流程或逐物體掃描,難以兼顧效率與完整性。為此,我們提出IGFuse,一個(gè)基于多次觀測融合的可交互三維高斯場景重建框架。它能夠利用多次掃描不同物體布局下的場景揭示被遮擋區(qū)域,并通過分割感知的高斯場和一致性約束實(shí)現(xiàn)高保真重建。用戶無需繁瑣步驟,即可獲得完整、可交互的三維場景。目前,IGFuse網(wǎng)站已上線,代碼也將于近期開源,歡迎大家關(guān)注與體驗(yàn)。

? 項(xiàng)目主頁:

https://whhu7.github.io/IGFuse/

? 文章鏈接:

https://arxiv.org/pdf/2508.13153

?GitHub代碼

https://github.com/whhu7/IGFuse-code

輸入(左):同一個(gè)場景的多次掃描 (Multi-Scans) ,每次掃描中的物體布局都不同。

融合與分解(中):IGFuse通過一個(gè)多狀態(tài)聯(lián)合優(yōu)化過程,將所有掃描的信息融合成一個(gè)統(tǒng)一的、一致的場景表示,并將其分解為獨(dú)立的可動(dòng)物體 (Optimized Objects) 和完整背景 (Optimized Background) 。

交互式生成(右):最終,用戶可以隨意地重新排列 (Object Rearrangement) 這些物體,生成全新的、高保真的場景狀態(tài)。

背景方法

996ef592-97c2-11f0-8c8f-92fbcf53809c.png

在構(gòu)建可交互的三維高斯場景時(shí),不同范式有著明顯差異:

(a) 傳統(tǒng)單次掃描方法:依賴繁瑣的多階段后處理與修復(fù)操作,但往往會引入累積誤差與偽影;

(b) 基于物體的重建方法:需要對場景中每個(gè)物體進(jìn)行密集多視角掃描,再進(jìn)行顯式組合,過程復(fù)雜且成本高;

(c) 我們提出的IGFuse:則通過端到端的多次觀測融合,在跨狀態(tài)監(jiān)督下聯(lián)合優(yōu)化多狀態(tài)高斯場,不僅能有效補(bǔ)償不同掃描視角下的遮擋,還能實(shí)現(xiàn)高質(zhì)量的可交互三維高斯重建。

總體框架

對于N個(gè)掃描場景,我們每次從中選取兩個(gè)場景掃描i和j,進(jìn)行一次對齊優(yōu)化。

雙向?qū)R

IGFuse通過物體級變換矩陣99d0acb0-97c2-11f0-8c8f-92fbcf53809c.png來實(shí)現(xiàn)高斯?fàn)顟B(tài)遷移9a2d98c6-97c2-11f0-8c8f-92fbcf53809c.png。隨后,利用對齊損失9a875d70-97c2-11f0-8c8f-92fbcf53809c.png將遷移后的高斯9a2d98c6-97c2-11f0-8c8f-92fbcf53809c.png的渲染圖像與掃描j下的真實(shí)觀測對齊,反之亦然。

偽狀態(tài)引導(dǎo)對齊

雙向?qū)R雖能有效約束,但僅在兩個(gè)已知狀態(tài)間提供監(jiān)督,難以保證模型泛化到任意的、未見的中間狀態(tài)。為此,IGFuse引入一個(gè)虛擬的“偽狀態(tài)”,相當(dāng)于一個(gè)公共的中轉(zhuǎn)空間,把兩個(gè)狀態(tài)都分別變換到這一共享偽狀態(tài),再加上額外約束9b35545c-97c2-11f0-8c8f-92fbcf53809c.png,確保渲染結(jié)果完全一致,迫使模型學(xué)習(xí)更本質(zhì)、更一致的場景表示,并提升對任意新狀態(tài)的泛化能力。

協(xié)同互斥剪枝

為了消除因分割不準(zhǔn)或狀態(tài)變換不精確而產(chǎn)生的“偽影”和懸浮高斯,IGFuse設(shè)計(jì)了一種協(xié)同剪枝機(jī)制。當(dāng)將9b8d94b4-97c2-11f0-8c8f-92fbcf53809c.png變換到9a2d98c6-97c2-11f0-8c8f-92fbcf53809c.png的狀態(tài)時(shí),對于中的每一個(gè)高斯,如果它在中9c3d3ea0-97c2-11f0-8c8f-92fbcf53809c.png找不到一個(gè)足夠近的“對應(yīng)點(diǎn)”,那么它就被認(rèn)為是移動(dòng)操作遺留下來的“浮動(dòng)點(diǎn)”,需要被剪枝。這個(gè)剪枝過程是雙向的,能夠共同提升兩個(gè)高斯場景的幾何純凈度。

通過這種“成對對齊+公共空間”的方式,N個(gè)掃描場景之間的差異能被逐步消除,從而得到完整、可靠的三維場景重建。

9c9bc18c-97c2-11f0-8c8f-92fbcf53809c.gif

新狀態(tài)合成結(jié)果

在新狀態(tài)合成任務(wù)中,我們的方法取得了最優(yōu)表現(xiàn)。相比之下,基于分割的算法如Gaussian Grouping容易在物體邊界處產(chǎn)生明顯的瑕疵,而DecoupledGaussian采用分割加修補(bǔ)的思路,但在復(fù)雜場景中修補(bǔ)區(qū)域與真實(shí)背景之間依然會出現(xiàn)不協(xié)調(diào)感。

在定量實(shí)驗(yàn)上,我們在訓(xùn)練場景掃描之外拍攝了物體隨機(jī)排布的一個(gè)測試場景掃描,用作衡量高斯場在新狀態(tài)合成的真實(shí)性。在虛擬數(shù)據(jù)(上)和真實(shí)數(shù)據(jù)(下)的新狀態(tài)任務(wù)上,我們跟Ground Truth相比的PSNR和SSIM都顯著高于對比算法。

9dfb665e-97c2-11f0-8c8f-92fbcf53809c.png

9e611d32-97c2-11f0-8c8f-92fbcf53809c.png

前背景信息融合

我們的方法融合了不同場景掃描下的前景信息,從而在小車翻滾的不同狀態(tài)下實(shí)現(xiàn)更加逼真的模擬效果。

僅考慮背景時(shí),我們的方法能夠融合多次掃描的信息,從而重建出完整的背景。

分割與深度結(jié)果

與基線方法Gaussian Grouping在新狀態(tài)下的表現(xiàn)相比,我們的方法能夠生成更加干凈的分割結(jié)果。Gaussian Grouping在二維分割中往往會在物體邊界處產(chǎn)生空洞或多余區(qū)域;在深度層面,其基于特征的分割無法覆蓋所有三維點(diǎn),導(dǎo)致物體移動(dòng)后遺留大量殘余點(diǎn),并在物體移出的位置留下深度空洞。

總結(jié)與展望

IGFuse通過融合多次場景掃描信息,有效提升了新狀態(tài)合成的質(zhì)量,打通了從場景重建到多狀態(tài)真實(shí)模擬的完整流程。雙向?qū)R設(shè)計(jì)與偽狀態(tài)監(jiān)督相結(jié)合,有效解決了遮擋處理和邊界分割中的難題,進(jìn)一步保證了新狀態(tài)合成的準(zhǔn)確性與完整性。未來,該方法將作為一種融合式重建的范式持續(xù)演進(jìn),重點(diǎn)拓展到更加復(fù)雜和多樣的場景中,特別是面向長序列觀測下的高質(zhì)量融合重建。這不僅為真實(shí)環(huán)境中的持續(xù)感知與狀態(tài)合成提供了堅(jiān)實(shí)基礎(chǔ),也為具身智能體在長期交互和復(fù)雜任務(wù)中的應(yīng)用開辟了新的可能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    30233

    瀏覽量

    217672
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7721

    瀏覽量

    92237

原文標(biāo)題:“補(bǔ)全”被遮擋的世界:IGFuse利用場景變化照片重建可交互3D空間

文章出處:【微信號:horizonrobotics,微信公眾號:地平線HorizonRobotics】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    怎樣去設(shè)計(jì)一種基于RGB-D相機(jī)的三維重建無序抓取系統(tǒng)?

    為什么要開發(fā)一種三維重建無序抓取系統(tǒng)?三維重建無序抓取系統(tǒng)是由哪些部分組成的?三維重建無序抓取系統(tǒng)有哪些關(guān)鍵技術(shù)和創(chuàng)新點(diǎn)?
    發(fā)表于 07-02 06:29

    基于紋理映射的醫(yī)學(xué)圖像三維重建

    提出了一種基于紋理映射的體繪制算法,提高了圖像的重建效率,增強(qiáng)了圖像的重建效果。算法實(shí)現(xiàn)了對二醫(yī)學(xué)圖像序列的三維重建,在目前通用的個(gè)人計(jì)算
    發(fā)表于 12-14 11:10 ?19次下載

    三維表面粗糙度高斯濾波快速算法

    三維表面粗糙度高斯濾波快速算法:研究了三維表面粗糙度評定基準(zhǔn)的數(shù)學(xué)模型及采用高斯濾波器得到三維表面評定基準(zhǔn)的數(shù)字算法,提出
    發(fā)表于 09-25 15:47 ?24次下載

    一種新穎實(shí)用的基于視覺導(dǎo)航的三維重建算法

    一種新穎實(shí)用的基于視覺導(dǎo)航的三維重建算法 根據(jù)立體視覺在視覺導(dǎo)航應(yīng)用中的特點(diǎn),提出了由視差圖重建三維場景的整套算法。首先,推導(dǎo)視差圖里各點(diǎn)
    發(fā)表于 02-27 09:24 ?18次下載

    基于FPGA的醫(yī)學(xué)圖像三維重建系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

    目前大部分的醫(yī)學(xué)圖像三維重建過程都是在PC機(jī)上完成的,由于PC機(jī)本身性能的限制和重建算法的復(fù)雜性,使得重建效率不高。針對這個(gè)問題,設(shè)計(jì)與實(shí)現(xiàn)了個(gè)基于FPGA(Field Progra
    發(fā)表于 03-15 13:52 ?45次下載

    一種簡化的三維模糊制器_沈勇

    一種簡化的三維模糊制器_沈勇
    發(fā)表于 03-19 11:46 ?0次下載

    基于雙目立體視覺的三維拼接和融合方法

    目前,在計(jì)算機(jī)視覺領(lǐng)域,越來越多的高精度三維重建方法以及實(shí)時(shí)定位和地圖構(gòu)建(SLAM)算法正在被提出用來對三維世界進(jìn)行描述和分析。在計(jì)算機(jī)圖形領(lǐng)域,快速和精細(xì)的三維建模與逼真的人機(jī)交互
    發(fā)表于 11-03 16:46 ?5次下載
    基于雙目立體視覺的<b class='flag-5'>三維</b>拼接和<b class='flag-5'>融合</b>方法

    如何使用單目視覺進(jìn)行高精度三維場景重建技術(shù)研究

    近年來,隨著計(jì)算機(jī)硬件的不斷快速更新,計(jì)算機(jī)的處理能力也不斷變強(qiáng)。同時(shí)場景三維模型的獲取技術(shù)越來越成熟,我們獲得場景三維模型數(shù)據(jù)的方式更多也更加方便了。而目前在基于單目和雙目的
    發(fā)表于 12-24 15:55 ?7次下載
    如何使用單目視覺進(jìn)行高精度<b class='flag-5'>三維</b><b class='flag-5'>場景</b><b class='flag-5'>重建</b>技術(shù)研究

    基于圖像的三維物體重建:在深度學(xué)習(xí)時(shí)代的最新技術(shù)和趨勢綜述之訓(xùn)練

    前面幾節(jié)討論了直接從二觀測重建三維對象的方法。本節(jié)展示了如何使用附加提示,如中間表示和時(shí)間相關(guān)性來促進(jìn)三維重建。
    發(fā)表于 01-26 19:55 ?5次下載
    基于圖像的<b class='flag-5'>三維</b>物體<b class='flag-5'>重建</b>:在深度學(xué)習(xí)時(shí)代的最新技術(shù)和趨勢綜述之訓(xùn)練

    深度學(xué)習(xí)背景下的圖像三維重建技術(shù)進(jìn)展綜述

    根據(jù)三維模型的表示形式可以將圖像三維重建方法分類為基于體素的三維重建、基于點(diǎn)云的三維重建和基于網(wǎng)格的三維重建,其中基于網(wǎng)格的
    的頭像 發(fā)表于 01-09 14:26 ?3507次閱讀

    NerfingMVS:引導(dǎo)優(yōu)化神經(jīng)輻射場實(shí)現(xiàn)室內(nèi)多視角三維重建

    既然Nerf可以表示場景三維信息,個(gè)自然的想法是能不能將NeRF應(yīng)用到室內(nèi)場景三維重建任務(wù)中呢。NeRF有著
    的頭像 發(fā)表于 02-13 11:20 ?3937次閱讀

    介紹一種基于圖像的三維重建方法

    當(dāng)前,對于個(gè)場景的快速重建是重要的,目標(biāo)是實(shí)現(xiàn)個(gè)快速的、全面的三維重建模型。可以應(yīng)用于野外的林業(yè)資源保護(hù)、火災(zāi)和地震的災(zāi)后搶救、邊境安防
    的頭像 發(fā)表于 04-12 18:21 ?1821次閱讀

    三維場景點(diǎn)云理解與重建技術(shù)

    三維場景理解與重建技術(shù)主要包含場景點(diǎn)云特征提取、掃描點(diǎn)云配準(zhǔn)與融合、場景理解與語義分割、掃描物體
    的頭像 發(fā)表于 08-08 16:58 ?2178次閱讀
    <b class='flag-5'>三維</b><b class='flag-5'>場景</b>點(diǎn)云理解與<b class='flag-5'>重建</b>技術(shù)

    如何實(shí)現(xiàn)整個(gè)三維重建過程

    在計(jì)算機(jī)視覺中,三維重建是指根據(jù)單視圖或者多視圖的圖像重建三維信息的過程。由于單視頻的信息不完全,因此三維重建需要利用經(jīng)驗(yàn)知識,而多視圖的三維重建
    發(fā)表于 09-01 11:06 ?2273次閱讀
    如何實(shí)現(xiàn)整個(gè)<b class='flag-5'>三維重建</b>過程

    基于光學(xué)成像的物體三維重建技術(shù)研究

    隨著計(jì)算機(jī)科學(xué)和數(shù)字成像技術(shù)的飛速發(fā)展,光學(xué)成像技術(shù)在許多領(lǐng)域中得到了廣泛應(yīng)用,其中之便是物體三維重建。物體三維重建技術(shù)是一種通過計(jì)算機(jī)處理圖像數(shù)據(jù),獲得物體
    的頭像 發(fā)表于 09-15 09:29 ?1430次閱讀
    基于光學(xué)成像的物體<b class='flag-5'>三維重建</b>技術(shù)研究