chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種 "物體深度重建網(wǎng)絡(luò)"(OLD-Net)的新方法

倩倩 ? 來(lái)源:CVer、數(shù)理之家 ? 作者:CVer、數(shù)理之家 ? 2022-09-22 11:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

計(jì)算機(jī)視覺(jué)中,我方視角就是相機(jī)鏡頭的視角。那么在當(dāng)前時(shí)刻下,如何正確的估計(jì)出相機(jī)中目標(biāo)物體的6D姿態(tài)(三維空間位置和三維朝向),將是一個(gè)重要的問(wèn)題,這就是物體的6D姿態(tài)估計(jì)任務(wù)。

447512a8-3a03-11ed-9e49-dac502259ad0.png

01摘要最近,基于RGBD的類別級(jí)6D物體姿態(tài)估計(jì)在性能上取得了很大的進(jìn)步,然而,對(duì)于深度信息的需求阻礙了其更廣泛的應(yīng)用。為了解決這一問(wèn)題,本文提出了一種 "物體深度重建網(wǎng)絡(luò)"(OLD-Net)的新方法。該方法僅輸入RGB圖像進(jìn)行類別級(jí)6D物體姿態(tài)估計(jì)。我們通過(guò)將類別級(jí)形狀先驗(yàn)變形為物體級(jí)深度和規(guī)范的NOCS表示,從而實(shí)現(xiàn)由單目RGB圖像中直接預(yù)測(cè)物體級(jí)深度。我們引入了兩個(gè)新的模塊,即歸一化全局位置提示(NGPH)和形狀感知解耦深度重建(SDDR)模塊,以學(xué)習(xí)高精度的物體級(jí)深度和形狀表示。最后,通過(guò)將預(yù)測(cè)的規(guī)范表征與反向投影的物體級(jí)深度對(duì)齊,解決了6D物體的姿態(tài)問(wèn)題。在CAMERA25和REAL275數(shù)據(jù)集上進(jìn)行的廣泛實(shí)驗(yàn)表明,雖然我們的模型,但達(dá)到了最先進(jìn)的性能。02本文主要工作

448c4b76-3a03-11ed-9e49-dac502259ad0.png

本文提出了一種基于RGB的類別級(jí)6D物體姿態(tài)估計(jì)新方法——Object Level Depth reconstruction Network(OLD-Net)。上圖右示為OLD-Net的主要管道。具體而言,從輸入的RGB圖像中同時(shí)預(yù)測(cè)物體級(jí)深度和NOCS表示,并將兩者對(duì)齊預(yù)測(cè)6D物體的姿態(tài)。與以往通過(guò)重構(gòu)網(wǎng)格預(yù)測(cè)物體區(qū)域深度的方法不同,本文采用端到端方式直接從RGB圖像中預(yù)測(cè)物體的觀測(cè)深度。 要獲得物體區(qū)域的深度,一種直接的方法是預(yù)測(cè)場(chǎng)景級(jí)深度。然而,由于視場(chǎng)的多樣性,通常預(yù)測(cè)的景深較粗,導(dǎo)致物體形狀細(xì)節(jié)的丟失。姿態(tài)估計(jì)性能也會(huì)受到影響。為了解決這一問(wèn)題,我們通過(guò)直接學(xué)習(xí)變形類別級(jí)形狀先驗(yàn)重構(gòu)物體級(jí)深度。與預(yù)測(cè)場(chǎng)景級(jí)深度圖相比,重建對(duì)象級(jí)深度圖計(jì)算方便,能夠更好地保存形狀細(xì)節(jié),有利于后續(xù)的物體級(jí)深度和NOCS表示對(duì)齊過(guò)程。 為了更好地重構(gòu)物體級(jí)深度,在OLD-Net中提出了一種新的模塊——?dú)w一化全局位置提示(NGPH),以平衡場(chǎng)景級(jí)全局信息和局部特征級(jí)形狀細(xì)節(jié)。NGPH是帶相機(jī)本征的歸一化二維檢測(cè)結(jié)果,提供物體在場(chǎng)景中的絕對(duì)深度的全局位置線索,以及對(duì)不同相機(jī)捕捉到的圖像的泛化能力。此外,利用形狀感知解耦深度重建(SDDR)方法預(yù)測(cè)形狀細(xì)節(jié)和絕對(duì)深度。SDDR利用兩個(gè)獨(dú)立的深度網(wǎng)絡(luò)將絕對(duì)深度解耦預(yù)測(cè)為形狀點(diǎn)和深度平移。直觀上,形狀點(diǎn)是為了保留形狀細(xì)節(jié),而深度平移是為了預(yù)測(cè)絕對(duì)物體中心。 除深度外,我們進(jìn)一步采用基于RGBD的方法預(yù)測(cè)目標(biāo)對(duì)象的NOCS表示。在訓(xùn)練過(guò)程中使用鑒別器提高重建質(zhì)量。在NOCS表示和觀測(cè)到的物體級(jí)深度都被預(yù)測(cè)之后,我們將物體級(jí)深度逆向投影到點(diǎn)云中。通過(guò)Umeyama算法對(duì)它們進(jìn)行對(duì)齊,求解出6D物體姿態(tài)。我們?cè)贑AMERA25數(shù)據(jù)集和REAL275數(shù)據(jù)集上進(jìn)行了大量的實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,該方法具有先進(jìn)的性能。03網(wǎng)絡(luò)主要結(jié)構(gòu)

44965238-3a03-11ed-9e49-dac502259ad0.png

主要的OLD-Net的網(wǎng)絡(luò)架構(gòu)如上圖所示。 我們的pipeline以圖像和一個(gè)形狀先驗(yàn)作為輸入。圖像由一個(gè)訓(xùn)練過(guò)的檢測(cè)器(Detect-Net)裁剪,用以表示物體特定的信息。采用均值嵌入的編碼器-解碼器網(wǎng)絡(luò)物體類別的形狀先驗(yàn)進(jìn)行預(yù)測(cè),來(lái)解決類別差異的問(wèn)題。 然后,將圖像和形狀先驗(yàn)輸入到OLD-Net中,重建上圖頂部所示的物體級(jí)深度。此外,OLD-Net還將來(lái)自(Detect-Net的二維檢測(cè)結(jié)果和攝像機(jī)本征信息作為輸入,并將其歸一化為NGPH。在OLD-Net中采用一種形狀感知的解耦深度重建方案來(lái)保持物體的形狀細(xì)節(jié)和絕對(duì)中心。 最后,利用深度網(wǎng)絡(luò)對(duì)NOCS表示進(jìn)行預(yù)測(cè)。然后,我們將對(duì)象級(jí)深度反向投影到點(diǎn)云中,采用Umeyama算法恢復(fù)物體姿態(tài)。 如上圖圖OLD-Net的網(wǎng)絡(luò)結(jié)構(gòu)所示,OLD-Net以圖像、形狀先驗(yàn)和NGPH為輸入,首先使用兩個(gè)MLP和一個(gè)CNN學(xué)習(xí)圖像特征圖,先驗(yàn)特征,位置特征。然后,利用這些特征,利用形狀感知解耦深度重構(gòu)(SDDR)方案同時(shí)預(yù)測(cè)形狀點(diǎn)和深度平移。最后,將形狀點(diǎn)和深度平移重新組合在一起,得到物體級(jí)深度。接下來(lái),我們?cè)敿?xì)介紹NGPH和SDDR。

規(guī)范化全局位置提示

我們的旨在直接從高質(zhì)量的圖像中預(yù)測(cè)物體層次的深度。實(shí)現(xiàn)這一目標(biāo)的最直接方法是預(yù)測(cè)場(chǎng)景級(jí)深度圖。然而,從原始圖像預(yù)測(cè)場(chǎng)景級(jí)深度圖的計(jì)算成本很高。此外,它還可能導(dǎo)致物體形狀細(xì)節(jié)的丟失。而形狀細(xì)節(jié)對(duì)于我們的管道非常重要,因?yàn)槲覀冃枰獙?duì)齊兩個(gè)3D表示來(lái)恢復(fù)物體的姿態(tài)。因此,我們選擇以特定物體的圖像作為輸入來(lái)預(yù)測(cè)物體級(jí)深度。然而,由于裁剪和調(diào)整大小的操作,圖像失去了目標(biāo)的絕對(duì)全局位置信息,導(dǎo)致預(yù)測(cè)深度存在尺度模糊。為此,我們提出了NGPH,通過(guò)提供絕對(duì)全局位置信息和解決尺度模糊,很好地解決了這一問(wèn)題。 我們選擇Detect-Net輸出的2D邊界框(l, t, r, b)的參數(shù)組成NGPH,它代表左、上、右,下二維邊界框的坐標(biāo)。這些信息足夠有效,可以提供給網(wǎng)絡(luò)來(lái)推斷尺度線索。例如,如果所有的圖像都是由同一臺(tái)相機(jī)捕獲的,則恢復(fù)物體的絕對(duì)深度。然而,圖像通常會(huì)被不同的相機(jī)收集。從單目RGB圖像中推斷出物體的絕對(duì)深度會(huì)受到相機(jī)本身的影響,這是一個(gè)常識(shí)。因此,我們提出將相機(jī)本征注入NGPH中。因此,經(jīng)過(guò)訓(xùn)練的網(wǎng)絡(luò)也可以被推廣到其他由不同相機(jī)捕捉到的圖像。我們通過(guò)將2D邊界框和攝像機(jī)intrinsic歸一化到規(guī)范坐標(biāo)中來(lái)使用它們:

44b591ac-3a03-11ed-9e49-dac502259ad0.png

其中表示我們使用的最終NGPH。和表示相機(jī)光學(xué)中心坐標(biāo),和表示焦距。前兩個(gè)術(shù)語(yǔ)將對(duì)象的邊界框大小與焦距歸一化,消除了對(duì)象大小引起的尺度模糊。后四個(gè)術(shù)語(yǔ)使用邊界框的焦距和大小對(duì)物體的中心進(jìn)行歸一化,消除了模糊性,但保留了位置信息。該方法雖然簡(jiǎn)單,但在對(duì)象級(jí)深度重構(gòu)中是必不可少的。實(shí)驗(yàn)結(jié)果表明,NGPH雖然簡(jiǎn)單,但在物體層次深度重建中不可或缺。

形狀感知解耦深度重建

OLD-Net中使用的特征是重塑后的圖像特征矩陣(其中為像素?cái)?shù)),位置特征,先驗(yàn)特征。我們還應(yīng)用MLPs和自適應(yīng)池化,得到全局圖像特征集和全局先驗(yàn)特征集。形狀點(diǎn)預(yù)測(cè):我們采用了形狀先驗(yàn)變形(SPD)的思想重構(gòu)形狀點(diǎn),這將為模型提供更多的物體形狀約束。具體來(lái)說(shuō),利用上述特征,網(wǎng)絡(luò)將學(xué)習(xí)一個(gè)形變場(chǎng),一個(gè),并將先前的形狀先驗(yàn)反向投影到對(duì)象級(jí)深度的點(diǎn)云中: 44c69704-3a03-11ed-9e49-dac502259ad0.png 為了學(xué)習(xí)??,我們重復(fù)??,??,??共??次并將它們與??連接。將連接的特征輸入到MLP中以學(xué)習(xí)??。類似地,為了學(xué)習(xí)??,我們重復(fù)??,??,??共??次,并將它們與??連接。另一個(gè)MLP用于學(xué)習(xí)??。在本文中,我們使用形狀先驗(yàn)來(lái)預(yù)測(cè)對(duì)象級(jí)深度,為未來(lái)基于RGB的工作提供指導(dǎo)。深度變換預(yù)測(cè):為了學(xué)習(xí)物體中心的絕對(duì)位置,我們建議使用一個(gè)獨(dú)立的MLP來(lái)學(xué)習(xí)深度平移。我們連接??和??作為輸入。輸出是表示對(duì)象中心絕對(duì)深度的單個(gè)值。我們把它命名為??。 SDDR方案主要從三個(gè)方面來(lái)保留對(duì)象形狀細(xì)節(jié)。首先,由于我們只使用圖像塊來(lái)重建物體層深度,模型可以專注于物體的形狀而不是整個(gè)場(chǎng)景的幾何形狀。其次,形狀先驗(yàn)對(duì)物體的形狀提供了強(qiáng)大的約束,使其更容易恢復(fù)形狀細(xì)節(jié)。第三,分別學(xué)習(xí)絕對(duì)物體中心和物體形狀,并給予不同的注意。 在??和??被預(yù)測(cè)后,對(duì)象級(jí)深度可以表示為??,其中??為??的第三分量。注意,我們選擇監(jiān)督Z而不是反向投影的點(diǎn)云。因?yàn)橐环矫?,網(wǎng)絡(luò)在訓(xùn)練過(guò)程中更容易學(xué)習(xí)Z,另一方面,將Z逆向投影到點(diǎn)云上進(jìn)行對(duì)齊,物體的2D坐標(biāo)將為全局位置提供額外的約束,這也有利于最后的物體姿態(tài)的恢復(fù)步驟。04? NOCS預(yù)測(cè)我們還預(yù)測(cè)管道中目標(biāo)對(duì)象的NOCS表示,這是一種規(guī)范表示,用于與物體級(jí)深度對(duì)齊,以恢復(fù)6D對(duì)象姿勢(shì)。為了預(yù)測(cè)NOCS表示,我們將Z反投影到點(diǎn)云中,并將其輸入到MLP中,以獲得深度特征??。取??,??,??輸入,類似于重建對(duì)象級(jí)深度,我們使用SPD來(lái)預(yù)測(cè)NOCS表示:? 44d1c566-3a03-11ed-9e49-dac502259ad0.png 然而,我們發(fā)現(xiàn)在某些情況下,??不夠真實(shí),這將影響最終的6D目標(biāo)姿態(tài)估計(jì)精度。因此我們采用對(duì)抗訓(xùn)練策略訓(xùn)練網(wǎng)絡(luò)。具體來(lái)說(shuō),我們?cè)O(shè)計(jì)了一個(gè)判別器來(lái)判斷預(yù)測(cè)的NOCS表示是否足夠真實(shí)。判別器的優(yōu)化目標(biāo)可表示為:? 44df7c06-3a03-11ed-9e49-dac502259ad0.png 同樣,NOCS預(yù)測(cè)網(wǎng)絡(luò)的優(yōu)化目標(biāo)??:??在訓(xùn)練過(guò)程中,對(duì)判別器和NOCS預(yù)測(cè)網(wǎng)絡(luò)的參數(shù)進(jìn)行迭代更新。兩個(gè)網(wǎng)絡(luò)都將通過(guò)對(duì)抗變得越來(lái)越強(qiáng)大。因此,預(yù)測(cè)的NOCS表現(xiàn)也會(huì)變得越來(lái)越現(xiàn)實(shí)。05??損失函數(shù)對(duì)于物體級(jí)深度重建,我們使用Z和真實(shí)值的L1損失:?對(duì)于NOCS表示預(yù)測(cè),我們使用損失函數(shù)包括重建的NOCS表示和真實(shí)值之間的平滑L1 loss ??,倒角距離損失??,交叉熵?fù)p失??,以鼓勵(lì)分配矩陣xmnocs的峰值分布,L2正則化損失。我們使用的總損失函數(shù)為:? 44f07560-3a03-11ed-9e49-dac502259ad0.png 06??實(shí)驗(yàn)我們通過(guò)PyTorch實(shí)現(xiàn)我們的方法,并使用Adam優(yōu)化器對(duì)其進(jìn)行優(yōu)化。我們?cè)谟?xùn)練過(guò)程中隨機(jī)選擇1024像素來(lái)預(yù)測(cè)深度。Detect-Net是Mask-RCNN。使用帶有ResNet-18骨干的PSPNet來(lái)學(xué)習(xí)圖像特征。形狀先驗(yàn)點(diǎn)數(shù)為1024。我們?cè)O(shè)C = 64, ???= 1024。該模型訓(xùn)練50個(gè)epoch,批次大小為96。主網(wǎng)絡(luò)的初始學(xué)習(xí)率為0.0001,第40個(gè)epoch的衰減率為0.1。我們?cè)贑AMERA25數(shù)據(jù)集和REAL275數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)。重建質(zhì)量評(píng)價(jià):在我們的工作中,主要思想是重建物體級(jí)深度和NOCS表示。因此,我們首先在表1中評(píng)估我們方法的重構(gòu)質(zhì)量。計(jì)算反向投影深度與地面真實(shí)值之間的倒角距離,驗(yàn)證深度重建的質(zhì)量。我們也計(jì)算預(yù)測(cè)的NOCS值與真實(shí)NOCS值之間的倒角距離評(píng)價(jià)NOCS預(yù)測(cè)質(zhì)量。

45053996-3a03-11ed-9e49-dac502259ad0.png

如上表所示對(duì)于物體級(jí)深度重構(gòu),REAL275數(shù)據(jù)集的誤差小于2cm。對(duì)于NOCS預(yù)測(cè),REAL275數(shù)據(jù)集的誤差也接近2cm。與我們的大物體尺寸和景深相比,2厘米是一個(gè)相對(duì)較小的尺度誤差。因此,我們可以得出結(jié)論,我們的方法確實(shí)具有良好的物體級(jí)深度重構(gòu)質(zhì)量和NOCS表示預(yù)測(cè)質(zhì)量。在CAMERA25數(shù)據(jù)集上,大多數(shù)類別的NOCS表示預(yù)測(cè)誤差仍在2cm以下。然而,物體級(jí)深度構(gòu)造誤差增加到3cm到5cm。其原因可能是在較大的合成數(shù)據(jù)集中存在較大的深度分布方差。這一觀察結(jié)果還表明,重構(gòu)物體級(jí)深度比預(yù)測(cè)NOCS表示更難。6D位姿估計(jì)的定量結(jié)果:我們將我們的方法與下表中最先進(jìn)的方法進(jìn)行定量比較。

4515d0c6-3a03-11ed-9e49-dac502259ad0.png

我們首先將我們的方法與Lee et al.在CAMERA25數(shù)據(jù)集上進(jìn)行比較。Lee等人通過(guò)首先重建網(wǎng)格,然后將網(wǎng)格渲染成深度圖來(lái)預(yù)測(cè)深度。相比之下,我們選擇直接重構(gòu)對(duì)象級(jí)深度,這更簡(jiǎn)單,也更有效。我們可以看到,我們的方法在6個(gè)指標(biāo)中的4個(gè)指標(biāo)上優(yōu)于Lee et al.。在最嚴(yán)格的10?10cm度量,我們的方法超過(guò)Lee等人4.2分,這是一個(gè)顯著的改進(jìn)。在IoU25和IoU50指標(biāo)上,盡管我們的結(jié)果略低于Lee等人,但我們?nèi)匀粚?shí)現(xiàn)了相當(dāng)?shù)男阅?。這些結(jié)果表明,使用我們的SDDR方案和NGPH重構(gòu)對(duì)象級(jí)深度是比重構(gòu)對(duì)象網(wǎng)格更好的選擇。主要原因可能是,如果深度平移和形狀點(diǎn)解耦,網(wǎng)絡(luò)更容易學(xué)習(xí)有用的信息,如物體的形狀細(xì)節(jié)或物體的絕對(duì)中心。 為了進(jìn)一步驗(yàn)證我們重構(gòu)物體級(jí)深度比估計(jì)場(chǎng)景級(jí)深度的動(dòng)機(jī)和好處,我們將我們的方法與下表中的兩個(gè)場(chǎng)景級(jí)深度估計(jì)基線進(jìn)行比較。場(chǎng)景級(jí)基線-1和場(chǎng)景級(jí)基線-2共享相同的編碼器-解碼器網(wǎng)絡(luò)架構(gòu)。不同的是,在訓(xùn)練時(shí),場(chǎng)景級(jí)基線-1與NOCS重構(gòu)分支共享編碼器,而場(chǎng)景級(jí)基線-2獨(dú)立訓(xùn)練深度估計(jì)器。這兩個(gè)網(wǎng)絡(luò)都經(jīng)過(guò)精心調(diào)優(yōu),以實(shí)現(xiàn)最佳性能。下表顯示了OLD-Net顯著優(yōu)于兩個(gè)場(chǎng)景級(jí)基線。原因可能是由預(yù)測(cè)的物體級(jí)深度OLD-Net在保存形狀細(xì)節(jié)方面比粗糙的場(chǎng)景級(jí)深度要好得多,而形狀細(xì)節(jié)對(duì)于NOCS深度對(duì)齊過(guò)程至關(guān)重要。

452474d2-3a03-11ed-9e49-dac502259ad0.png

所有這些結(jié)果都證明了我們的方法的優(yōu)越性。此外,我們還在下圖中展示了3D IoU、旋轉(zhuǎn)誤差和平移誤差的不同閾值下的平均精度(AP)圖。我們將我們的方法與基于rgbd的NOCS方法進(jìn)行比較。從圖中可以看出,我們的方法在所有類別的IoU和旋轉(zhuǎn)方面都表現(xiàn)出色。旋轉(zhuǎn)預(yù)測(cè)的優(yōu)異性能很大程度上是由于我們將形狀點(diǎn)解耦到深度之外,以保留形狀細(xì)節(jié)。在對(duì)準(zhǔn)中,旋轉(zhuǎn)是否準(zhǔn)確主要取決于物體形狀的質(zhì)量。因此,我們的模型在旋轉(zhuǎn)預(yù)測(cè)方面甚至達(dá)到了與基于rgbd的方法相當(dāng)?shù)男阅堋O啾戎?,基于rgbd的預(yù)測(cè)結(jié)果相對(duì)較低。這是因?yàn)閺膯文縍GB圖像中恢復(fù)物體的絕對(duì)全局位置是一個(gè)問(wèn)題。因此,今后的工作應(yīng)更加重視獲得更精確的絕對(duì)深度預(yù)測(cè)。

4532f908-3a03-11ed-9e49-dac502259ad0.png

6D位姿估計(jì)的定性結(jié)果:為了定性分析我們方法的有效性,我們將估計(jì)的邊界框可視化,如下圖所示。給出了綜合數(shù)據(jù)和實(shí)際數(shù)據(jù)的計(jì)算結(jié)果??梢钥闯?,OLD-Net可以預(yù)測(cè)的物體邊界框,這對(duì)于增強(qiáng)現(xiàn)實(shí)產(chǎn)品來(lái)說(shuō)是足夠準(zhǔn)確的。在下圖中我們還展示了一些失敗案例。OLDNet有時(shí)可能會(huì)漏掉物體。我們把解決它作為我們未來(lái)的工作。

45444bc2-3a03-11ed-9e49-dac502259ad0.png

457362a4-3a03-11ed-9e49-dac502259ad0.png

07消融實(shí)驗(yàn)VanillaSPD:我們采用SPD來(lái)學(xué)習(xí)SDDR中的形狀點(diǎn)。人們可能會(huì)想,我們的模型的良好性能是否來(lái)自于SPD,而不是我們?cè)O(shè)計(jì)的其他模塊。因此,我們展示了僅使用普通SPD模塊(不使用OLD-Net,不使用SDDR,僅使用SPD直接預(yù)測(cè)對(duì)象級(jí)深度的反向投影點(diǎn)云)時(shí)的性能。沒(méi)有我們的其他設(shè)計(jì),Vanilla SPD的性能很差。SDDR方案的影響:在本文中,SDDR被引入,將物體級(jí)深度解耦為深度轉(zhuǎn)換和形狀點(diǎn)。與Vanilla SPD相比,我們?cè)谙卤碇械乃心P桶姹径疾捎昧薙DDR方案,因此,它們的性能在很大程度上得到了改善。

459252ea-3a03-11ed-9e49-dac502259ad0.png

表中的第3行,我們沒(méi)有使用兩個(gè)單獨(dú)的模塊來(lái)獨(dú)立學(xué)習(xí)深度轉(zhuǎn)換和形狀點(diǎn),而是使用一個(gè)單一的模塊直接預(yù)測(cè)絕對(duì)的物體級(jí)深度。我們發(fā)現(xiàn),IoU25指標(biāo)和IoU50指標(biāo)下降了很多。這可能是因?yàn)槿绻话焉疃冉怦畛鰜?lái),網(wǎng)絡(luò)可能會(huì)丟失物體的細(xì)節(jié),如物體的長(zhǎng)寬高比例或一些特定的物體成分。此外,在第4行,我們顯示了用MLP代替SPD來(lái)預(yù)測(cè)形狀點(diǎn)的結(jié)果,即直接回歸NOCS和物體級(jí)深度。很明顯,所有的指標(biāo)都有明顯的下降。這個(gè)結(jié)果證明了在SDDR中采用SPD是非常必要的。SPD為模型提供了關(guān)于物體形狀的強(qiáng)大約束。請(qǐng)注意表的第3行和第4行,雖然我們刪除了一些設(shè)計(jì),但屬于物體的像素的二維坐標(biāo)仍被用于反向投影(它也是SDDR的一部分),這將為絕對(duì)深度提供額外的約束。否則,性能會(huì)更差,如表第2行所示,它直接預(yù)測(cè)了物體點(diǎn)云??傊琒DDR方案在OLD-Net中對(duì)物體形狀細(xì)節(jié)的保存和絕對(duì)物體中心的預(yù)測(cè)都起著重要的作用。NGPH的影響:由于我們的模型只采取RGB圖像來(lái)預(yù)測(cè)深度以保存形狀細(xì)節(jié),全局位置信息將被丟失。為了彌補(bǔ)這一缺陷,我們將NGPH注入到我們的網(wǎng)絡(luò)中。在表的第5行中,我們將NGPH從我們的網(wǎng)絡(luò)中移除,以研究其影響。當(dāng)它被移除后,所有的指標(biāo)都下降了很多。這是因?yàn)?,沒(méi)有NGPH,網(wǎng)絡(luò)就很難預(yù)測(cè)絕對(duì)深度。盡管三維點(diǎn)之間的相對(duì)位置可以從圖像中推斷出來(lái),但錯(cuò)誤的絕對(duì)深度會(huì)使我們很難通過(guò)對(duì)齊來(lái)準(zhǔn)確恢復(fù)物體的姿勢(shì)。 我們采用對(duì)抗性訓(xùn)練策略來(lái)提高預(yù)測(cè)的NOCS表示的質(zhì)量。當(dāng)它被移除時(shí),如表的倒數(shù)第二行所示,除了10?指標(biāo)外,所有指標(biāo)都下降了。這一結(jié)果證明了對(duì)抗性訓(xùn)練對(duì)于提高性能是必要的。它還表明,NOCS表示的質(zhì)量和對(duì)象層面的深度都很重要。兩者都不能被忽視。08總結(jié)本文提出了一種新的基于rgb的類別級(jí)6D目標(biāo)位姿估計(jì)網(wǎng)絡(luò)OLD-Net。利用形狀先驗(yàn)直接預(yù)測(cè)物體層次深度是我們研究的關(guān)鍵。在OLD-Net中引入了歸一化全局位置提示和形狀感知解耦深度重構(gòu)方案。我們還使用對(duì)抗性訓(xùn)練預(yù)測(cè)管道中對(duì)象的規(guī)范NOCS表示。在真實(shí)數(shù)據(jù)集和合成數(shù)據(jù)集上的大量實(shí)驗(yàn)表明,我們的方法可以實(shí)現(xiàn)新的最先進(jìn)的性能。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • RGB
    RGB
    +關(guān)注

    關(guān)注

    4

    文章

    831

    瀏覽量

    61925
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    8251

    瀏覽量

    94681
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26187

原文標(biāo)題:ECCV 2022 | 從單目RGB圖像中進(jìn)行類別級(jí)6D物體姿態(tài)估計(jì)

文章出處:【微信號(hào):3D視覺(jué)工坊,微信公眾號(hào):3D視覺(jué)工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    從"替代人力"到"智能協(xié)同":履帶式巡檢機(jī)器人的產(chǎn)業(yè)躍遷

    體現(xiàn)了技術(shù)的深度融合,更折射出產(chǎn)業(yè)對(duì)本質(zhì)安全的深度追求。 ? 政策與市場(chǎng)的雙重驅(qū)動(dòng) ? 安全生產(chǎn)法規(guī)的剛性約束為智能巡檢機(jī)器人的規(guī)?;瘧?yīng)用提供了制度保障。新修訂的《安全生產(chǎn)法》明確要求高危行業(yè)推進(jìn)"機(jī)械化換人、自動(dòng)化減
    的頭像 發(fā)表于 02-05 10:42 ?249次閱讀

    選EtherCAT模塊,別只看價(jià)格,先看"體檢報(bào)告"

    ±8kV靜電、±2kV浪涌、-42℃極寒、1500V高壓—這不是極限運(yùn)動(dòng),而是DPort-ECT模塊的出廠"必修課"。本文詳解工業(yè)級(jí)EtherCAT從站如何通過(guò)嚴(yán)苛測(cè)試關(guān)
    的頭像 發(fā)表于 02-04 11:46 ?226次閱讀
    選EtherCAT模塊,別只看價(jià)格,先看&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;體檢報(bào)告&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    L3試點(diǎn)落地,和芯星通如何成為車(chē)企突圍的&amp;amp;quot;隱形守護(hù)者&amp;amp;quot;?

    當(dāng)長(zhǎng)安汽車(chē)與北汽極狐拿到中國(guó)首批L3級(jí)自動(dòng)駕駛準(zhǔn)入許可的那刻,整個(gè)產(chǎn)業(yè)鏈等待多年的&quot;靴子&quot;終于落地。在這個(gè)責(zé)任主體從駕駛員轉(zhuǎn)向車(chē)企的關(guān)鍵轉(zhuǎn)折下,系統(tǒng)可靠性成為真正的&qu
    的頭像 發(fā)表于 01-04 12:03 ?523次閱讀
    L3試點(diǎn)落地,和芯星通如何成為車(chē)企突圍的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;隱形守護(hù)者&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    Vishay Vitramon Touch &amp;quot;N&amp;quot; Tune? MLCC套件技術(shù)分析

    在元件焊盤(pán)上,無(wú)需焊接即可查看電路特性。這樣可以實(shí)現(xiàn)快速電路性能評(píng)估,并方便更換組件,直至達(dá)到所需的調(diào)諧效果。該高頻MLCC Touch &quot;N&quot; Tune套件非常適合寬帶無(wú)線通信、 RF儀器、濾波網(wǎng)絡(luò)、 定時(shí)
    的頭像 發(fā)表于 11-09 17:46 ?1436次閱讀

    &amp;quot;Access violation&amp;quot; 錯(cuò)誤,復(fù)位位置,重新打印

    &quot;Access violation&quot; 錯(cuò)誤
    的頭像 發(fā)表于 11-08 07:16 ?527次閱讀

    為什么變頻器開(kāi),監(jiān)控畫(huà)面就&amp;amp;quot;雪花&amp;amp;quot;?

    當(dāng)你的工廠監(jiān)控畫(huà)面總是&quot;雪花&quot;閃爍,變頻器啟動(dòng)就跳線,你是不是以為是攝像頭老化了?其實(shí),90%的這類問(wèn)題都是變頻器諧波在作怪!這不是攝像頭的錯(cuò),而是變頻器輸出的高次諧波干擾了
    的頭像 發(fā)表于 09-23 14:17 ?628次閱讀
    為什么變頻器<b class='flag-5'>一</b>開(kāi),監(jiān)控畫(huà)面就&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;雪花&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    光耦合器:電子世界的 &amp;quot;光橋梁&amp;quot;

    在現(xiàn)代電子設(shè)備的復(fù)雜電路中,信號(hào)的傳輸與隔離至關(guān)重要。就像城市交通中需要橋梁來(lái)跨越障礙、連接不同區(qū)域樣,電子電路里也需要座 &quot;橋梁&quot; 來(lái)實(shí)現(xiàn)信號(hào)的安全、高效傳輸
    的頭像 發(fā)表于 08-22 16:58 ?1015次閱讀

    精密設(shè)備的&amp;amp;quot;電力保鏢&amp;amp;quot;:優(yōu)比施UPS如何守護(hù)數(shù)據(jù)與硬件安全?

    、用戶痛點(diǎn):精密設(shè)備的&quot;斷電恐懼癥&quot;在數(shù)據(jù)中心、醫(yī)療實(shí)驗(yàn)室、工業(yè)控制等場(chǎng)景中,精密電子設(shè)備對(duì)電源的依賴已達(dá)到&quot;零容忍&
    的頭像 發(fā)表于 07-25 09:00 ?781次閱讀
    精密設(shè)備的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;電力保鏢&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;:優(yōu)比施UPS如何守護(hù)數(shù)據(jù)與硬件安全?

    地?zé)岚l(fā)電環(huán)網(wǎng)柜局放監(jiān)測(cè)設(shè)備:清潔能源電網(wǎng)的&amp;amp;quot;安全衛(wèi)士&amp;amp;quot;

    的局部放電問(wèn)題,直接影響系統(tǒng)供電穩(wěn)定性。地?zé)岚l(fā)電環(huán)網(wǎng)柜局放監(jiān)測(cè)設(shè)備通過(guò)非接觸式檢測(cè)技術(shù)與智能算法結(jié)合,為清潔能源電網(wǎng)構(gòu)筑起道主動(dòng)防御體系。技術(shù)原理:破解局部放電的&quot;電磁密碼&quot;地?zé)岚l(fā)電
    的頭像 發(fā)表于 07-16 10:15 ?567次閱讀
    地?zé)岚l(fā)電環(huán)網(wǎng)柜局放監(jiān)測(cè)設(shè)備:清潔能源電網(wǎng)的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;安全衛(wèi)士&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    為什么GNSS/INS組合被譽(yù)為導(dǎo)航界的&amp;amp;quot;黃金搭檔&amp;amp;quot;?

    在導(dǎo)航技術(shù)領(lǐng)域,GNSS(全球?qū)Ш叫l(wèi)星系統(tǒng))和INS(慣性導(dǎo)航系統(tǒng))的結(jié)合,直被業(yè)界譽(yù)為&quot;黃金搭檔&quot;。它們優(yōu)勢(shì)互補(bǔ),克服了單系統(tǒng)的局限性,為高精度、高可靠性的導(dǎo)
    的頭像 發(fā)表于 07-09 17:12 ?954次閱讀
    為什么GNSS/INS組合被譽(yù)為導(dǎo)航界的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黃金搭檔&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    人形機(jī)器人為什么要定制? ——揭秘工業(yè)場(chǎng)景的&amp;quot;千面需求&amp;quot;

    核心洞察:標(biāo)準(zhǔn)化機(jī)器人難以破解工業(yè)場(chǎng)景的&quot;需求碎片化&quot;困局。富唯智能通過(guò)?&quot;五大模塊柔性架構(gòu)+零代碼中樞&quot;?,為?人形機(jī)器人為什么要定制?提供了
    的頭像 發(fā)表于 06-10 17:19 ?1240次閱讀
    人形機(jī)器人為什么要定制? ——揭秘工業(yè)場(chǎng)景的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;千面需求&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    倉(cāng)儲(chǔ)界的&amp;quot;速效救心丸&amp;quot;,Ethercat轉(zhuǎn)PROFINET網(wǎng)關(guān)實(shí)戰(zhàn)案例

    實(shí)戰(zhàn)案例,Ethercat轉(zhuǎn)PROFINET網(wǎng)關(guān),倉(cāng)儲(chǔ)界的&quot;速效救心丸&quot;
    的頭像 發(fā)表于 05-11 10:32 ?764次閱讀
    倉(cāng)儲(chǔ)界的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;速效救心丸&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;,Ethercat轉(zhuǎn)PROFINET網(wǎng)關(guān)實(shí)戰(zhàn)案例

    電纜局部放電在線監(jiān)測(cè):守護(hù)電網(wǎng)安全的&amp;amp;quot;黑科技&amp;amp;quot;

    文章由山東華科信息技術(shù)有限公司提供在萬(wàn)家燈火的背后,有張覆蓋全國(guó)的&quot;能源神經(jīng)網(wǎng)絡(luò)&quot;晝夜不息地運(yùn)轉(zhuǎn)。電纜作為電力輸送的&quot
    的頭像 發(fā)表于 04-14 18:12 ?955次閱讀
    電纜局部放電在線監(jiān)測(cè):守護(hù)電網(wǎng)安全的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黑科技&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    隧道管廊變壓器局放在線監(jiān)測(cè):為地下&amp;amp;quot;電力心臟&amp;amp;quot;裝上智能聽(tīng)診器

    可能因老化、受潮產(chǎn)生局部放電,如同潛伏的&quot;電蝕暗流&quot;,持續(xù)威脅著電力輸送的安全。如何為這顆&quot;心臟&quot;裝上智能監(jiān)測(cè)裝置?隧道管廊變壓器局放在線監(jiān)測(cè)系
    的頭像 發(fā)表于 04-09 16:37 ?867次閱讀
    隧道管廊變壓器局放在線監(jiān)測(cè):為地下&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;電力心臟&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;裝上智能聽(tīng)診器

    3分鐘讀懂 | 氣密性檢測(cè)儀如何&amp;amp;quot;揪出&amp;amp;quot;泄漏點(diǎn)?原理全拆解!

    地&quot;揪出&quot;泄漏點(diǎn)的呢?今天,我們就用3分鐘,帶你徹底搞懂氣密性檢測(cè)儀的工作原理!、氣密性檢測(cè)儀是什么?氣密性檢測(cè)儀,顧名思義,就是用來(lái)檢測(cè)物體密封性能的設(shè)備。它通
    的頭像 發(fā)表于 03-15 16:13 ?1318次閱讀
    3分鐘讀懂 | 氣密性檢測(cè)儀如何&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;揪出&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;泄漏點(diǎn)?原理全拆解!