chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

破解透明物體抓取難題,地瓜機器人 CASIA 推出幾何和語義融合的單目抓取方案|ICRA 2025

地瓜機器人 ? 2025-03-05 19:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

概述

近日,全球機器人領(lǐng)域頂會ICRA 2025(IEEE機器人與自動化國際會議)公布論文錄用結(jié)果,地瓜機器人主導(dǎo)研發(fā)的DOSOD開放詞匯目標檢測算法MODEST單目透明物體抓取算法成功入選。前者通過動態(tài)語義理解框架提升復(fù)雜場景識別準確率,后者結(jié)合幾何建模與語義分析技術(shù)優(yōu)化透明物體操作精度,兩項技術(shù)成果均已在規(guī)?;虡I(yè)場景中得到有效驗證。此次投稿的兩篇論文全部入選,不僅彰顯了ICRA對機器人感知領(lǐng)域的高度重視,同時也印證了地瓜機器人團隊在機器人視覺領(lǐng)域的領(lǐng)先優(yōu)勢。

DOSOD開放詞匯目標檢測算法,本期文章將圍繞MODEST單目透明抓取算法進行重點介紹。

作為機器人執(zhí)行各項任務(wù)中繞不開的操作對象,水杯、試管、窗戶等透明物體在人類生活中無處不在。從精密制造、醫(yī)療實驗室和家庭服務(wù)機器人等領(lǐng)域,透明物體的精確操作是提升自動化和智能化水平的關(guān)鍵。然而,透明物體復(fù)雜的折射和反射特性給機器人感知造成了很大困難。在大多數(shù)RGB圖像中的透明物體往往缺乏清晰的紋理,而容易與背景混為一體。此外,商用深度相機也難以準確捕捉這些物體的深度信息,導(dǎo)致深度圖缺失或噪聲過多,從而限制了機器人在多個領(lǐng)域的廣泛應(yīng)用。

為了解決透明物體的抓取問題,地瓜機器人聯(lián)合中科院自動化所(簡稱:CASIA)多模態(tài)人工智能系統(tǒng)全國重點實驗室,推出了針對透明物體的單目深度估計和語義分割的多任務(wù)框架(簡稱:MODEST)。該框架借助創(chuàng)新性的語義和幾何融合模塊,結(jié)合獨特的特征迭代更新策略,顯著提升了深度估計和語義分割的效果,尤其在抓取成功率和系統(tǒng)泛化性方面取得了突破性進展。

MODEST算法框架作為通用抓取模型的前置模塊,即插即用,靈活高效,且無需依賴額外傳感器,僅靠單張RGB圖像,便可實現(xiàn)透明物體的抓取,效果上甚至要優(yōu)于其它雙目和多視圖的方法,可以廣泛應(yīng)用于智能工廠、實驗室自動化、智慧家居等場景,降低設(shè)備成本并大幅提升機器人對透明物體的操作能力。

基本原理

當前透明物體的抓取核心在于深度信息的獲取,目前無論是深度傳感器還是多視角重建的方法都無法獲取透明物體準確完整的深度信息。為了解決透明物體感知難題,傳統(tǒng)方法大多依賴特殊傳感設(shè)備或多視角圖像,增加了時間和經(jīng)濟成本,并常常受限于應(yīng)用場景。MODEST單目框架首次突破了傳統(tǒng)傳感器處理透明物體時的限制,降低了設(shè)備成本和使用復(fù)雜度,提供了更加高效、經(jīng)濟和便捷的透明物體感知方案。

wKgZO2fIImaAUTNdAAIb7m0kV_s285.png

單目透明物體感知框架與其他方法之間的對比

MODEST主要聚焦于透明物體的深度估計,通過設(shè)計的語義和幾何結(jié)合的多任務(wù)框架,獲取物體準確的深度信息,之后結(jié)合基于點云的抓取網(wǎng)絡(luò)實現(xiàn)透明物體的抓取。相當于在通用抓取網(wǎng)絡(luò)前面增加一個針對透明物體的增強模塊。

MODEST模型的整體架構(gòu)如圖所示,輸入為單目RGB圖像,輸出為透明物體的分割結(jié)果和場景深度預(yù)測。網(wǎng)絡(luò)主要由編碼、重組、語義幾何融合迭代解碼四個模塊組成。輸入圖像首先經(jīng)過基于ViT的編碼模塊進行處理,隨后重組為對應(yīng)分割和深度兩個分支的多尺度特征。在融合模塊中對兩組特征進行混合和增強,最后通過多次迭代逐步更新特征,并獲得最終預(yù)測結(jié)果。

wKgZO2fIIqaAV0SNAAEczfrgSe4127.png

基于語義幾何融合和迭代策略的透明物體單目多任務(wù)框架

對于透明物體來說,語義分割任務(wù)可以為深度估計提供語義和上下文信息,而同樣深度估計可以為分割提供邊界、表面等幾何信息。為了充分挖掘兩個任務(wù)間的互補信息,MODEST算法框架構(gòu)建了基于注意力機制的語義幾何融合模塊,旨在同時提升兩個任務(wù)的性能。

wKgZPGfIIuCAcWADAAG1aAjP7gQ052.png

語義幾何融合模塊結(jié)構(gòu)

當人類觀察透明物體等不顯著物體時,我們會傾向于先注意物體的整體輪廓,然后是局部細節(jié)。受人眼啟發(fā),MODEST框架提出了一種由粗到細的特征更新策略,進一步提升預(yù)測精度。

實驗結(jié)果

為了測試MODEST全新算法框架的檢測效果,我們選取了透明物體領(lǐng)域兩個影響力廣泛的公開仿真數(shù)據(jù)集Syn-TODD和真實數(shù)據(jù)集ClearPose,在其上與目前最先進的透明物體雙目方法SimNet、多視圖方法MVTran以及多任務(wù)方法InvPT和TaskPrompter進行對比實驗。兩個大規(guī)模數(shù)據(jù)集都擁有超過100k的良好標注圖像數(shù)據(jù),并且包含了嚴重遮擋等極端場景。

公開數(shù)據(jù)集上的定性和定量對比實驗

wKgZO2fII_yAGwb3AAGND1TNR0Q332.png

仿真數(shù)據(jù)集Syn-TODD上的定性對比結(jié)果

wKgZO2fIJCyANH5cAAGhND9LzzE443.png

真實數(shù)據(jù)集ClearPose上的定性對比結(jié)果

通過在兩個數(shù)據(jù)集上的定性對比結(jié)果可以看出,由于透明物體會錯誤地折射背景,并且在RGB圖像中缺乏紋理,因此SimNet、MVTrans等方法無法獲得令人滿意的預(yù)測,從而導(dǎo)致深度圖和分割掩膜的大面積缺失。然而,通過有效的融合和迭代,在某些即使人眼都難以分析和判斷的場景,我們的方法依然能夠產(chǎn)生完整和清晰的預(yù)測結(jié)果。

wKgZO2fIJL2ALzgEAAFq2pfyAa4566.png

仿真數(shù)據(jù)集Syn-TODD上的定量對比結(jié)果

wKgZO2fIJSyAF77cAACLqiDq9qc375.png

真實數(shù)據(jù)集ClearPose上的定量對比結(jié)果

從表格中的定量對比可以看出,MODEST算法框架在各項指標上都要大幅超過其他所有方法。值得注意的是,盡管只使用單張RGB圖像作為輸入,MODEST在深度估計和語義分割方面都要明顯優(yōu)于其他雙目甚至多視圖方法。并且在Syn-TODD數(shù)據(jù)集上,與排名第二的方法相比,MODEST算法框架在RMSE和REL兩項指標有著超過45%的提升,語義分割的精度也均超過了90%。

真實平臺抓取實驗

我們將算法遷移到真實機器人平臺,開展了透明物體抓取實驗。平臺主要由UR機械臂和深度相機構(gòu)成,在借助MODEST方法進行透明物體精確感知的基礎(chǔ)之上,采用GraspNet進行抓取位姿的生成。在多個透明物體上的實驗結(jié)果表明,MODEST方法在真實平臺上具有良好的魯棒性泛化性。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    30240

    瀏覽量

    217710
  • 人工智能
    +關(guān)注

    關(guān)注

    1811

    文章

    49488

    瀏覽量

    258049
  • 檢測算法
    +關(guān)注

    關(guān)注

    0

    文章

    122

    瀏覽量

    25613
  • 地瓜機器人
    +關(guān)注

    關(guān)注

    0

    文章

    28

    瀏覽量

    279
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    機器人競技幕后:磁傳感器芯片激活 “精準感知力”

    2025 世界人形機器人運動會于 8 月 17 日圓滿收官,賽場上機器人在跑步、跳躍、抓取等項目中的精彩表現(xiàn),背后是運動控制、環(huán)境感知等技術(shù)的迭代升級。而在這些技術(shù)中,磁傳感器芯片憑借
    發(fā)表于 08-26 10:02

    盤點#機器人開發(fā)平臺

    地瓜機器人RDK X5開發(fā)套件地瓜機器人RDK X5開發(fā)套件產(chǎn)品介紹 旭日5芯片10TOPs算力-電子發(fā)燒友網(wǎng)機器人開發(fā)套件 Kria KR
    發(fā)表于 05-13 15:02

    RDK全系賦能!點貓科技與地瓜機器人共建具身智能大中小貫通培養(yǎng)閉環(huán)要聞

    要聞2025年4月24日,地平線旗下地瓜機器人與點貓科技于深圳正式宣布達成戰(zhàn)略合作,地瓜機器人成為點貓科技具身智能領(lǐng)域大中小貫通培養(yǎng)獨家合作
    的頭像 發(fā)表于 05-06 05:37 ?650次閱讀
    RDK全系賦能!點貓科技與<b class='flag-5'>地瓜</b><b class='flag-5'>機器人</b>共建具身智能大中小貫通培養(yǎng)閉環(huán)要聞

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】視覺實現(xiàn)的基礎(chǔ)算法的應(yīng)用

    結(jié)合IMU(慣性測量單元)進行多傳感器融合。 三、總結(jié)與展望 技術(shù)融合趨勢 機器人視覺與SLAM的結(jié)合(如視覺慣性里程計VIO)是當前研究熱點,未來可能進一步結(jié)合語義SLAM,讓
    發(fā)表于 05-03 19:41

    大象機器人攜手進迭時空推出 RISC-V 全棧開源六軸機械臂產(chǎn)品

    全球80多個國家和地區(qū)。 近日,大象機器人聯(lián)合進迭時空推出全球首款RISC-V全棧開源六軸機器臂“myCobot 280 RISC-V”,為開發(fā)者打造全新的機器人開源創(chuàng)新平臺。 “my
    發(fā)表于 04-25 17:59

    樂聚機器人地瓜機器人達成戰(zhàn)略合作,聯(lián)合發(fā)布Aelos Embodied具身智能

    要聞4月19日,在CCF人形機器人與人工智能技術(shù)巡回研討會(武漢站)上,樂聚機器人地瓜機器人達成戰(zhàn)略合作,雙方將基于RDKX5、RDKS100以及更高性能的國產(chǎn)大算力平臺,就夸父(K
    的頭像 發(fā)表于 04-24 22:07 ?939次閱讀
    樂聚<b class='flag-5'>機器人</b>與<b class='flag-5'>地瓜</b><b class='flag-5'>機器人</b>達成戰(zhàn)略合作,聯(lián)合發(fā)布Aelos Embodied具身智能

    地瓜機器人RDK X5 規(guī)格書與地瓜機器人RDK X5原理圖

    地瓜機器人是芯片公司地平線成立的全資控股子公司。專注于機器人市場的軟硬件通用底座提供商。地瓜機器人以旭日智能計算芯片和 RDK
    的頭像 發(fā)表于 04-21 19:01 ?1987次閱讀
    <b class='flag-5'>地瓜</b><b class='flag-5'>機器人</b>RDK X5 規(guī)格書與<b class='flag-5'>地瓜</b><b class='flag-5'>機器人</b>RDK X5原理圖

    富唯智能最小復(fù)合機器人的強大抓取實力?

    在工業(yè)自動化領(lǐng)域,復(fù)合機器人的身影愈發(fā)常見。但你是否好奇,最小的復(fù)合機器人抓取多少多重?富唯智能以創(chuàng)新技術(shù),給出了令人驚嘆的答案,徹底顛覆我們對小身形機器人的認知。?
    的頭像 發(fā)表于 04-16 16:31 ?457次閱讀
    富唯智能最小復(fù)合<b class='flag-5'>機器人</b>的強大<b class='flag-5'>抓取</b>實力?

    大象機器人推出myCobot 280 RDK X5,攜手地瓜機器人共建智能教育機

    摘要大象機器人全新推出輕量級高性能教育機械臂myCobot280RDKX5,該產(chǎn)品集成地瓜機器人RDKX5開發(fā)者套件,深度整合雙方在硬件研發(fā)與智能計算領(lǐng)域的技術(shù)優(yōu)勢,實現(xiàn)芯片架構(gòu)、軟件
    的頭像 發(fā)表于 04-15 22:05 ?920次閱讀
    大象<b class='flag-5'>機器人</b><b class='flag-5'>推出</b>myCobot 280 RDK X5,攜手<b class='flag-5'>地瓜</b><b class='flag-5'>機器人</b>共建智能教育機

    復(fù)合機器人抓取精度的影響因素及提升策略

    復(fù)合機器人結(jié)合了移動機器人(如AGV)和機械臂的功能,廣泛應(yīng)用于物流、制造等領(lǐng)域。抓取精度是其核心性能指標之一,直接影響作業(yè)效率和產(chǎn)品質(zhì)量。本文將探討復(fù)合機器人
    的頭像 發(fā)表于 04-12 11:15 ?550次閱讀

    地瓜機器人,和全球機器人開發(fā)者交朋友

    前言自2024年9月20日在國內(nèi)官宣以來,地瓜機器人(D-Robotics)正在以行業(yè)領(lǐng)軍者的角色,開放姿態(tài)擁抱全球機遇,致力于和全球機器人開發(fā)者交朋友。短短半年間,從亞洲的東京、首爾、新加坡
    的頭像 發(fā)表于 03-24 15:27 ?1177次閱讀
    <b class='flag-5'>地瓜</b><b class='flag-5'>機器人</b>,和全球<b class='flag-5'>機器人</b>開發(fā)者交朋友

    開啟報名!地瓜機器人-全國大學(xué)生嵌入式芯片與系統(tǒng)設(shè)計競賽賽題發(fā)布

    1公司介紹公司簡介起步于2015年誕生的地平線,地瓜機器人是業(yè)界領(lǐng)先的機器人軟硬件通用底座提供商。承載著「成為機器人時代的Wintel」的品牌初心,
    的頭像 發(fā)表于 03-13 22:33 ?1143次閱讀
    開啟報名!<b class='flag-5'>地瓜</b><b class='flag-5'>機器人</b>-全國大學(xué)生嵌入式芯片與系統(tǒng)設(shè)計競賽賽題發(fā)布

    《電子發(fā)燒友電子設(shè)計周報》聚焦硬科技領(lǐng)域核心價值 第2期:2025.03.3--2025.03.7

    ,用戶可以自定義學(xué)習(xí)任務(wù),并結(jié)合涂鴉提供的運動子系統(tǒng)行為樹框架,快速部署預(yù)訓(xùn)練模型。 地瓜機器人 CASIA 推出幾何
    發(fā)表于 03-07 18:03

    探索具身智能邊界,地瓜機器人邀你共戰(zhàn)ICRA 2025 Sim2Real挑戰(zhàn)賽

    探索具身智能邊界,地瓜機器人邀你共戰(zhàn)ICRA 2025 Sim2Real挑戰(zhàn)賽
    的頭像 發(fā)表于 01-13 20:18 ?868次閱讀
    探索具身智能邊界,<b class='flag-5'>地瓜</b><b class='flag-5'>機器人</b>邀你共戰(zhàn)<b class='flag-5'>ICRA</b> <b class='flag-5'>2025</b> Sim2Real挑戰(zhàn)賽

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人的基礎(chǔ)模塊

    具身智能機器人的基礎(chǔ)模塊,這個是本書的第二部分內(nèi)容,主要分為四個部分:機器人計算系統(tǒng),自主機器人的感知系統(tǒng),自主機器人的定位系統(tǒng),自主機器人
    發(fā)表于 01-04 19:22