chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于感知引導(dǎo)的多步驟精細(xì)操作任務(wù)與運(yùn)動(dòng)規(guī)劃

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2025-11-14 10:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

傳統(tǒng)的任務(wù)與運(yùn)動(dòng)規(guī)劃(TAMP)系統(tǒng)在機(jī)器人操作應(yīng)用中通常依賴靜態(tài)模型運(yùn)行,因此在面對(duì)新環(huán)境時(shí)往往表現(xiàn)不佳。將感知與操作相融合,是應(yīng)對(duì)這一挑戰(zhàn)的有效途徑,使機(jī)器人能夠在執(zhí)行過(guò)程中實(shí)時(shí)更新規(guī)劃,從而適應(yīng)動(dòng)態(tài)變化的場(chǎng)景。

在本期NVIDIA 機(jī)器人研發(fā)摘要 (R2D2)中,我們探討了如何利用基于感知的 TAMP 以及 GPU 加速的 TAMP 實(shí)現(xiàn)遠(yuǎn)程操作。同時(shí),我們將介紹用于提升機(jī)器人操作能力的框架,并展示如何結(jié)合視覺(jué)與語(yǔ)言信息,將像素轉(zhuǎn)化為子目標(biāo)、任務(wù)負(fù)載以及可微分的約束條件。

子目標(biāo)是較小的階段性目標(biāo),能夠引導(dǎo)機(jī)器人逐步達(dá)成最終目標(biāo)。

Affordance 根據(jù)物體或環(huán)境的屬性及其所處的上下文,描述機(jī)器人可在其上執(zhí)行的動(dòng)作。例如,手柄可被“抓取”,按鈕可被“按壓”,杯子可被“傾倒”。

在機(jī)器人運(yùn)動(dòng)規(guī)劃中,可微分約束用于確保機(jī)器人的運(yùn)動(dòng)滿足物理限制,如關(guān)節(jié)角度范圍、避障要求或末端執(zhí)行器的位置精度,同時(shí)仍支持通過(guò)學(xué)習(xí)進(jìn)行調(diào)整。由于這些約束具備可微性,GPU 能夠在訓(xùn)練或?qū)崟r(shí)規(guī)劃過(guò)程中高效地計(jì)算并優(yōu)化它們。

任務(wù)與運(yùn)動(dòng)規(guī)劃如何將視覺(jué)與語(yǔ)言信息轉(zhuǎn)化為機(jī)器人的具體動(dòng)作

TAMP 涉及確定機(jī)器人應(yīng)執(zhí)行的任務(wù)以及實(shí)現(xiàn)這些任務(wù)所需的移動(dòng)方式,需要將高層任務(wù)規(guī)劃(即執(zhí)行什么任務(wù))與底層運(yùn)動(dòng)規(guī)劃(即如何移動(dòng)以完成任務(wù))相結(jié)合。

現(xiàn)代機(jī)器人能夠結(jié)合視覺(jué)與語(yǔ)言信息(如圖像和指令),將復(fù)雜任務(wù)分解為若干較小的步驟,即子目標(biāo)。這些子目標(biāo)有助于機(jī)器人明確下一步應(yīng)執(zhí)行的動(dòng)作、需要交互的對(duì)象以及如何實(shí)現(xiàn)安全移動(dòng)。

該過(guò)程利用高級(jí)模型將圖像和書面指令轉(zhuǎn)化為機(jī)器人可在現(xiàn)實(shí)世界中執(zhí)行的清晰計(jì)劃。遠(yuǎn)程操作需要具備結(jié)構(gòu)化意圖,且依賴規(guī)劃人員的有效參與。接下來(lái),我們將探討 OWL-TAMP、VLM-TAMP 和 NOD-TAMP 如何助力解決這一問(wèn)題:

OWL-TAMP:該工作流使機(jī)器人能夠執(zhí)行以自然語(yǔ)言描述的復(fù)雜、長(zhǎng)視距操作任務(wù),例如“將橙色物體放到桌子上”。OWL-TAMP 是一種混合式工作流,將視覺(jué)語(yǔ)言模型(VLM)與任務(wù)與運(yùn)動(dòng)規(guī)劃(TAMP)相結(jié)合。其中,VLM 根據(jù)開(kāi)放世界語(yǔ)言(OWL)指令生成約束條件,描述機(jī)器人動(dòng)作空間中的操作要求。這些約束被整合進(jìn) TAMP 系統(tǒng),并通過(guò)仿真反饋機(jī)制驗(yàn)證其物理可行性和執(zhí)行正確性。

VLM-TAMP:這是一種面向視覺(jué)信息豐富環(huán)境的機(jī)器人多步驟任務(wù)規(guī)劃工作流。VLM-TAMP 將視覺(jué)語(yǔ)言模型與傳統(tǒng) TAMP 框架融合,能夠在現(xiàn)實(shí)場(chǎng)景中生成并優(yōu)化高層行動(dòng)計(jì)劃。該方法利用 VLM 解析圖像內(nèi)容,并結(jié)合任務(wù)指令(如“做一鍋雞湯”)生成初步的高級(jí)任務(wù)規(guī)劃。隨后,通過(guò)仿真驗(yàn)證和運(yùn)動(dòng)規(guī)劃進(jìn)行迭代優(yōu)化,以確保每一步操作的可行性。在涉及 30 至 50 個(gè)連續(xù)動(dòng)作、并操作多達(dá) 21 個(gè)不同物體的長(zhǎng)視距廚房任務(wù)中,該混合方法的表現(xiàn)優(yōu)于純 VLM 或純 TAMP 的基準(zhǔn)方案。該工作流使機(jī)器人能夠綜合利用視覺(jué)與語(yǔ)言上下文信息,有效應(yīng)對(duì)任務(wù)描述中的模糊性,從而提升在復(fù)雜操作任務(wù)中的整體性能。

wKgZO2kWkZiADtASAAQ2Yv4Ml1c035.png

圖1展示了VLM-TAMP如何克服單獨(dú)使用TAMP或僅依賴VLM進(jìn)行任務(wù)與運(yùn)動(dòng)規(guī)劃在解決長(zhǎng)視距機(jī)器人操作問(wèn)題時(shí)所面臨的局限性。

NOD-TAMP: 傳統(tǒng)的TAMP框架在處理長(zhǎng)視距操作任務(wù)時(shí)通常難以實(shí)現(xiàn)泛化,因其依賴于顯式的幾何模型和對(duì)象表示。NOD-TAMP通過(guò)引入神經(jīng)對(duì)象描述符(NOD)來(lái)提升對(duì)不同對(duì)象類型的泛化能力。NOD是一種基于3D激光點(diǎn)云學(xué)習(xí)得到的表示形式,能夠編碼物體的空間特征與關(guān)系屬性。該方法使機(jī)器人能夠與新對(duì)象有效交互,并支持規(guī)劃器進(jìn)行動(dòng)態(tài)的操作調(diào)整。

cuTAMP 如何利用 GPU 并行化加速機(jī)器人規(guī)劃

經(jīng)典 TAMP 首先分析任務(wù)的動(dòng)作結(jié)構(gòu)(稱為計(jì)劃骨架),再求解相應(yīng)的連續(xù)變量。第二步通常是系統(tǒng)的計(jì)算瓶頸,而cuTAMP顯著加速了這一過(guò)程。對(duì)于cuTAMP中給定的計(jì)劃骨架,系統(tǒng)會(huì)采樣數(shù)千個(gè)初始解(粒子),隨后在 GPU 上執(zhí)行可微分的批量?jī)?yōu)化,以滿足多種約束條件,例如逆運(yùn)動(dòng)學(xué)、避障、穩(wěn)定性以及目標(biāo)函數(shù)成本。

如果框架不可行,算法會(huì)進(jìn)行回溯;如果可行,則會(huì)生成一個(gè)計(jì)劃。對(duì)于受限的打包或堆疊任務(wù),該過(guò)程通常在幾秒鐘內(nèi)完成,使機(jī)器人能夠在幾秒內(nèi)找到包裝、堆疊或操作多個(gè)物體的解決方案,而無(wú)需花費(fèi)幾分鐘甚至幾小時(shí)。

“矢量化滿意度”是實(shí)現(xiàn)在現(xiàn)實(shí)應(yīng)用場(chǎng)景中長(zhǎng)期解決問(wèn)題的關(guān)鍵。

wKgZO2kWkamAMiGUAAG2JdpaDF8651.png

圖2展示了cuTAMP如何將TAMP幀化為一種回溯式的雙層搜索,以優(yōu)化計(jì)劃骨架。

機(jī)器人如何利用Stein變分推斷從故障中學(xué)習(xí)

長(zhǎng)距操作模型在面對(duì)訓(xùn)練過(guò)程中未曾遇到的新條件時(shí),可能會(huì)出現(xiàn)失效。Fail2Progress是一種使機(jī)器人能夠從自身失敗中學(xué)習(xí)并持續(xù)改進(jìn)操作能力的框架。該框架通過(guò)數(shù)據(jù)驅(qū)動(dòng)的校正與基于仿真的優(yōu)化,將實(shí)際發(fā)生的故障整合進(jìn)技能模型中。為了增強(qiáng)模型的魯棒性,F(xiàn)ail2Progress 利用 Stein 變分推斷生成與觀測(cè)到的故障相似的定向合成數(shù)據(jù)集,從而有效提升模型對(duì)異常情況的適應(yīng)能力。

然后,這些生成的數(shù)據(jù)集可用于微調(diào)并重新調(diào)整技能效果模型,從而降低長(zhǎng)視野任務(wù)中相同故障重復(fù)發(fā)生的次數(shù)。

入門指南

在這篇博客中,我們探討了基于感知的TAMP、GPU加速的TAMP,以及用于機(jī)器人操作的基于仿真的優(yōu)化框架。我們分析了傳統(tǒng)TAMP中常見(jiàn)的挑戰(zhàn),并介紹了這些研究工作為應(yīng)對(duì)這些挑戰(zhàn)所提出的方法與思路。

本文是NVIDIA 機(jī)器人研發(fā)摘要(R2D2)系列的一部分,旨在幫助開(kāi)發(fā)者深入了解NVIDIA Research在物理 AI 與機(jī)器人應(yīng)用領(lǐng)域的最新突破。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31084

    瀏覽量

    222316
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5594

    瀏覽量

    109778
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135503
  • 仿真
    +關(guān)注

    關(guān)注

    54

    文章

    4485

    瀏覽量

    138302

原文標(biāo)題:R2D2:基于感知引導(dǎo)的多步驟精細(xì)操作任務(wù)與運(yùn)動(dòng)規(guī)劃

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    運(yùn)動(dòng)控制速度規(guī)劃

    電機(jī)控制速度規(guī)劃運(yùn)動(dòng)控制的一大關(guān)鍵點(diǎn)。這里提供一個(gè)討論話題的平臺(tái),大家可以在這里分享自己的心得!有啥關(guān)于速度好的想法,或者覺(jué)得有意思的資料可以發(fā)到這里,大家分享!
    發(fā)表于 09-04 11:38

    做個(gè)任務(wù)規(guī)劃大師來(lái)幫你!

    `這是我在Instructable上的第一個(gè)創(chuàng)客項(xiàng)目,名字叫做任務(wù)規(guī)劃大師。我相信許多人對(duì)智能手機(jī)是又愛(ài)又恨,它們每天都能給我們帶來(lái)新鮮,但其過(guò)量的信息又會(huì)讓我們感覺(jué)喘不過(guò)氣來(lái)。再加上許多人
    發(fā)表于 12-17 15:50

    什么是運(yùn)動(dòng)控制系統(tǒng)?運(yùn)動(dòng)控制系統(tǒng)的任務(wù)是什么?

    什么是運(yùn)動(dòng)控制系統(tǒng)?運(yùn)動(dòng)控制系統(tǒng)的任務(wù)是什么?
    發(fā)表于 10-29 07:40

    近距輕掃和運(yùn)動(dòng)感知視頻展示雷達(dá)IC應(yīng)用

    、運(yùn)動(dòng)感知和人體存在感知等功能。我們收集到方案商應(yīng)用場(chǎng)景視頻,分享給大家,給予設(shè)計(jì)靈感啟發(fā)。 還有應(yīng)用案例: 運(yùn)動(dòng)感知:浴室鏡子,接近就可亮燈,0.8—1.2m的距離可調(diào),人體一直存在輕微的動(dòng)作,鏡子
    發(fā)表于 11-16 14:31

    分布式多步驟入侵場(chǎng)景建模及其抽象描述

    本文從入侵檢測(cè)的角度提出了一種完全非集中方式,將分布式多步驟入侵場(chǎng)景建模為分布于被保護(hù)網(wǎng)絡(luò)系統(tǒng)中多個(gè)節(jié)點(diǎn)上的檢測(cè)子任務(wù)序列。本文基于巴科斯范式對(duì)分布式多步驟
    發(fā)表于 09-03 08:57 ?8次下載

    如何使用壓縮感知進(jìn)行移動(dòng)群智感知任務(wù)分發(fā)機(jī)制的資料說(shuō)明

    針對(duì)移動(dòng)群智 感知任務(wù)中區(qū)域全覆蓋感知成本過(guò)高問(wèn)題,提出基于壓縮感知的移動(dòng)群智感知任務(wù)分發(fā)(CS
    發(fā)表于 03-28 11:29 ?5次下載
    如何使用壓縮<b class='flag-5'>感知</b>進(jìn)行移動(dòng)群智<b class='flag-5'>感知</b><b class='flag-5'>任務(wù)</b>分發(fā)機(jī)制的資料說(shuō)明

    如何使用壓縮感知實(shí)現(xiàn)移動(dòng)群智感知任務(wù)分發(fā)機(jī)制的資料說(shuō)明

    針對(duì)移動(dòng)群智感知任務(wù)中區(qū)域全覆蓋感知成本過(guò)高問(wèn)題,提出基于壓縮感知的移動(dòng)群智感知任務(wù)分發(fā)(CS-
    發(fā)表于 10-24 11:25 ?3次下載
    如何使用壓縮<b class='flag-5'>感知</b>實(shí)現(xiàn)移動(dòng)群智<b class='flag-5'>感知</b><b class='flag-5'>任務(wù)</b>分發(fā)機(jī)制的資料說(shuō)明

    如何使用壓縮感知實(shí)現(xiàn)移動(dòng)群智感知任務(wù)分發(fā)機(jī)制

    針對(duì)移動(dòng)群智感知任務(wù)中區(qū)域全覆蓋感知成本過(guò)高問(wèn)題,提出基于壓縮感知的移動(dòng)群智感知任務(wù)分發(fā)(CS-
    發(fā)表于 01-26 11:53 ?17次下載
    如何使用壓縮<b class='flag-5'>感知</b>實(shí)現(xiàn)移動(dòng)群智<b class='flag-5'>感知</b><b class='flag-5'>任務(wù)</b>分發(fā)機(jī)制

    鋅合金壓鑄機(jī)主機(jī)操作方法和步驟

    鋅合金壓鑄機(jī)的操作方式分為兩種,手動(dòng)和自動(dòng),今天我們來(lái)說(shuō)一下壓鑄機(jī)手動(dòng)操作的方法和步驟:開(kāi)機(jī),起壓,調(diào)模運(yùn)動(dòng),鎖模運(yùn)動(dòng),開(kāi)模
    的頭像 發(fā)表于 03-17 17:16 ?6954次閱讀

    STM32實(shí)現(xiàn)多步進(jìn)電機(jī)的加減速運(yùn)動(dòng)控制

    目標(biāo): 1、指定簡(jiǎn)單的電機(jī)控制協(xié)議,支持通過(guò)串口通訊對(duì)多步進(jìn)電機(jī)進(jìn)行運(yùn)動(dòng)控制 2、支持詳細(xì)參數(shù)輸入的運(yùn)動(dòng)控制模式:控制方向、轉(zhuǎn)速、加減速率、細(xì)分等 3、支持位置控制模式,按照協(xié)議格式,輸入電機(jī)編號(hào)和位置,對(duì)多電機(jī)進(jìn)行控制
    發(fā)表于 03-23 10:23 ?11次下載
    STM32實(shí)現(xiàn)<b class='flag-5'>多步</b>進(jìn)電機(jī)的加減速<b class='flag-5'>運(yùn)動(dòng)</b>控制

    自動(dòng)駕駛綜述之定位、感知、規(guī)劃常見(jiàn)算法匯總

    自駕車自動(dòng)駕駛系統(tǒng)的體系結(jié)構(gòu)一般分為感知系統(tǒng)和決策系統(tǒng)。感知系統(tǒng)一般分為許多子系統(tǒng),負(fù)責(zé)自動(dòng)駕駛汽車定位、靜態(tài) 障礙物測(cè)繪、移動(dòng)障礙物檢測(cè)與跟蹤、道路測(cè)繪、交通信號(hào)檢測(cè)與識(shí)別等任務(wù)。決策系統(tǒng)通常被劃分為許多子系統(tǒng),負(fù)責(zé)諸如
    發(fā)表于 06-02 16:11 ?0次下載
    自動(dòng)駕駛綜述之定位、<b class='flag-5'>感知</b>、<b class='flag-5'>規(guī)劃</b>常見(jiàn)算法匯總

    基于邊界點(diǎn)優(yōu)化和多步路徑規(guī)劃的機(jī)器人自主探索策略

    機(jī)器人對(duì)未知環(huán)境的自主探索是機(jī)器人智能化的關(guān)鍵技術(shù)。為了提高搜索效率,作者提出了一種基于邊界點(diǎn)優(yōu)化和多步路徑規(guī)劃的搜索策略。他們主要對(duì)邊界點(diǎn)優(yōu)化、邊界點(diǎn)選擇、路徑規(guī)劃三個(gè)方面對(duì)路徑規(guī)劃
    的頭像 發(fā)表于 06-19 10:19 ?2661次閱讀
    基于邊界點(diǎn)優(yōu)化和<b class='flag-5'>多步</b>路徑<b class='flag-5'>規(guī)劃</b>的機(jī)器人自主探索策略

    基于感知質(zhì)量的無(wú)人機(jī)ActiveSLAM解決方案

    在對(duì)于基于視覺(jué)的狀態(tài)估計(jì)中,攝像機(jī)的運(yùn)動(dòng)對(duì)估計(jì)精度有重要影響。因此,在規(guī)劃無(wú)人機(jī)的運(yùn)動(dòng)時(shí),既要考慮以上的任務(wù),又要考慮感知質(zhì)量。
    發(fā)表于 07-01 09:56 ?1484次閱讀
    基于<b class='flag-5'>感知</b>質(zhì)量的無(wú)人機(jī)ActiveSLAM解決方案

    倒閘操作的基本步驟

    一、正常情況倒閘操作的基本步驟 1、接受任務(wù) 當(dāng)系統(tǒng)調(diào)度員下達(dá)操作任務(wù)時(shí),操作前,預(yù)先用電話或傳
    的頭像 發(fā)表于 09-22 11:35 ?1.3w次閱讀

    無(wú)引導(dǎo)線的左轉(zhuǎn)場(chǎng)景下,自動(dòng)駕駛?cè)绾?b class='flag-5'>規(guī)劃軌跡?

    對(duì)于很多新手司機(jī)來(lái)說(shuō),在無(wú)引導(dǎo)線左轉(zhuǎn)的場(chǎng)景中,開(kāi)車會(huì)非常謹(jǐn)慎,但依舊會(huì)很好地處理好這一操作。但對(duì)于自動(dòng)駕駛汽車來(lái)說(shuō),其行駛需要有較為明顯的參考線,在沒(méi)有白色虛線、沒(méi)有箭頭感知“我的車道在哪兒”的交通
    的頭像 發(fā)表于 09-18 09:12 ?760次閱讀
    無(wú)<b class='flag-5'>引導(dǎo)</b>線的左轉(zhuǎn)場(chǎng)景下,自動(dòng)駕駛?cè)绾?b class='flag-5'>規(guī)劃</b>軌跡?