chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于感知引導(dǎo)的多步驟精細操作任務(wù)與運動規(guī)劃

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2025-11-14 10:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

傳統(tǒng)的任務(wù)與運動規(guī)劃(TAMP)系統(tǒng)在機器人操作應(yīng)用中通常依賴靜態(tài)模型運行,因此在面對新環(huán)境時往往表現(xiàn)不佳。將感知與操作相融合,是應(yīng)對這一挑戰(zhàn)的有效途徑,使機器人能夠在執(zhí)行過程中實時更新規(guī)劃,從而適應(yīng)動態(tài)變化的場景。

在本期NVIDIA 機器人研發(fā)摘要 (R2D2)中,我們探討了如何利用基于感知的 TAMP 以及 GPU 加速的 TAMP 實現(xiàn)遠程操作。同時,我們將介紹用于提升機器人操作能力的框架,并展示如何結(jié)合視覺與語言信息,將像素轉(zhuǎn)化為子目標(biāo)、任務(wù)負載以及可微分的約束條件。

子目標(biāo)是較小的階段性目標(biāo),能夠引導(dǎo)機器人逐步達成最終目標(biāo)。

Affordance 根據(jù)物體或環(huán)境的屬性及其所處的上下文,描述機器人可在其上執(zhí)行的動作。例如,手柄可被“抓取”,按鈕可被“按壓”,杯子可被“傾倒”。

在機器人運動規(guī)劃中,可微分約束用于確保機器人的運動滿足物理限制,如關(guān)節(jié)角度范圍、避障要求或末端執(zhí)行器的位置精度,同時仍支持通過學(xué)習(xí)進行調(diào)整。由于這些約束具備可微性,GPU 能夠在訓(xùn)練或?qū)崟r規(guī)劃過程中高效地計算并優(yōu)化它們。

任務(wù)與運動規(guī)劃如何將視覺與語言信息轉(zhuǎn)化為機器人的具體動作

TAMP 涉及確定機器人應(yīng)執(zhí)行的任務(wù)以及實現(xiàn)這些任務(wù)所需的移動方式,需要將高層任務(wù)規(guī)劃(即執(zhí)行什么任務(wù))與底層運動規(guī)劃(即如何移動以完成任務(wù))相結(jié)合。

現(xiàn)代機器人能夠結(jié)合視覺與語言信息(如圖像和指令),將復(fù)雜任務(wù)分解為若干較小的步驟,即子目標(biāo)。這些子目標(biāo)有助于機器人明確下一步應(yīng)執(zhí)行的動作、需要交互的對象以及如何實現(xiàn)安全移動。

該過程利用高級模型將圖像和書面指令轉(zhuǎn)化為機器人可在現(xiàn)實世界中執(zhí)行的清晰計劃。遠程操作需要具備結(jié)構(gòu)化意圖,且依賴規(guī)劃人員的有效參與。接下來,我們將探討 OWL-TAMP、VLM-TAMP 和 NOD-TAMP 如何助力解決這一問題:

OWL-TAMP:該工作流使機器人能夠執(zhí)行以自然語言描述的復(fù)雜、長視距操作任務(wù),例如“將橙色物體放到桌子上”。OWL-TAMP 是一種混合式工作流,將視覺語言模型(VLM)與任務(wù)與運動規(guī)劃(TAMP)相結(jié)合。其中,VLM 根據(jù)開放世界語言(OWL)指令生成約束條件,描述機器人動作空間中的操作要求。這些約束被整合進 TAMP 系統(tǒng),并通過仿真反饋機制驗證其物理可行性和執(zhí)行正確性。

VLM-TAMP:這是一種面向視覺信息豐富環(huán)境的機器人多步驟任務(wù)規(guī)劃工作流。VLM-TAMP 將視覺語言模型與傳統(tǒng) TAMP 框架融合,能夠在現(xiàn)實場景中生成并優(yōu)化高層行動計劃。該方法利用 VLM 解析圖像內(nèi)容,并結(jié)合任務(wù)指令(如“做一鍋雞湯”)生成初步的高級任務(wù)規(guī)劃。隨后,通過仿真驗證和運動規(guī)劃進行迭代優(yōu)化,以確保每一步操作的可行性。在涉及 30 至 50 個連續(xù)動作、并操作多達 21 個不同物體的長視距廚房任務(wù)中,該混合方法的表現(xiàn)優(yōu)于純 VLM 或純 TAMP 的基準(zhǔn)方案。該工作流使機器人能夠綜合利用視覺與語言上下文信息,有效應(yīng)對任務(wù)描述中的模糊性,從而提升在復(fù)雜操作任務(wù)中的整體性能。

wKgZO2kWkZiADtASAAQ2Yv4Ml1c035.png

圖1展示了VLM-TAMP如何克服單獨使用TAMP或僅依賴VLM進行任務(wù)與運動規(guī)劃在解決長視距機器人操作問題時所面臨的局限性。

NOD-TAMP: 傳統(tǒng)的TAMP框架在處理長視距操作任務(wù)時通常難以實現(xiàn)泛化,因其依賴于顯式的幾何模型和對象表示。NOD-TAMP通過引入神經(jīng)對象描述符(NOD)來提升對不同對象類型的泛化能力。NOD是一種基于3D激光點云學(xué)習(xí)得到的表示形式,能夠編碼物體的空間特征與關(guān)系屬性。該方法使機器人能夠與新對象有效交互,并支持規(guī)劃器進行動態(tài)的操作調(diào)整。

cuTAMP 如何利用 GPU 并行化加速機器人規(guī)劃

經(jīng)典 TAMP 首先分析任務(wù)的動作結(jié)構(gòu)(稱為計劃骨架),再求解相應(yīng)的連續(xù)變量。第二步通常是系統(tǒng)的計算瓶頸,而cuTAMP顯著加速了這一過程。對于cuTAMP中給定的計劃骨架,系統(tǒng)會采樣數(shù)千個初始解(粒子),隨后在 GPU 上執(zhí)行可微分的批量優(yōu)化,以滿足多種約束條件,例如逆運動學(xué)、避障、穩(wěn)定性以及目標(biāo)函數(shù)成本。

如果框架不可行,算法會進行回溯;如果可行,則會生成一個計劃。對于受限的打包或堆疊任務(wù),該過程通常在幾秒鐘內(nèi)完成,使機器人能夠在幾秒內(nèi)找到包裝、堆疊或操作多個物體的解決方案,而無需花費幾分鐘甚至幾小時。

“矢量化滿意度”是實現(xiàn)在現(xiàn)實應(yīng)用場景中長期解決問題的關(guān)鍵。

wKgZO2kWkamAMiGUAAG2JdpaDF8651.png

圖2展示了cuTAMP如何將TAMP幀化為一種回溯式的雙層搜索,以優(yōu)化計劃骨架。

機器人如何利用Stein變分推斷從故障中學(xué)習(xí)

長距操作模型在面對訓(xùn)練過程中未曾遇到的新條件時,可能會出現(xiàn)失效。Fail2Progress是一種使機器人能夠從自身失敗中學(xué)習(xí)并持續(xù)改進操作能力的框架。該框架通過數(shù)據(jù)驅(qū)動的校正與基于仿真的優(yōu)化,將實際發(fā)生的故障整合進技能模型中。為了增強模型的魯棒性,F(xiàn)ail2Progress 利用 Stein 變分推斷生成與觀測到的故障相似的定向合成數(shù)據(jù)集,從而有效提升模型對異常情況的適應(yīng)能力。

然后,這些生成的數(shù)據(jù)集可用于微調(diào)并重新調(diào)整技能效果模型,從而降低長視野任務(wù)中相同故障重復(fù)發(fā)生的次數(shù)。

入門指南

在這篇博客中,我們探討了基于感知的TAMP、GPU加速的TAMP,以及用于機器人操作的基于仿真的優(yōu)化框架。我們分析了傳統(tǒng)TAMP中常見的挑戰(zhàn),并介紹了這些研究工作為應(yīng)對這些挑戰(zhàn)所提出的方法與思路。

本文是NVIDIA 機器人研發(fā)摘要(R2D2)系列的一部分,旨在幫助開發(fā)者深入了解NVIDIA Research在物理 AI 與機器人應(yīng)用領(lǐng)域的最新突破。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    30446

    瀏覽量

    218937
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5472

    瀏覽量

    108870
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5070

    瀏覽量

    134202
  • 仿真
    +關(guān)注

    關(guān)注

    52

    文章

    4383

    瀏覽量

    137561

原文標(biāo)題:R2D2:基于感知引導(dǎo)的多步驟精細操作任務(wù)與運動規(guī)劃

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    運動控制速度規(guī)劃

    電機控制速度規(guī)劃運動控制的一大關(guān)鍵點。這里提供一個討論話題的平臺,大家可以在這里分享自己的心得!有啥關(guān)于速度好的想法,或者覺得有意思的資料可以發(fā)到這里,大家分享!
    發(fā)表于 09-04 11:38

    做個任務(wù)規(guī)劃大師來幫你!

    `這是我在Instructable上的第一個創(chuàng)客項目,名字叫做任務(wù)規(guī)劃大師。我相信許多人對智能手機是又愛又恨,它們每天都能給我們帶來新鮮,但其過量的信息又會讓我們感覺喘不過氣來。再加上許多人
    發(fā)表于 12-17 15:50

    什么是運動控制系統(tǒng)?運動控制系統(tǒng)的任務(wù)是什么?

    什么是運動控制系統(tǒng)?運動控制系統(tǒng)的任務(wù)是什么?
    發(fā)表于 10-29 07:40

    近距輕掃和運動感知視頻展示雷達IC應(yīng)用

    、運動感知和人體存在感知等功能。我們收集到方案商應(yīng)用場景視頻,分享給大家,給予設(shè)計靈感啟發(fā)。 還有應(yīng)用案例: 運動感知:浴室鏡子,接近就可亮燈,0.8—1.2m的距離可調(diào),人體一直存在輕微的動作,鏡子
    發(fā)表于 11-16 14:31

    分布式多步驟入侵場景建模及其抽象描述

    本文從入侵檢測的角度提出了一種完全非集中方式,將分布式多步驟入侵場景建模為分布于被保護網(wǎng)絡(luò)系統(tǒng)中多個節(jié)點上的檢測子任務(wù)序列。本文基于巴科斯范式對分布式多步驟
    發(fā)表于 09-03 08:57 ?8次下載

    如何使用壓縮感知進行移動群智感知任務(wù)分發(fā)機制的資料說明

    針對移動群智 感知任務(wù)中區(qū)域全覆蓋感知成本過高問題,提出基于壓縮感知的移動群智感知任務(wù)分發(fā)(CS
    發(fā)表于 03-28 11:29 ?5次下載
    如何使用壓縮<b class='flag-5'>感知</b>進行移動群智<b class='flag-5'>感知</b><b class='flag-5'>任務(wù)</b>分發(fā)機制的資料說明

    如何使用壓縮感知實現(xiàn)移動群智感知任務(wù)分發(fā)機制的資料說明

    針對移動群智感知任務(wù)中區(qū)域全覆蓋感知成本過高問題,提出基于壓縮感知的移動群智感知任務(wù)分發(fā)(CS-
    發(fā)表于 10-24 11:25 ?3次下載
    如何使用壓縮<b class='flag-5'>感知</b>實現(xiàn)移動群智<b class='flag-5'>感知</b><b class='flag-5'>任務(wù)</b>分發(fā)機制的資料說明

    如何使用壓縮感知實現(xiàn)移動群智感知任務(wù)分發(fā)機制

    針對移動群智感知任務(wù)中區(qū)域全覆蓋感知成本過高問題,提出基于壓縮感知的移動群智感知任務(wù)分發(fā)(CS-
    發(fā)表于 01-26 11:53 ?17次下載
    如何使用壓縮<b class='flag-5'>感知</b>實現(xiàn)移動群智<b class='flag-5'>感知</b><b class='flag-5'>任務(wù)</b>分發(fā)機制

    鋅合金壓鑄機主機操作方法和步驟

    鋅合金壓鑄機的操作方式分為兩種,手動和自動,今天我們來說一下壓鑄機手動操作的方法和步驟:開機,起壓,調(diào)模運動,鎖模運動,開模
    的頭像 發(fā)表于 03-17 17:16 ?6450次閱讀

    STM32實現(xiàn)多步進電機的加減速運動控制

    目標(biāo): 1、指定簡單的電機控制協(xié)議,支持通過串口通訊對多步進電機進行運動控制 2、支持詳細參數(shù)輸入的運動控制模式:控制方向、轉(zhuǎn)速、加減速率、細分等 3、支持位置控制模式,按照協(xié)議格式,輸入電機編號和位置,對多電機進行控制
    發(fā)表于 03-23 10:23 ?11次下載
    STM32實現(xiàn)<b class='flag-5'>多步</b>進電機的加減速<b class='flag-5'>運動</b>控制

    自動駕駛綜述之定位、感知、規(guī)劃常見算法匯總

    自駕車自動駕駛系統(tǒng)的體系結(jié)構(gòu)一般分為感知系統(tǒng)和決策系統(tǒng)。感知系統(tǒng)一般分為許多子系統(tǒng),負責(zé)自動駕駛汽車定位、靜態(tài) 障礙物測繪、移動障礙物檢測與跟蹤、道路測繪、交通信號檢測與識別等任務(wù)。決策系統(tǒng)通常被劃分為許多子系統(tǒng),負責(zé)諸如
    發(fā)表于 06-02 16:11 ?0次下載
    自動駕駛綜述之定位、<b class='flag-5'>感知</b>、<b class='flag-5'>規(guī)劃</b>常見算法匯總

    基于邊界點優(yōu)化和多步路徑規(guī)劃的機器人自主探索策略

    機器人對未知環(huán)境的自主探索是機器人智能化的關(guān)鍵技術(shù)。為了提高搜索效率,作者提出了一種基于邊界點優(yōu)化和多步路徑規(guī)劃的搜索策略。他們主要對邊界點優(yōu)化、邊界點選擇、路徑規(guī)劃三個方面對路徑規(guī)劃
    的頭像 發(fā)表于 06-19 10:19 ?2264次閱讀
    基于邊界點優(yōu)化和<b class='flag-5'>多步</b>路徑<b class='flag-5'>規(guī)劃</b>的機器人自主探索策略

    基于感知質(zhì)量的無人機ActiveSLAM解決方案

    在對于基于視覺的狀態(tài)估計中,攝像機的運動對估計精度有重要影響。因此,在規(guī)劃無人機的運動時,既要考慮以上的任務(wù),又要考慮感知質(zhì)量。
    發(fā)表于 07-01 09:56 ?1347次閱讀
    基于<b class='flag-5'>感知</b>質(zhì)量的無人機ActiveSLAM解決方案

    倒閘操作的基本步驟

    一、正常情況倒閘操作的基本步驟 1、接受任務(wù) 當(dāng)系統(tǒng)調(diào)度員下達操作任務(wù)時,操作前,預(yù)先用電話或傳
    的頭像 發(fā)表于 09-22 11:35 ?1.1w次閱讀

    引導(dǎo)線的左轉(zhuǎn)場景下,自動駕駛?cè)绾?b class='flag-5'>規(guī)劃軌跡?

    對于很多新手司機來說,在無引導(dǎo)線左轉(zhuǎn)的場景中,開車會非常謹慎,但依舊會很好地處理好這一操作。但對于自動駕駛汽車來說,其行駛需要有較為明顯的參考線,在沒有白色虛線、沒有箭頭感知“我的車道在哪兒”的交通
    的頭像 發(fā)表于 09-18 09:12 ?366次閱讀
    無<b class='flag-5'>引導(dǎo)</b>線的左轉(zhuǎn)場景下,自動駕駛?cè)绾?b class='flag-5'>規(guī)劃</b>軌跡?