目前,機(jī)器人在受控的環(huán)境中能夠有出色的表現(xiàn),但在面對(duì)現(xiàn)實(shí)世界任務(wù)時(shí),仍難以應(yīng)對(duì)其中的不可預(yù)測(cè)性、操作靈活性和細(xì)微的交互需求,例如組裝精密組件或是以接近人類的精度操控日常物體。
機(jī)器人學(xué)習(xí)已成為彌合實(shí)驗(yàn)室演示與現(xiàn)實(shí)世界部署之間差距的關(guān)鍵推動(dòng)力。
本期NVIDIA 機(jī)器人研究與開(kāi)發(fā)摘要 (R2D2)將探討 NVIDIA 研究中心在 CoRL 2025 上展示的三項(xiàng)突破性的神經(jīng)網(wǎng)絡(luò)創(chuàng)新研究,這些研究正在重塑機(jī)器人的學(xué)習(xí)與適應(yīng)方式:
NeRD(神經(jīng)機(jī)器人動(dòng)力學(xué)模型):通過(guò)具備跨任務(wù)泛化能力的學(xué)習(xí)型動(dòng)力學(xué)模型增強(qiáng)仿真效果,同時(shí)支持在真實(shí)環(huán)境中對(duì)模型微調(diào)。
Dexplore:將動(dòng)作捕捉演示數(shù)據(jù)作為自適應(yīng)引導(dǎo)信息,幫助機(jī)器人實(shí)現(xiàn)人類級(jí)別的靈巧操作能力。
VT-Refine:融合視覺(jué)感知與觸覺(jué)傳感技術(shù),通過(guò)創(chuàng)新的“真實(shí)—仿真—真實(shí)”(real-to-sim-to-real)訓(xùn)練流程,使機(jī)器人熟練掌握高精度雙手協(xié)同裝配任務(wù)。
通過(guò)神經(jīng)仿真推動(dòng)機(jī)器人學(xué)習(xí):現(xiàn)代機(jī)器人普遍具有高自由度和復(fù)雜的機(jī)械結(jié)構(gòu),傳統(tǒng)仿真器難以準(zhǔn)確捕捉其復(fù)雜性。神經(jīng)模型能夠高效預(yù)測(cè)復(fù)雜的動(dòng)力學(xué)行為,并適應(yīng)現(xiàn)實(shí)世界的數(shù)據(jù),有助于應(yīng)對(duì)這一挑戰(zhàn)。
NeRD 是經(jīng)過(guò)學(xué)習(xí)的動(dòng)力學(xué)模型,能夠預(yù)測(cè)特定機(jī)器人(或稱鉸接剛體系統(tǒng))在接觸約束下的未來(lái)狀態(tài)。該模型能夠替代分析仿真器中的低層動(dòng)力學(xué)與接觸求解器,從而構(gòu)建一種混合仿真預(yù)測(cè)框架。NeRD 可輕松集成到現(xiàn)有的鉸接剛體仿真框架中,可作為Newton等物理引擎的無(wú)縫接入后端。

NeRD 可以高效預(yù)測(cè)復(fù)雜的動(dòng)力學(xué)行為并適應(yīng)真實(shí)世界的數(shù)據(jù)
從人類運(yùn)動(dòng)中學(xué)習(xí)靈巧技能:機(jī)器人的手部通常自由度較低且驅(qū)動(dòng)、感知與控制能力有限,這使得機(jī)器人難以有效地從人類操作中學(xué)習(xí)靈巧的操作技能。
手與物體動(dòng)作捕捉(MoCap)存儲(chǔ)庫(kù)提供了豐富的接觸密集操作的人類演示,但它們難以直接用于機(jī)器人的策略學(xué)習(xí)。
本研究提出了參考范圍探索(RSE),一種統(tǒng)一的單循環(huán)優(yōu)化方法。它融合了重定向與跟蹤功能,能夠直接利用運(yùn)動(dòng)捕捉(MoCap)數(shù)據(jù)來(lái)訓(xùn)練可擴(kuò)展的機(jī)器人控制策略。這種做法不僅保留了演示的意圖,并使機(jī)器人能夠自主探索與其自身形態(tài)相契合的動(dòng)作。

從人類演示中學(xué)習(xí)靈巧操作,首先使用RSE訓(xùn)練一個(gè)基于狀態(tài)的模仿控制策略,進(jìn)而探索機(jī)器人專屬的操作策略
視覺(jué)與觸覺(jué)相結(jié)合,實(shí)現(xiàn)雙手協(xié)同裝配:基于擴(kuò)散策略的行為克隆方法面臨兩大局限,即在現(xiàn)實(shí)世界中,演示數(shù)據(jù)有限,且數(shù)據(jù)采集接口的觸覺(jué)反饋也較為有限。
為解決這一數(shù)據(jù)難題,VT-Refine 開(kāi)發(fā)了一種創(chuàng)新的“真實(shí)—仿真—真實(shí)”框架。該框架融合了仿真、視覺(jué)與觸覺(jué)信息,可有效應(yīng)對(duì)雙手協(xié)同裝配任務(wù)中的挑戰(zhàn)。

VT-Refine 是一種創(chuàng)新的視覺(jué)觸覺(jué)策略學(xué)習(xí)框架,適用于高精確、接觸密集型的雙手協(xié)同裝配任務(wù)
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
31109瀏覽量
222398 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4838瀏覽量
107864 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5598瀏覽量
109810
原文標(biāo)題:R2D2:NVIDIA 研究中心的三項(xiàng)神經(jīng)學(xué)突破重塑機(jī)器人學(xué)習(xí)
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
神經(jīng)網(wǎng)絡(luò)的初步認(rèn)識(shí)
NMSIS神經(jīng)網(wǎng)絡(luò)庫(kù)使用介紹
NVIDIA開(kāi)源物理引擎與OpenUSD加速機(jī)器人學(xué)習(xí)
NVIDIA 發(fā)布三大利器,推動(dòng)人形機(jī)器人邁向新紀(jì)元
NVIDIA Isaac Lab多GPU多節(jié)點(diǎn)訓(xùn)練指南
如何在機(jī)器視覺(jué)中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)
NVIDIA展示機(jī)器人領(lǐng)域的研究成果
NVIDIA Isaac Lab可用環(huán)境與強(qiáng)化學(xué)習(xí)腳本使用指南
通過(guò)NVIDIA Cosmos模型增強(qiáng)機(jī)器人學(xué)習(xí)
NVIDIA Isaac Sim和Isaac Lab現(xiàn)已推出早期開(kāi)發(fā)者預(yù)覽版
無(wú)刷電機(jī)小波神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)子位置檢測(cè)方法的研究
神經(jīng)網(wǎng)絡(luò)RAS在異步電機(jī)轉(zhuǎn)速估計(jì)中的仿真研究
NVIDIA Isaac Sim與NVIDIA Isaac Lab的更新
NVIDIA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)渲染技術(shù)的突破性增強(qiáng)功能
深度解讀英偉達(dá)Newton機(jī)器人平臺(tái):技術(shù)革新與跨界生態(tài)構(gòu)建
NVIDIA神經(jīng)網(wǎng)絡(luò)創(chuàng)新研究重塑機(jī)器人學(xué)習(xí)
評(píng)論