通常機(jī)器人在執(zhí)行任務(wù)的時(shí)候,我們需要給它輸入一串指令,即使是強(qiáng)大的波士頓機(jī)器狗也需要通過編程讓其學(xué)會(huì)開門等動(dòng)作,然而英偉達(dá)最近研發(fā)出一項(xiàng)新技術(shù),只需要機(jī)器人觀看人類演示動(dòng)作,機(jī)器人就可以模仿。這究竟是一種什么技術(shù)?
工業(yè)機(jī)器人通常都是一遍又一遍地重復(fù)已經(jīng)編程好的任務(wù),換句話說,執(zhí)行任務(wù)的機(jī)器人與編寫程序的工程師之間會(huì)保持一定的安全距離。然而,越來越多的研究人員都在思考一個(gè)問題,如何讓機(jī)器人與人類的工作環(huán)境更加融合,甚至如何讓機(jī)器人向人類學(xué)習(xí)。
這也是英偉達(dá)在西雅圖的新機(jī)器人實(shí)驗(yàn)室所關(guān)注的。據(jù)了解,該實(shí)驗(yàn)室的研發(fā)團(tuán)隊(duì)在澳大利亞布里斯班舉辦的機(jī)器人與自動(dòng)化國際會(huì)議(ICRA)上展示了一些他們正在進(jìn)行的關(guān)于機(jī)器人教學(xué)的研究。
Nvidia展示了一款具有突破性AI機(jī)器人,通過觀察人類的行為學(xué)習(xí)完成任務(wù)。由Stan Birchfield和Jonathan Tremblay領(lǐng)導(dǎo)的研究人員在他們的研究報(bào)告(微信后臺(tái)回復(fù):英偉達(dá),下載完整論文)中指出:
“通過發(fā)出指令讓機(jī)器人在真實(shí)環(huán)境中執(zhí)行任務(wù)很容易, 這包括輸入期望的結(jié)果和實(shí)現(xiàn)該結(jié)果的最佳方式的任何提示。我們研究出了只需通過人為演示,任務(wù)以視覺的形式傳達(dá)給機(jī)器人,并提供關(guān)于如何最好地執(zhí)行任務(wù)的線索,讓機(jī)器人來重復(fù)人類的動(dòng)作。”
他們提出了一個(gè)可以讀取真實(shí)世界的人類演示動(dòng)作的系統(tǒng),并可以完成推斷和執(zhí)行動(dòng)作。該系統(tǒng)由一系列神經(jīng)網(wǎng)絡(luò)組成,包括執(zhí)行感知,程序生成和程序執(zhí)行三部分。即使在嚴(yán)重遮擋的情況下,感知網(wǎng)絡(luò)也可以使用隨機(jī)域?qū)铣蓤D像進(jìn)行訓(xùn)練,可靠地檢測實(shí)際圖像中物體。
在這項(xiàng)研究中,人類主要堆疊不同顏色的立方體,把他堆成垂直或金字塔形狀。通過一系列神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)人類可讀的程序,由機(jī)器人執(zhí)行以重現(xiàn)演示。
首先,研究人員訓(xùn)練了一系列的神經(jīng)網(wǎng)絡(luò)來檢測積木,推斷積木之間的幾何關(guān)系,然后生成一個(gè)程序讓它反復(fù)觀察人類的每個(gè)動(dòng)作。研究人員稱,這個(gè)新系統(tǒng)能讓他們訓(xùn)練機(jī)器人在現(xiàn)實(shí)世界中只通過一次演示來就可以完成這個(gè)堆疊任務(wù)。
為了訓(xùn)練出核心模型,英偉達(dá)團(tuán)隊(duì)還使用了模擬環(huán)境來合成無數(shù)的場景數(shù)據(jù)。Birchfield和Fox強(qiáng)調(diào)表示,這些模擬可以快速地訓(xùn)練機(jī)器人。畢竟,在現(xiàn)實(shí)世界中進(jìn)行培訓(xùn)需要更長的時(shí)間,而且還會(huì)出現(xiàn)危險(xiǎn)。對(duì)于大多數(shù)任務(wù)來講,也沒有可提前參考的培訓(xùn)數(shù)據(jù)。
Nvidia的這臺(tái)機(jī)器人由該公司的TITAN X顯卡支持,該顯卡擁有3584個(gè)運(yùn)行頻率為1.5GHz的NVIDIA CUDA內(nèi)核,整體性能達(dá)到11 TFLOPS。
使用TITAN X,研究人員訓(xùn)練了一系列神經(jīng)網(wǎng)絡(luò)來執(zhí)行與感知,程序生成和程序執(zhí)行相關(guān)的職責(zé)。從單一的人類演示中,機(jī)器人可以開始學(xué)著執(zhí)行任務(wù)。
英偉達(dá)首席研究科學(xué)家斯坦·伯奇菲爾德(Stan Birchfield)表示:“在制造業(yè)環(huán)境中,機(jī)器人非常擅長于反復(fù)執(zhí)行相同的任務(wù),但它們無法適應(yīng)環(huán)境的變化,這導(dǎo)致它們無法學(xué)會(huì)自己的任務(wù)。為了重新設(shè)計(jì)機(jī)器人來執(zhí)行新任務(wù),你必須讓專家對(duì)機(jī)器人的底層進(jìn)行重新編程。我們感興趣的是,讓非專家型用戶更方便地通過簡單演示來教會(huì)機(jī)器人從事新任務(wù)?!?/p>
這個(gè)系統(tǒng)中存在一系列深度神經(jīng)網(wǎng)絡(luò),用于感知、規(guī)劃和控制,這些網(wǎng)絡(luò)使用合成的數(shù)據(jù)來訓(xùn)練。
伯奇維爾德表示:“目前,機(jī)器人領(lǐng)域正在出現(xiàn)范式改變?,F(xiàn)在,我們可以使用GPU(圖形處理單元)來生成無限量的預(yù)加標(biāo)簽數(shù)據(jù),用于開發(fā)和測試算法。這可能會(huì)幫助我們開發(fā)與周圍世界互動(dòng)的機(jī)器人系統(tǒng),并且規(guī)模更大、更安全?!?/p>
英偉達(dá)的這項(xiàng)研究發(fā)表在本周在澳大利亞布里斯班舉行的國際機(jī)器人和自動(dòng)化會(huì)議(ICRA)上。
未來,如果這一技術(shù)發(fā)展成熟,是否可以應(yīng)用在自動(dòng)駕駛上,通過觀察人類駕駛行為,機(jī)器人能夠熟練操作方向盤,實(shí)現(xiàn)自動(dòng)駕駛就更進(jìn)一步。當(dāng)然這只是作者的想象,或許這一技術(shù)有更多其他方面的應(yīng)用。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103630 -
工業(yè)機(jī)器人
+關(guān)注
關(guān)注
91文章
3457瀏覽量
94152 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3953瀏覽量
93791
原文標(biāo)題:英偉達(dá)新技術(shù):機(jī)器人只需觀察人類動(dòng)作,就能瞬間模仿
文章出處:【微信號(hào):IV_Technology,微信公眾號(hào):智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論