通常機(jī)器人在執(zhí)行任務(wù)的時候,我們需要給它輸入一串指令,即使是強(qiáng)大的波士頓機(jī)器狗也需要通過編程讓其學(xué)會開門等動作,然而英偉達(dá)最近研發(fā)出一項新技術(shù),只需要機(jī)器人觀看人類演示動作,機(jī)器人就可以模仿。這究竟是一種什么技術(shù)?
工業(yè)機(jī)器人通常都是一遍又一遍地重復(fù)已經(jīng)編程好的任務(wù),換句話說,執(zhí)行任務(wù)的機(jī)器人與編寫程序的工程師之間會保持一定的安全距離。然而,越來越多的研究人員都在思考一個問題,如何讓機(jī)器人與人類的工作環(huán)境更加融合,甚至如何讓機(jī)器人向人類學(xué)習(xí)。
這也是英偉達(dá)在西雅圖的新機(jī)器人實驗室所關(guān)注的。據(jù)了解,該實驗室的研發(fā)團(tuán)隊在澳大利亞布里斯班舉辦的機(jī)器人與自動化國際會議(ICRA)上展示了一些他們正在進(jìn)行的關(guān)于機(jī)器人教學(xué)的研究。
Nvidia展示了一款具有突破性AI機(jī)器人,通過觀察人類的行為學(xué)習(xí)完成任務(wù)。由Stan Birchfield和Jonathan Tremblay領(lǐng)導(dǎo)的研究人員在他們的研究報告(微信后臺回復(fù):英偉達(dá),下載完整論文)中指出:
“通過發(fā)出指令讓機(jī)器人在真實環(huán)境中執(zhí)行任務(wù)很容易, 這包括輸入期望的結(jié)果和實現(xiàn)該結(jié)果的最佳方式的任何提示。我們研究出了只需通過人為演示,任務(wù)以視覺的形式傳達(dá)給機(jī)器人,并提供關(guān)于如何最好地執(zhí)行任務(wù)的線索,讓機(jī)器人來重復(fù)人類的動作。”
他們提出了一個可以讀取真實世界的人類演示動作的系統(tǒng),并可以完成推斷和執(zhí)行動作。該系統(tǒng)由一系列神經(jīng)網(wǎng)絡(luò)組成,包括執(zhí)行感知,程序生成和程序執(zhí)行三部分。即使在嚴(yán)重遮擋的情況下,感知網(wǎng)絡(luò)也可以使用隨機(jī)域?qū)铣蓤D像進(jìn)行訓(xùn)練,可靠地檢測實際圖像中物體。
在這項研究中,人類主要堆疊不同顏色的立方體,把他堆成垂直或金字塔形狀。通過一系列神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)人類可讀的程序,由機(jī)器人執(zhí)行以重現(xiàn)演示。
首先,研究人員訓(xùn)練了一系列的神經(jīng)網(wǎng)絡(luò)來檢測積木,推斷積木之間的幾何關(guān)系,然后生成一個程序讓它反復(fù)觀察人類的每個動作。研究人員稱,這個新系統(tǒng)能讓他們訓(xùn)練機(jī)器人在現(xiàn)實世界中只通過一次演示來就可以完成這個堆疊任務(wù)。
為了訓(xùn)練出核心模型,英偉達(dá)團(tuán)隊還使用了模擬環(huán)境來合成無數(shù)的場景數(shù)據(jù)。Birchfield和Fox強(qiáng)調(diào)表示,這些模擬可以快速地訓(xùn)練機(jī)器人。畢竟,在現(xiàn)實世界中進(jìn)行培訓(xùn)需要更長的時間,而且還會出現(xiàn)危險。對于大多數(shù)任務(wù)來講,也沒有可提前參考的培訓(xùn)數(shù)據(jù)。
Nvidia的這臺機(jī)器人由該公司的TITAN X顯卡支持,該顯卡擁有3584個運(yùn)行頻率為1.5GHz的NVIDIA CUDA內(nèi)核,整體性能達(dá)到11 TFLOPS。
使用TITAN X,研究人員訓(xùn)練了一系列神經(jīng)網(wǎng)絡(luò)來執(zhí)行與感知,程序生成和程序執(zhí)行相關(guān)的職責(zé)。從單一的人類演示中,機(jī)器人可以開始學(xué)著執(zhí)行任務(wù)。
英偉達(dá)首席研究科學(xué)家斯坦·伯奇菲爾德(Stan Birchfield)表示:“在制造業(yè)環(huán)境中,機(jī)器人非常擅長于反復(fù)執(zhí)行相同的任務(wù),但它們無法適應(yīng)環(huán)境的變化,這導(dǎo)致它們無法學(xué)會自己的任務(wù)。為了重新設(shè)計機(jī)器人來執(zhí)行新任務(wù),你必須讓專家對機(jī)器人的底層進(jìn)行重新編程。我們感興趣的是,讓非專家型用戶更方便地通過簡單演示來教會機(jī)器人從事新任務(wù)?!?/p>
這個系統(tǒng)中存在一系列深度神經(jīng)網(wǎng)絡(luò),用于感知、規(guī)劃和控制,這些網(wǎng)絡(luò)使用合成的數(shù)據(jù)來訓(xùn)練。
伯奇維爾德表示:“目前,機(jī)器人領(lǐng)域正在出現(xiàn)范式改變?,F(xiàn)在,我們可以使用GPU(圖形處理單元)來生成無限量的預(yù)加標(biāo)簽數(shù)據(jù),用于開發(fā)和測試算法。這可能會幫助我們開發(fā)與周圍世界互動的機(jī)器人系統(tǒng),并且規(guī)模更大、更安全?!?/p>
英偉達(dá)的這項研究發(fā)表在本周在澳大利亞布里斯班舉行的國際機(jī)器人和自動化會議(ICRA)上。
未來,如果這一技術(shù)發(fā)展成熟,是否可以應(yīng)用在自動駕駛上,通過觀察人類駕駛行為,機(jī)器人能夠熟練操作方向盤,實現(xiàn)自動駕駛就更進(jìn)一步。當(dāng)然這只是作者的想象,或許這一技術(shù)有更多其他方面的應(yīng)用。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4819瀏覽量
106046 -
工業(yè)機(jī)器人
+關(guān)注
關(guān)注
91文章
3487瀏覽量
96534 -
英偉達(dá)
+關(guān)注
關(guān)注
23文章
4013瀏覽量
96747
原文標(biāo)題:英偉達(dá)新技術(shù):機(jī)器人只需觀察人類動作,就能瞬間模仿
文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
評論