動物們在田野上馳騁、在樹上靈巧地攀爬、在跌倒之前迅速站穩(wěn)腳跟。
和我們的靈長類表親一樣,人類也可以運(yùn)用拇指和精細(xì)的運(yùn)動技能來完成一些任務(wù),比如毫不費(fèi)力地剝開柑橘皮,或者在黑暗的走廊里尋找正確的鑰匙。
雖然行走和抓取對許多生物來說是小菜一碟,但機(jī)器人在步態(tài)移動和靈巧性方面一直不盡人意。
如今,Hwangbo等人在Science Robotics雜志上撰文,報告證明了這樣了一件有趣的事:某種機(jī)器人軟件設(shè)計方法需要數(shù)據(jù)驅(qū)動,而這種方法正好能夠克服機(jī)器人和人工智能研究領(lǐng)域中長期存在的一個挑戰(zhàn),即模擬與現(xiàn)實之間的差距。
幾十年來,機(jī)器人專家在預(yù)測性數(shù)學(xué)模型(稱為經(jīng)典控制理論)基礎(chǔ)上建立軟件,以此來引導(dǎo)機(jī)器人肢體的行動。然而,這種方法在引導(dǎo)機(jī)器人肢體完成行走、攀爬和抓取這些看似簡單的問題上卻無效。
機(jī)器人通常在模擬中開始它的生命。當(dāng)它的引導(dǎo)軟件在虛擬世界中表現(xiàn)良好時,該軟件就會被放置在機(jī)器人體內(nèi),然后隨機(jī)器人一起進(jìn)入現(xiàn)實世界。
在現(xiàn)實世界里,機(jī)器人難免會不斷地遇到難以預(yù)測的狀況,包括表面摩擦、結(jié)構(gòu)靈活性、振動、傳感器延遲以及具有時差的執(zhí)行器,一般執(zhí)行器將能量轉(zhuǎn)化為運(yùn)動指令。
不幸的是,這些狀況是不可能事先由數(shù)學(xué)運(yùn)算詳盡描述的。因此,即使是在模擬中表現(xiàn)出色的機(jī)器人,遇到一些看似微小的物理障礙后也會磕磕絆絆,甚至摔倒。
Hwangbo等人將經(jīng)典控制理論與機(jī)器學(xué)習(xí)技術(shù)相結(jié)合,研究出一種縮小類似差距的方法。
首先,該團(tuán)隊設(shè)計了一個中型四足機(jī)器人的傳統(tǒng)數(shù)學(xué)模型,名為ANYmal(如上圖)。
接下來,他們從引導(dǎo)機(jī)器人肢體運(yùn)動的執(zhí)行器中收集數(shù)據(jù)。
然后,他們將收集的數(shù)據(jù)輸入被稱為神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)系統(tǒng)中,建立第二個模型,而這個模型可以自動預(yù)測AMYmal機(jī)器人肢體的特殊運(yùn)動。
最后,該團(tuán)隊將訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)插入第一個模型中,并在標(biāo)準(zhǔn)臺式計算機(jī)上運(yùn)行混合模型。
混合模擬器比基于分析模型的模擬器速度更快,精準(zhǔn)度更高。更重要的是,機(jī)器人的運(yùn)動在混合模擬器中優(yōu)化之后,轉(zhuǎn)移進(jìn)機(jī)器人體內(nèi),并連入現(xiàn)實世界,這時,機(jī)器人在現(xiàn)實世界的行動就像在模擬器里一樣成功。
這個姍姍來遲的突破終結(jié)了看似不可逾越的模擬與現(xiàn)實鴻溝。
Hwangbo等人使用的方法還暗示了機(jī)器人領(lǐng)域的另一個重大轉(zhuǎn)變。
混合模型的出現(xiàn)是這一重大轉(zhuǎn)變的第一步。下一步將是徹底淘汰分析模型,取而代之的是機(jī)器學(xué)習(xí)模型,這種模型將由機(jī)器人在現(xiàn)實環(huán)境中所收集的數(shù)據(jù)進(jìn)行訓(xùn)練。
目前,這種稱為端到端培訓(xùn)的純數(shù)據(jù)方法發(fā)展勢頭迅猛。媒體已報道了一些創(chuàng)新的應(yīng)用,包括鉸接式機(jī)器人手臂、多指機(jī)械手、無人機(jī),甚至自動駕駛汽車。
機(jī)器人專家仍在鉆研如何強(qiáng)化計算速度、豐富傳感器數(shù)據(jù)以及提高機(jī)器學(xué)習(xí)算法質(zhì)量。目前尚不清楚大學(xué)是否應(yīng)該停止教授經(jīng)典控制理論。
然而,筆者認(rèn)為這是一個不祥之兆:未來的機(jī)器人的行走不再依賴專家,相反,他們可以利用自己身體里的數(shù)據(jù)進(jìn)行學(xué)習(xí)。
當(dāng)然,不少挑戰(zhàn)仍然存在,其中最主要的是可擴(kuò)展性的挑戰(zhàn)。
到目前為止,端到端培訓(xùn)機(jī)制僅應(yīng)用于只有少量執(zhí)行器的物理機(jī)器人之上。執(zhí)行器越少,描述機(jī)器人運(yùn)動所需的參數(shù)就越少,模型就越簡單。實現(xiàn)可擴(kuò)展性的途徑可能包括使用更多層次和模塊化的機(jī)器學(xué)習(xí)架構(gòu)。
想要知道端到端控制是否可以擴(kuò)大到引導(dǎo)擁有數(shù)十個執(zhí)行器的復(fù)雜機(jī)器,包括人形機(jī)器人,以及諸如制造工廠或智能城市(使用數(shù)字技術(shù)改善市民生活的城市地區(qū))等大型系統(tǒng),還需要做進(jìn)一步研究。
另一個挑戰(zhàn)是低技術(shù)性,高個性化。
對一些研究人員來說,從使用相對簡單的數(shù)學(xué)模型到應(yīng)用“潘多拉盒子”機(jī)器學(xué)習(xí)系統(tǒng)(其中的內(nèi)部工作原理未知)的轉(zhuǎn)變,標(biāo)志著洞察力悄然退場,失控感油然而生。對我來說,看到機(jī)器人像孩子一樣學(xué)會自己走路讓我感到心滿意足。
Hwangbo等人提出的見解也可以從心靈之謎的角度來考慮。意識一直是人類本性中最古老的謎題之一。
人類對自我意識的定義十分模糊。然而,人們對機(jī)器人軟件的研究可以讓我們深入了解關(guān)于人類思維的古老問題。
我們可以推測,自我意識以及由此延伸出來的意識,其核心是我們抽象思考自己的能力的一種表現(xiàn),即自我模仿。一個人能看得越遠(yuǎn),他對未來展望的心理圖景就越詳細(xì),自我意識能力就越強(qiáng)。
現(xiàn)在,機(jī)器人能夠?qū)W習(xí)自我模擬。這一突破不僅實用,可以減輕一些工程的負(fù)擔(dān),而且,它標(biāo)志著機(jī)器人自主時代的開始。
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
30310瀏覽量
218459 -
AI
+關(guān)注
關(guān)注
88文章
37222瀏覽量
292043
原文標(biāo)題:機(jī)器人開始自主學(xué)習(xí),是人類福祉,還是定時炸彈?
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄

機(jī)器人能夠?qū)W習(xí)自我模仿,機(jī)器人自主時代的開始了?
評論