搭積木可不簡單。
除了訓(xùn)練小朋友的整體項目意識,這也是一個視覺、觸覺、交互和策略都需要上線的游戲。而在眾多的搭積木游戲中,“疊疊樂”可能是其中最有趣,難度也最高的一種。
疊疊樂,又名疊疊高,也叫疊疊木,是一款經(jīng)典的木制益智積木玩具。
游戲規(guī)則看似很簡單,從下方的積木中,抽一根往上搭。但是游戲過程極度考驗?zāi)托院妥灾屏Α?/p>
這個游戲手殘黨反正是玩不了,手腳不是太靈活的小伙伴,也放棄吧。
但是,這個游戲?qū)IT團隊研發(fā)的機器人來說,輕而易舉~
它是怎么做到的呢?
首先,在硬件方面,需要一個軟齒夾鉗、一個力傳感腕帶以及一個外部攝像頭,這些部件是用于觀察和感應(yīng)積木塔以及積木的。
其次,當(dāng)機器人小心地推動一塊積木時,計算機利用外部攝像頭和力傳感腕帶分別接收視覺和觸覺反饋,然后與機器人先前做出的動作進行比較。
在此過程中還需考慮了不同動作可能產(chǎn)生的結(jié)果——具體來說就是能否用特定的力度,抽出特定位置的積木放在塔頂并確保積木塔不倒。機器人會實時 “學(xué)習(xí)”是否繼續(xù)推動這塊積木來防止積木塔倒塌。
具體來說,與國際象棋、圍棋等更依賴認(rèn)知思維的任務(wù)或游戲不同,玩疊疊樂還需要掌握物理技巧,如試探、推、拉、放置和碼齊。
這項游戲需要交互式感知和操作,你必須去觸摸積木塔才能學(xué)會何時以及如何移動積木。
整個過程很難模擬,機器人必須和現(xiàn)實中的積木塔進行交互來學(xué)習(xí)。主要的困難是,如何利用物體和物理常識從相對較少的實驗中學(xué)習(xí)。
當(dāng)然,MIT團隊并不止步疊疊樂游戲,目前開發(fā)的觸覺學(xué)習(xí)系統(tǒng)正應(yīng)用在垃圾分類回收、組裝消費品等需要精確物理交互的任務(wù)。
相關(guān)研究細(xì)節(jié)發(fā)表在最近的《Science Robotics》期刊上。論文的第一作者是麻省理工學(xué)院的研究生Nima Fazeli。研究團隊還包括Miquel Oller,Jiajun Wu,Zheng Wu和麻省理工學(xué)院大腦和認(rèn)知科學(xué)教授Joshua Tenenbaum。
論文地址:
http://robotics.sciencemag.org/content/4/26/eaav3123
這項工作是開創(chuàng)性的,麻省理工學(xué)院機械工程系的Alberto Rodriguez評論道:“疊疊樂機器人展示了之前的機器人系統(tǒng)無法做到的事:快速學(xué)習(xí)執(zhí)行任務(wù)的最優(yōu)方法。它不僅利用常用的視覺反饋,還包括觸覺反饋和物理交互?!?/p>
例如,在手機生產(chǎn)流水線上,幾乎每一步都需要卡扣連接和螺絲固定,在這個過程中是依靠力和觸摸來判斷是否正確組裝的,而不是視覺。
而這項技術(shù)的靈魂就正是是研究人員精心構(gòu)建的學(xué)習(xí)模型。
推拉
在疊疊樂游戲中,54塊長方形積木垂直交錯堆疊成18層的積木塔,每層有三塊積木,玩家輪流抽出一塊積木放在塔頂來增加積木塔的高度,但是又不能使積木塔倒下。
想讓機器人學(xué)會玩疊疊樂,傳統(tǒng)的做法是收集積木塊、積木塔和機器人三者之間可能發(fā)生的所有交互,這需不但要耗費大量計算資源,還需要成千上萬次抽積木的操作。
Rodriguez和他的同伴從人類認(rèn)知和實際操作角度尋找到了一種更有效的數(shù)據(jù)處理方式。
這個團隊定制了一個行業(yè)標(biāo)準(zhǔn)的ABB IRB 120機械臂,在機器人能夠觸到的范圍內(nèi)搭建了一個積木塔,然后開始訓(xùn)練。機器人首先隨機選擇一塊積木和推動積木的位置,然后用較小的力試圖將積木推出塔外。
計算機則會在這個過程中記錄每次嘗試的視覺和力量數(shù)據(jù),并標(biāo)注是否成功。
這個機器人沒有進行成千上萬次的嘗試(包括多次重建積木塔),它只進行了大約300次的嘗試。把相似的數(shù)據(jù)和結(jié)果進行聚類分組,表示特定的積木行為。例如,一組數(shù)據(jù)可能表示很難移動的積木,另一組可能表示比較容易移動的積木,或者移動后積木塔會倒塌的積木。對于每一組數(shù)據(jù),開發(fā)一個簡單的模型,機器人將會基于它現(xiàn)有的視覺和觸覺數(shù)據(jù)來預(yù)測移動一塊積木的行為。
Fazeli說:“這種聚類技術(shù)受到人類認(rèn)知過程的啟發(fā),顯著提高了機器人學(xué)習(xí)游戲的效率。讓機器人建立數(shù)據(jù)集群,然后學(xué)習(xí)每個集群的模型,而不是學(xué)習(xí)一個能夠捕捉所有可能性的模型。”
堆疊
研究者用模擬器MuJoCo,在計算機模擬的疊疊樂游戲中與其他如今最先進的機器學(xué)習(xí)算法進行比試,從而了解疊疊樂機器人在現(xiàn)實世界中的學(xué)習(xí)方式。
Oller說:“我們把我們系統(tǒng)獲得的數(shù)據(jù)信息提供給這些算法,看它們是如何玩疊疊樂的。與我們的算法相比,這些算法需要搭建更大數(shù)量級的積木塔才能學(xué)會這個游戲?!?/p>
研究團隊讓疊疊樂機器人與人類志愿者進行了幾次非正式比賽。
Oller說:“我們看到積木塔倒塌之前人類能抽出幾個積木塊,我們的機器人和人類不相上下。”
但是,疊疊樂機器人在與人類玩家進行正式比賽之前還有很長的路要走。除了物理交互,疊疊樂游戲還需要一些策略,比如抽出一塊積木,既不使積木塔倒塌又能使對手很難抽出下一塊積木。
目前,研究團隊并不致力于讓機器人獲得疊疊樂冠軍,他們更想把這一新技能應(yīng)用到其他領(lǐng)域。
Rodriguez說:“我們用手完成的很多任務(wù)都是憑感覺,這種感覺來自力量和觸覺反饋,我們的算法可以完成這類任務(wù)?!?/p>
-
機器人
+關(guān)注
關(guān)注
213文章
29718瀏覽量
212759 -
攝像頭
+關(guān)注
關(guān)注
61文章
4976瀏覽量
98305 -
機械臂
+關(guān)注
關(guān)注
13文章
554瀏覽量
25370
原文標(biāo)題:有觸覺,懂策略,能交互!MIT開發(fā)出比你更靈活的搭積木大師,還發(fā)了Science子刊
文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
評論