今天,一則《Deepmind公布星際爭霸2結(jié)果:AlphaStar以10:1戰(zhàn)勝職業(yè)高手》一文,引發(fā)熱議,但是其實(shí)在兩年前,AI就與人類選手進(jìn)行過星際爭霸比賽。
2017年,世界首屆人類與星際爭霸AI對抗賽上,在接連兩位學(xué)生選手?jǐn)≡贏I手上后,韓國著名星際爭霸選手、星際四皇“司令”Stork通過四場連勝將AI打敗。他打敗的AI包括了Facebook開發(fā)的CherryPi和來自澳大利亞、挪威和韓國的AI。
而在兩年后的今天凌晨,DeepMind公布了其錄制的AI在星際爭霸2中與兩位職業(yè)選手的比賽,AlphaStar以5:0的成績戰(zhàn)勝了2018年WSC奧斯汀站的亞軍MaNa。除了此前比賽錄像的展示外,AlphaStar還與MaNa現(xiàn)場對戰(zhàn)一局,不過這局AlphaStar輸給了人類選手。
DeepMind的研究聯(lián)合負(fù)責(zé)人David Silver在賽后表示,“人工智能的歷史被打上了許多重大的標(biāo)桿性勝利的印記。我希望,未來的人們可能會回顧今天,或許會認(rèn)為這是人工智能系統(tǒng)所能做的又向前邁進(jìn)了一步?!?/p>
2013年,當(dāng)時(shí)名不見經(jīng)傳的在DeepMind發(fā)表了一篇論文,內(nèi)容是他們自己開發(fā)的AI游戲系統(tǒng)。論文中描述的計(jì)算網(wǎng)絡(luò)并不是為了游戲而服務(wù),反而是讓一個(gè)AI系統(tǒng)自己去玩游戲。神奇的是,DeepMind的游戲系統(tǒng)可以在完全沒有接觸的前提下,通過對游戲的自我學(xué)習(xí),自動的玩一系列初級電視游戲。
這個(gè)系統(tǒng)可以通過屏幕上面的圖像和游戲中的分?jǐn)?shù)是否上升下降,從而做出選擇性的動作。雖然這個(gè)行為對人來來說難度不大,但對于機(jī)器學(xué)習(xí)來說卻意義驚人。因?yàn)樗婕凹茉O(shè)任務(wù)、建立人工精神網(wǎng)絡(luò)、建立深度學(xué)習(xí)模型和完善學(xué)習(xí)過程幾個(gè)關(guān)鍵部分,并且需要大量的圖形處理單來輔助。
星際爭霸2這樣的游戲其實(shí)比棋盤類游戲更難玩。在電子游戲中,人工智能無法通過觀察每一塊棋子的移動來計(jì)算下一步棋,它們必須實(shí)時(shí)做出反應(yīng)。星際爭霸2的不可預(yù)測性遠(yuǎn)大于圍棋,玩家可以在同一時(shí)間會有300種基本動作可選擇,即使在一個(gè)84x84像素的屏幕中,也會產(chǎn)生大約1億個(gè)不同的動作,因此DeepMind要收集大量玩家的數(shù)據(jù)進(jìn)行分析。
目前DeepMind要做的是讓AI預(yù)測人類玩家下一步會做什么,AI在比賽之前僅僅數(shù)天的訓(xùn)練量,相當(dāng)于職業(yè)選手訓(xùn)練200年之長,同時(shí)在對游戲單位的操作上,AI可以避免人類選手的微操失誤,同時(shí)對未知地形進(jìn)行勘探,在應(yīng)對突發(fā)狀況時(shí),AI的會選擇最好的處理方式。還有當(dāng)人類玩家做了這些操作后要如何應(yīng)對,通過局勢判斷下一步要干什么。暴雪已經(jīng)承諾會從星際2的天梯中收集數(shù)十萬個(gè)匿名錄像幫助DeepMind訓(xùn)練,這樣可以讓AI做到序列預(yù)測和長期記憶。
AI的學(xué)習(xí)遠(yuǎn)遠(yuǎn)超過了我們的想象,無數(shù)企業(yè)也在不斷加碼人工智能,BAT、曠視科技、商湯科技、極鏈科技Video++、依圖科技這些深耕人工智能領(lǐng)域的企業(yè),也都在不斷進(jìn)行人工智能各方面的深度學(xué)習(xí)。不得不感嘆于AI在電子競技項(xiàng)目進(jìn)步的速度,人工智能下一步的目標(biāo),或許就是想向更多的專業(yè)游戲選手發(fā)出挑戰(zhàn)。從人工智能首次被提出來,到現(xiàn)在逐漸進(jìn)入我們的生活,未來的某一天,AI對于人類也將不再是一項(xiàng)觸碰不到的技術(shù)。
-
人工智能
+關(guān)注
關(guān)注
1807文章
49029瀏覽量
249584
發(fā)布評論請先 登錄
亞馬遜一年助力兩百萬人提升人工智能技能的關(guān)鍵洞察

評論