德?lián)浔徽J(rèn)為是難度遠(yuǎn)超其他游戲的人工智能挑戰(zhàn)項(xiàng)目。然而CMU和Facebook聯(lián)合打造的AI賭神Pluribus,訓(xùn)練成本150美元、8天訓(xùn)練時(shí)間即吊打職業(yè)選手,每小時(shí)贏1000美元!如此強(qiáng)悍的AI是如何煉成的?要研究其算法該如何入手?
人們發(fā)現(xiàn)規(guī)則明確的游戲,即使像星際這樣戰(zhàn)局多變的即時(shí)戰(zhàn)略游戲,人類也無法戰(zhàn)勝擁有碾壓性算力優(yōu)勢的計(jì)算機(jī)。于是有人寄希望于帶有運(yùn)氣成分、需要大量心里戰(zhàn)的***。
*** (Texas hold'em,有時(shí)也簡稱為Hold'em或Holdem),簡稱德?lián)?,是世界上最流行的公牌撲克衍生游戲,也是國際撲克比賽的正式競賽項(xiàng)目之一。***是位置順序影響最大的撲克衍生游戲之一,因?yàn)樗休啍?shù)的下注次序維持不變。它也是美國多數(shù)***內(nèi)最受歡迎的撲克牌類游戲,在美國以外的地區(qū)也十分流行,理論上一桌同時(shí)最多可容納22位(若不銷牌則為23位)牌手,但一般是二至十人一桌。ht***.wikipedia.org/wiki/%E5%BE%B7%E5%B7%9E%E6%92%B2%E5%85%8B
賭神下凡:1小時(shí)贏7000塊,一周煉成百萬富翁
撲克是典型的不完美信息博弈游戲。***中,玩家無法獲知已發(fā)生事件的全部信息,一對一無限注中包含10^160個(gè)決策點(diǎn)(decision points)。
每個(gè)點(diǎn)需要根據(jù)出牌方的理解,產(chǎn)生不同的路徑。這種不完整信息的特質(zhì),使得***成為難度遠(yuǎn)超其他游戲的人工智能挑戰(zhàn)項(xiàng)目。
然而,其實(shí)結(jié)局早就在暗中被注定了。40年來,科學(xué)家就一直沒有停止過對德州的研究。
10年前,計(jì)算機(jī)第一次在有限制的***游戲中,戰(zhàn)勝了人類頂級選手;4年前,來自加拿大阿爾伯塔大學(xué)的研究團(tuán)隊(duì)開發(fā)出Cepheus(仙王座),一個(gè)號(hào)稱人類無法戰(zhàn)勝的撲克機(jī)器人;2年前,也就是2017年,加拿大和捷克的科學(xué)家在arXiv上發(fā)表論文,提出名為DeepStack的算法,稱可以讓人工智能在比賽中擁有“直覺”。
而前兩天,在CMU科學(xué)家的努力下,人工智能已經(jīng)在六人無限注德?lián)浔荣惿蠐魯∷腥祟愴敿馔婕?。只存在于電影電視劇中的賭神,現(xiàn)在真實(shí)的存在于現(xiàn)實(shí)世界了!
-
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7841瀏覽量
93462 -
人工智能
+關(guān)注
關(guān)注
1820文章
50325瀏覽量
266951
原文標(biāo)題:1小時(shí)贏1000美元的AI賭神是怎樣煉成的?幕后團(tuán)隊(duì)在線答疑
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
旋極星源入選2026成都硬科技企業(yè)撲克牌榜單
云知聲斬獲2025全國人工智能應(yīng)用場景典型案例
《人工智能應(yīng)用開發(fā)-中級(大模型)》認(rèn)證證書含金量如何?怎么考?
嵌入式系統(tǒng)中的人工智能
傲琪人工合成石墨片: 破解智能手機(jī)散熱困境的創(chuàng)新解決方案
利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能
挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器
挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!
關(guān)于人工智能處理器的11個(gè)誤解
德州撲克牌被認(rèn)為是難度遠(yuǎn)超其他游戲的人工智能挑戰(zhàn)項(xiàng)目
評論