chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

人工智能玩家發(fā)明自己的“語言”,合作“交流”以贏得紙牌游戲

IEEE電氣電子工程師 ? 來源:lp ? 2019-03-10 11:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機器正變得越來越具有協(xié)作性,其中既包括機器與人的協(xié)作也包括機器與機器之間的協(xié)作。不久之后,我們可能就會有能協(xié)商通行權的自動駕駛汽車,以及協(xié)助護士進行家庭護理的機器人。但首先,它們需要學會交流,而且不僅僅是通過言語交流。人類用他們的行動說了很多。踩剎車不僅會讓你減速,還預示著前方可能有麻煩。雙臂交叉在胸前既可以保護你,又傳達出沉默的信號。

為了教會人工智能AI)進行交流,研究人員轉向了紙牌游戲。雖然人工智能很久以前就在國際象棋、圍棋、某些形式的撲克和許多電子游戲中擊敗了人類,但橋牌和花火(Hanabi)等游戲提供了一些特殊的挑戰(zhàn)。玩家必須在沒有明確的信息共享方式的情況下進行合作(例如打出對方需要你打出的牌)。研究這兩款游戲的研究人員最近開發(fā)了一些人工智能系統(tǒng),這些系統(tǒng)發(fā)明了自己的隱式代碼來協(xié)調它們的動作。

在橋牌比賽中,有四名選手,分成兩隊。在任何人出牌之前,玩家可以輪流叫牌。用選定的作為將牌的花色叫牌來表明你認為你的團隊可以贏某個墩數(shù)。多年來,橋牌玩家們已經(jīng)開發(fā)出了很多能同時讓隊友知道自己手里有什么排的叫牌方法。例如,一個人可能叫“兩個梅花”(即使他沒有梅花)來表示自己手里有很多花牌(J、Q、K)。通過這樣編碼過的叫牌,團隊可以進行基本的對話。

倫敦大學學院(University College London)的研究人員最近在預印本文庫arXiv上發(fā)表了一篇標題為“Learning to Communicate Implicitly By Actions”的論文。在他們的名為“策略-信念-迭代”(Policy - Belief - Iteration,簡稱P-BIT)的系統(tǒng)中,每個AI玩家都有兩個神經(jīng)網(wǎng)絡。一個網(wǎng)絡學習根據(jù)叫牌來推斷隊友手里有什么牌。另一個學習根據(jù)對隊友手里有的牌的推斷和自己手里的牌來做出恰當?shù)慕信?。在訓練過程中,AI玩家會因為自己的叫牌提高了隊友所做推斷(推斷自己手里有什么牌)的準確性而得到獎勵。

在經(jīng)過150萬手的練習之后,這對AI搭檔已經(jīng)發(fā)展出了它們自己的約定,比如用叫一種花色的三張牌的方式來表明這種花色的六張牌可能是一個理想的定約。這對AI玩家擊敗了沒有進行交流或對它們隊友的信念進行建模的基線AI玩家。該論文的作者之一、倫敦大學學院的計算機科學家Jun Wang表示,這些AI玩家還無法與人類玩家相比,但他發(fā)現(xiàn)初步結果“是非常鼓舞人心的”。

一款名為花火(Hanabi)的新型紙牌游戲也具有類似的交流挑戰(zhàn)。在這款需要合作的類單人紙牌游戲中,兩到五名玩家每人各持有四到五張牌,每張牌都具有一種顏色并帶有一個數(shù)字,玩家需要輪流將它們按正確的順序放到彩色的紙牌堆上。但他們看不到自己的牌,只能看到隊友的牌。

在每個回合中,他們可以出一張牌、丟棄一張牌,或者給另一位玩家一個提示。他們不能告訴對方可以出哪張牌,而是只能說對方手中的哪些牌是某種顏色的或是帶有某個數(shù)字的。在某些情況下,指出隊友手中的某張牌的顏色,可能是向隊友示意他接下來應該打出這一張牌。信息不僅可以來自顯性線索本身(牌的顏色),還可以來自為什么選擇該線索而不是其他線索的隱性內容。

最近,DeepMind Technologies和牛津大學的一個團隊在arXiv上發(fā)表了一篇標題為“Bayesian Action Decoder for Deep Multi-Agent Reinforcement Learning”的論文。論文中介紹了一個針對雙人版本花火游戲的機器學習系統(tǒng)。他們的“貝葉斯動作解碼器”(Bayesian Action Decoder,簡稱BAD)也使用神經(jīng)網(wǎng)絡,讓每個人工智能玩家嘗試推斷其隊友的信念。為了避免無限遞歸地思考你的隊友在思考你在思考什么,這個系統(tǒng)兩個玩家外部創(chuàng)建了一套“公共信念”。

這些公共信念代表了有關游戲狀態(tài)和之前動作的所有公開可用信息,以及在沒有實際查看其中任何一手的情況下可能說的關于所有手的話。然后,“公共代理人”使用神經(jīng)網(wǎng)絡將這些信念轉換為關于每個玩家應該做什么以及他們的隊友手中可能拿著怎樣的牌的指示。然后,每個玩家在公共代理的指導下,根據(jù)自己的觀察,采取行動。

盡管這些人工智能玩家并沒有因為交流而獲得特別的獎勵,但打信號卻產(chǎn)生了另外的作用。例如,指出紅牌或黃牌意味著AI隊友應該打出最近抽到的牌。研究人員計算出,通過暗示分享的信息中有40%是隱性的。這種編碼通信幫助他們的系統(tǒng)近乎完美地運行,平均得分為24分(滿分25分),比之前最好的機器人高出約1分。(對于人類來說,即使有使用肢體語言的不公平優(yōu)勢,得分超過20分就是不錯的。)

這兩個系統(tǒng),即用于橋梁的P-BIT和用于Hanabi的BAD,都依賴于給予人工智能的一些東西,比如人的“心理理論”,或者對他人的信念和意圖的認知。這種推理在人際交往中普遍存在。如果你問你的朋友他的婚姻狀況,而他把話題轉到紐約大都會隊,那么他的話就不僅說明了關于大都會隊的一些情況,也說明了他的婚姻狀況。

為了讓AI能夠高效、優(yōu)雅地處理與人之間或彼此之間的互動,它們需要理解隱性信號,而紙牌游戲是實現(xiàn)目標的途徑之一。一家名為NukkAI的創(chuàng)業(yè)公司專注于為橋牌打造更好的人工智能,并且正籌集了數(shù)百萬美元,期望最終將其技術應用于現(xiàn)實世界的問題。在最近的一篇標題為“The Hanabi Challenge: A New Frontier for AI Research”論文中,DeepMind稱花火為“人工智能研究的一個新前沿”,并提供了一個開源測試平臺。

盡管DeepMind的BAD系統(tǒng)通過反復與同一隊友玩游戲來制定出約定,但他們在上面那篇論文中指出,更高級的任務將是對不熟悉的玩家的行為進行動態(tài)推理。他們在這個場景下測試了一些系統(tǒng),而沒有一個系統(tǒng)的平均得分超過4分。

研究機器人和通信的康奈爾大學計算機科學家Julia Proft也強調了即時推理的重要性。她最近發(fā)現(xiàn),當AI花火玩家使用隱性信號時,它們更有可能被判斷為是人類玩家。這一發(fā)現(xiàn)發(fā)表在標題為“Implicit Communication of Actionable Information in Human-AI teams”的論文中。在談到關于習得約定的論文時,她說:“他們做的事情真酷?!钡旨由弦痪湔f,“有趣的問題”是來自上下文的自發(fā)推理。

不過,牛津大學的計算機科學家、DeepMind那兩篇論文的合著者Jakob Foerster說:“我并不認為我們有可信的方法來開始考慮自發(fā)推理需要什么。說實話,我們離去考慮那個問題還相當遠?!?/p>

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4825

    瀏覽量

    106755
  • AI
    AI
    +關注

    關注

    89

    文章

    38030

    瀏覽量

    296097
  • 人工智能
    +關注

    關注

    1813

    文章

    49713

    瀏覽量

    261293
  • 機器
    +關注

    關注

    0

    文章

    795

    瀏覽量

    41771

原文標題:人工智能玩家發(fā)明自己的“語言”,合作“交流”以贏得紙牌游戲

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    深蘭科技攜手共探人工智能發(fā)展趨勢與合作機會

    2025年11月17日,位于上海張江科學城的深蘭科技總部迎來兩批來訪交流團,分別為茅臺股份工會會員參訪團與重慶九龍坡區(qū)民營企業(yè)家代表團。本次交流展廳參觀與專題分享相結合的形式開展,圍繞人工智
    的頭像 發(fā)表于 11-20 15:27 ?420次閱讀

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文中,我們將介紹這對開發(fā)人員意味著什么,以及使用 Neuton 模型如何改進您的開發(fā)和終端
    發(fā)表于 08-31 20:54

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    家人們,最近在研究人工智能相關設備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實驗箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學,便捷拉滿 這個實驗箱真的是為使用者
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    家人們,最近在研究人工智能相關設備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實驗箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學,便捷拉滿 這個實驗箱真的是為使用者
    發(fā)表于 08-07 14:23

    美泰與OpenAI聯(lián)手,共探生成式AI智能玩具新領域

    電子發(fā)燒友網(wǎng)綜合報道 近期,全球知名玩具制造商美泰(Mattel)宣布與人工智能公司OpenAI達成戰(zhàn)略合作,計劃共同開發(fā)基于生成式AI的智能玩具。這是OpenAI首次涉足玩具制造領域,也是美泰在數(shù)
    發(fā)表于 08-05 07:04 ?1812次閱讀

    思必馳出席2025面向東盟的婦女發(fā)展交流合作論壇

    近日,為紀念北京世界婦女大會召開30周年,充分展示中國-東盟婦女友好交流合作成果,“賦能 共享 創(chuàng)新 人工智能與婦女發(fā)展”為主題的2025面向東盟的婦女發(fā)展
    的頭像 發(fā)表于 07-31 17:38 ?697次閱讀

    最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發(fā)展的當下,無論是探索未來職業(yè)方向,還是更新技術儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學術研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺,加速企業(yè)人工智能應用

    -Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺,加速企業(yè)人工智能應用 Cognizant將在關鍵增長領域提供解決方案,包括企業(yè)級AI智能體、定制化行業(yè)大型
    的頭像 發(fā)表于 03-26 14:42 ?571次閱讀
    Cognizant將與NVIDIA<b class='flag-5'>合作</b>部署神經(jīng)<b class='flag-5'>人工智能</b>平臺,加速企業(yè)<b class='flag-5'>人工智能</b>應用

    虹科亮相第六屆粵港澳機器人與人工智能大會

    日前,第六屆粵港澳機器人與人工智能大會在廣州番禺開幕。本次大會「聚焦人工智能與產(chǎn)業(yè)發(fā)展」為主題,旨在推動粵港澳大灣區(qū)機器人與人工智能領域的技術創(chuàng)新、產(chǎn)業(yè)升級和
    的頭像 發(fā)表于 03-10 16:37 ?885次閱讀

    成都華微與具身科技深化人工智能和機器人領域合作

    近日,成都華微與四川具身人形機器人科技有限公司(具身科技)在成都高新區(qū)四川人工智能實驗室展開會談,雙方圍繞機器人智慧大腦與精密控制兩大關鍵核心方向展開交流,在芯片層面達成深度合作意向,攜手開啟
    的頭像 發(fā)表于 02-28 16:58 ?937次閱讀

    Stellantis與Mistral AI深化人工智能合作

    近日,Stellantis宣布與Mistral AI進一步擴大人工智能戰(zhàn)略合作伙伴關系,旨在將人工智能技術深度整合到車輛工程、車內體驗等多個關鍵領域,共同推動汽車行業(yè)的智能化發(fā)展。
    的頭像 發(fā)表于 02-11 15:50 ?648次閱讀

    我國生成式人工智能的發(fā)展現(xiàn)狀與趨勢

    作為信息化、數(shù)字化、智能化的新型技術基座,生成式人工智能對于提升國家戰(zhàn)略地位與國際競爭力具有重要意義。2022年11月以來,隨著ChatGPT為代表的大語言模型迅速發(fā)展,生成式
    的頭像 發(fā)表于 02-08 11:31 ?2084次閱讀

    Meta與UNESCO合作推動多語言AI發(fā)展

    Meta最近宣布了一項與聯(lián)合國教科文組織(UNESCO)合作的全新計劃——語言技術伙伴計劃。該計劃旨在收集多種語言的語音錄音和文字記錄,推動未來開放可用的
    的頭像 發(fā)表于 02-08 11:04 ?887次閱讀

    人工智能推理及神經(jīng)處理的未來

    人工智能行業(yè)所圍繞的是一個受技術進步、社會需求和監(jiān)管政策影響的動態(tài)環(huán)境。機器學習、自然語言處理和計算機視覺方面的技術進步,加速了人工智能的發(fā)展和應用。包括醫(yī)療保健、金融和制造業(yè)在內的各個行業(yè)對自動化
    的頭像 發(fā)表于 12-23 11:18 ?865次閱讀
    <b class='flag-5'>人工智能</b>推理及神經(jīng)處理的未來

    成都華微與觀想科技共探人工智能領域合作

    近日,成都華微電子科技股份有限公司(以下簡稱“成都華微”)與觀想科技在成都華微總部舉行了一場關于人工智能相關產(chǎn)品開發(fā)的座談交流會。雙方就當前人工智能領域的發(fā)展趨勢、技術挑戰(zhàn)以及未來合作
    的頭像 發(fā)表于 12-14 16:40 ?1462次閱讀