chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

繼OpenAI發(fā)布Dota2的團戰(zhàn)AI后,DeepMind今天也發(fā)布了自家的最新研究

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-07-08 09:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

編者按:繼OpenAI發(fā)布Dota2的團戰(zhàn)AI后,DeepMind今天也發(fā)布了自家的最新研究,一些可以互相協(xié)作,也可以和人類選手合作的人工智能機器人。以下是論智對DeepMind博文的編譯。

在游戲項目中,讓AI掌握策略、理解戰(zhàn)術(shù)并進行團隊合作是非常重要的?,F(xiàn)在的強化學(xué)習(xí)經(jīng)過發(fā)展,我們的智能體在《雷神之錘III:競技場》的奪旗比賽(Capture the Flag)中的表現(xiàn)達到了人類水平,它們在團隊合作方面展示出了較高水準。

《雷神之錘III:競技場》的奪旗模式(CTF)是一款以第一人稱視角展示的多人游戲,參賽者分成兩組,紅隊和藍隊。每組隊員的目標是奪取對方的旗幟并將它帶回自己的基地,同時保護己方旗幟。殺死對手得1分,自己非正常死亡扣1分,奪取對方旗子得3分,殺死奪旗者得2分,重新拿到己方旗子得1分,成功奪取一次旗子(將旗子送回己方基地)得5分。五分鐘內(nèi)有較多旗子的一方獲勝。

我們訓(xùn)練的四個智能體在室內(nèi)和室外兩種環(huán)境下進行對戰(zhàn),并逐漸修煉到能夠奪旗的水平

對人類來說,每個個體都有自己的目標和行動方式,但我們?nèi)匀荒茉趫F隊和組織中展示出集體智慧,我們將這一設(shè)置稱為“多智能體學(xué)習(xí)”:多個智能體必須獨立行動,但是要學(xué)習(xí)與其他智能體交互合作。這個問題非常困難,因為環(huán)境是在不斷變化的。

為了研究這一問題,我們以各類3D第一人稱視角的電子游戲為研究對象,它們代表了大多數(shù)游戲的形式,能反映各類玩家的策略,因為其中包括了他們對游戲的理解、手眼配合以及團隊計劃。我們的智能體所面臨的挑戰(zhàn)是直接從原始像素中學(xué)習(xí),從而輸出動作。

實驗中我們選用的《雷神之錘III:競技場》游戲是現(xiàn)在許多第一人稱角色游戲的基礎(chǔ),我們訓(xùn)練智能體像單人一樣學(xué)習(xí)和行動,但是仍要在團隊間進行合作,共同對抗敵方。

從一個多智能體的角度,CTF需要玩家既能和隊友完美合作,也要與敵人對抗,不論在什么風(fēng)格下都要保持水平的穩(wěn)定。

為了讓這一過程更有趣,我們還設(shè)計了一個CTF的變體,其中的平面地圖每一場都不一樣。結(jié)果我們的智能體被迫學(xué)習(xí)到了一種“通用策略”,而非靠對地圖的記憶獲勝。除此之外,為了評估游戲場地,我們的智能體用人類的方式感受了一下CTF的環(huán)境:它們通過一個虛擬游戲控制器觀察一連串的像素圖像和動作。

CTF的環(huán)境不斷更新,所以智能體必須適應(yīng)陌生地圖

我們的智能體必須從零開始學(xué)習(xí)在陌生環(huán)境中如何觀察地形、行動、合作、競爭,這一切都要從每場比賽的單一強化信號中得來:不論它們所在隊伍是否獲勝。這是一個具有挑戰(zhàn)性的學(xué)習(xí)問題,而解決方法基于三個強化學(xué)習(xí)的基本問題:

與訓(xùn)練單一智能體相反,我們訓(xùn)練的是多個智能體,它們通過與各種隊友和對手的互動來學(xué)習(xí)。

團隊里的每個智能體都從它自己的內(nèi)部獎勵信號中學(xué)習(xí),從而讓智能體生成自己內(nèi)部的目標,例如獲得一面旗幟。兩階段的優(yōu)化過程優(yōu)化了智能體內(nèi)部的獎勵,同時用內(nèi)部獎勵的強化學(xué)習(xí)學(xué)習(xí)了智能體的策略。

智能體會在快慢兩種速度下進行訓(xùn)練,這樣會提高他們利用內(nèi)存并生成連續(xù)動作的能力。

最終訓(xùn)練出的智能體(FTW)在玩CTF上表現(xiàn)出了很高的水準。重要的是,該智能體在各種地圖、隊員數(shù)量的情況下,表現(xiàn)得都很穩(wěn)定。不論是在戶外模式還是室內(nèi)模式,或者有人類參與的比賽中,F(xiàn)TW都表現(xiàn)的很好。

我們組織了一場聯(lián)賽,其中有40名人類玩家,將人類和智能體隨機組合分配到游戲中。

FTW智能體學(xué)習(xí)之后比基準的方法更強大,同時超過了人類選手的取勝率。事實上,在對參賽者的評估上,智能體的合作能力比人類更強。

智能體在訓(xùn)練時的表現(xiàn)與人類的對比

理解智能體的內(nèi)部機制

為了了解智能體是如何表示游戲狀態(tài)的,我們查看了智能體神經(jīng)網(wǎng)絡(luò)的活動形式。下面的圖表展示了游戲過程中的情形,其中密密麻麻的點根據(jù)CTF在游戲中的狀態(tài)分成不同的顏色,根據(jù)顏色可以判斷:智能體在哪個房間?旗子的狀態(tài)如何?能看到哪個隊友或?qū)κ??通過觀察顏色相同的點,我們發(fā)現(xiàn)在相似狀態(tài)的智能體動作也相似。

各色點點代表游戲中各種智能體所處的狀態(tài)和位置

我們不會告訴智能體游戲的規(guī)則,而是讓他們自己學(xué)習(xí)基礎(chǔ)概念。事實上,我們可以找到具體編碼有重要游戲狀態(tài)的神經(jīng)元,比如當旗子被奪走時活動的神經(jīng)元,或者隊友拿到旗時活動的神經(jīng)元。想知道更多智能體細節(jié),可查看原論文。

除了這些多樣的表示,智能體實際上是怎樣運作的?首先,我們注意到智能體的反應(yīng)時間很快,并且還有精確的標記器。但是當人為地降低他們的精度和反應(yīng)時間,我們看到導(dǎo)致成功的只有一個因素。

智能體的精確度和反應(yīng)時間比人類要高

通過無監(jiān)督學(xué)習(xí)我們創(chuàng)建了智能體的原始動作,發(fā)現(xiàn)智能體實際上是在模仿人類行為,例如跟隨隊友或者在對手的基地“安營扎寨”。這些動作都是在訓(xùn)練中通過強化學(xué)習(xí)和進化得來的。

結(jié)語

最近人工智能在星際爭霸II和Dota 2這樣復(fù)雜的游戲中都取得了不小的進步,雖然這一項目的側(cè)重點在于“奪旗”游戲,但是做出的貢獻是通用的,研究人員表示,他們很高興看到其他研究者在不同環(huán)境中應(yīng)用這一技術(shù)。在未來,他們將對目前的強化學(xué)習(xí)和基于多個智能體的訓(xùn)練方法進行改進??偟膩碚f,這項工作突出了多智能體訓(xùn)練的潛力,有助于它們與人類的合作。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    29748

    瀏覽量

    212964
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    307

    瀏覽量

    11081
  • DeepMind
    +關(guān)注

    關(guān)注

    0

    文章

    131

    瀏覽量

    11585

原文標題:不論隊友是機器人還是人類,DeepMind智能體學(xué)會了復(fù)雜合作

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    DotA2》同時在線人數(shù)首次突破100萬,全民打年獸?

    早在2015年22日,Steam同時在線人數(shù)最高曾超過840萬名PC玩家。當時根據(jù)Steam統(tǒng)計,當時《DotA2》是玩的人最多的游戲,其次是《CS:GO》,《軍團要塞2》,《足球經(jīng)
    發(fā)表于 02-26 15:06

    未來的AI 深挖谷歌 DeepMind 和它背后的技術(shù)

    哪些了解?今天就來看一下有關(guān)Google DeepMind的一切吧!Google DeepMind的歷史DeepMind Technologies于2010年在倫敦成立,但是4年
    發(fā)表于 08-26 12:04

    全志科技正式發(fā)布首款AI語音專用芯片R329

    3月18日消息,推出智能語音專用處理器R328之后,近日全志科技正式發(fā)布主打AI語音專用的重磅產(chǎn)品R329,這是全志科技首款搭載Arm中國全新AI處理單元(AIPU)的高算力、低功耗
    發(fā)表于 11-23 14:18

    人工智能OpenAI打敗Dota2 玩家,人工智能DeepMind又在雷神之錘3超越人類水準

    根據(jù)介紹,DeepMind使用了強化學(xué)習(xí)(reinforced learning)來促進AI學(xué)習(xí)游玩精簡版《雷神之錘3:競技場》多人奪旗模式。這些機器人們已經(jīng)通過“內(nèi)戰(zhàn)”游玩了45萬場多人模式,每
    發(fā)表于 07-11 10:50 ?1729次閱讀

    AI對于人類的競爭性和輔助性

    近日,OpenAI的團隊在5V5的對戰(zhàn)中戰(zhàn)勝了Dota2的頂尖業(yè)余玩家,這是Alpha Go大戰(zhàn)柯潔之后,AI再一次戰(zhàn)勝人類的歷史性時刻。此次參與到
    發(fā)表于 07-05 05:10 ?638次閱讀

    AI在簡化了的DOTA2擊敗前1%玩家,學(xué)習(xí)能力很出色

    ”、沒有隱身裝備、沒有召喚單位和幻象、以及少了一些裝備等。這也使整個比賽簡化了不少,從另一個角度看AI仍然沒能力完全加入人類版的DOTA2游戲中。
    發(fā)表于 06-29 19:39 ?717次閱讀

    AI能相互協(xié)作的玩游戲,玩Dota2戰(zhàn)勝了人類玩家

    據(jù)悉,OpenAI開發(fā)了出了一套名為“OpenAI Five”的算法,雖然單獨來看這種算法并沒有什么突破,只是針對玩Dota2的一種神經(jīng)網(wǎng)絡(luò),并且此前曾有
    發(fā)表于 06-27 05:29 ?767次閱讀

    OpenAI的由5個神經(jīng)網(wǎng)絡(luò)組成的OpenAI Five,已經(jīng)開始擊敗Dota 2的業(yè)余玩家隊伍

    Dota游戲是一個典型的AI難題,它綜合決策周期長,空間大而且敵我雙方是在非完全信息下博弈。OpenAI去年解決1v1的問題
    的頭像 發(fā)表于 06-27 12:01 ?9052次閱讀

    AI首度在電競游戲《DOTA 2》擊敗人類

    經(jīng)過又一年的努力,OpenAI表示,他們已經(jīng)成功制作一款能夠在《DOTA 2》中以「團體戰(zhàn)」形式,擊敗五名頂尖業(yè)余玩家的AI軟體「
    的頭像 發(fā)表于 06-29 15:16 ?3291次閱讀

    Dota2敗給OpenAI-Five究竟是為什么?

    OpenAI昨日發(fā)布研究成果,宣布Dota2 5v5在限定條件下(英雄陣容固定,部分道具和功能禁用)戰(zhàn)勝人類半職業(yè)選手。本文主要對其模型技術(shù)架構(gòu)做一些分析總結(jié)。
    的頭像 發(fā)表于 07-05 16:17 ?5113次閱讀

    AI之間能團隊合作嗎?AI團隊挑戰(zhàn)Dota2職業(yè)選手團隊

    近日,馬斯克和Sam Altman所創(chuàng)立的人工智能非營利組織OpenAI宣布:其開發(fā)的AI能夠組隊在5V5對戰(zhàn)中戰(zhàn)勝Dota2頂尖業(yè)余玩家,這些人類玩家的平均天梯分數(shù)超過4200分。這
    的頭像 發(fā)表于 07-17 11:51 ?3715次閱讀

    5個AI隊伍竟然可以在《Dota2》戰(zhàn)勝人類5人隊伍

    之前AI在中單solo打敗知名選手Dendi的事情過了很久了,同團隊開發(fā)的5個神經(jīng)網(wǎng)絡(luò)AI隊伍已經(jīng)能在《Dota2》中戰(zhàn)勝業(yè)余的人類5人隊伍。
    的頭像 發(fā)表于 07-25 11:18 ?3328次閱讀

    最后一戰(zhàn) AI 2:0吊打世界冠軍DOTA2 人類完敗

    “最終之戰(zhàn)”人類完敗!DOTA2 AI 2:0吊打世界冠軍賽后,OG 隊長 N0tail 在接受采訪時表示,“AI 的表現(xiàn)超乎想象,它雖然在插眼等方面還有待進步,買活的時機
    發(fā)表于 07-05 10:09 ?1096次閱讀

    人工智能戰(zhàn)隊OpenAI戰(zhàn)Dota2人類最強戰(zhàn)隊的最終決戰(zhàn)

    人工智能戰(zhàn)隊OpenAI戰(zhàn)Dota2人類最強戰(zhàn)隊,人工智能在圍棋上擊敗人類之后,很多技術(shù)人員就開始展望 AI 在視頻游戲中的表現(xiàn)。201
    發(fā)表于 07-04 11:09 ?1595次閱讀

    AI如何對抗Dota人類游戲高手

    AI如何對抗Dota人類游戲高手?OpenAI這樣回答
    的頭像 發(fā)表于 08-01 15:01 ?849次閱讀