chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenAI Five是如何訓(xùn)練的、為什么選擇打Dota以及AI在打Dota的時候在想什么?

DPVg_AI_era ? 來源:lp ? 2019-04-19 09:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在上周末徹底攻陷了Dota人類頂級職業(yè)戰(zhàn)隊OG后,OpenAI站出來介紹了OpenAIFive是如何訓(xùn)練的、為什么選擇打Dota以及AI在打Dota的時候在想什么。

OpenAIFive是第一個在電子競技游戲中擊敗世界冠軍的人工智能,在上周末與2-0大敗世界冠軍Dota2團隊OG,這是AI第一次在直播中擊敗了電子競技專家。

OG和OpenAI開發(fā)組

本次比賽還得出了兩個驚人的發(fā)現(xiàn):

盡管訓(xùn)練的時候?qū)W⒂趽魯∑渌偪?a href="http://www.brongaenegriffin.com/v/tag/1247/" target="_blank">電腦,但OpenAIFive在比賽中卻展現(xiàn)出和人類玩家的優(yōu)秀的團隊協(xié)作意識。這意味著未來的AI系統(tǒng)可以從競爭型AI轉(zhuǎn)變?yōu)楹献餍虯I

總決賽讓OpenAI的科學(xué)家可以回答一個重要的研究問題:OpenAIFive在多大程度、以何種方式能夠被確定的打???并且可能是有史以來最大規(guī)模的、人們可以有意識地與之交互的高強度深層強化學(xué)習智能體的部署

徹底攻陷了人類頂級職業(yè)玩家后,OpenAI站出來介紹了OpenAIFive是如何訓(xùn)練的、為什么選擇打Dota以及AI在打Dota的時候在想什么。

為什么選擇Dota?

OpenAIFive的初衷是為了解決現(xiàn)有深度強化學(xué)習算法無法實現(xiàn)的問題。為此需要大幅增加工具的的能力、復(fù)雜的算法思想(例如分層強化學(xué)習)。

OpenAIFive將世界視為一堆必須破譯的數(shù)字。它使用相同的通用學(xué)習代碼,無論這些數(shù)字代表Dota游戲(約20,000個數(shù)字)或機器人手(約200個)的狀態(tài)

為了構(gòu)建OpenAIFive,研究人員創(chuàng)建了一個名為Rapid的系統(tǒng),以前所未有的規(guī)模運行PPO。結(jié)果超出了研究人員最大的期望,產(chǎn)生出了世界級的Dota機器人,沒有觸及任何基本的性能限制。

當今的監(jiān)督學(xué)習算法之所以能有如此強大功能,是以大量經(jīng)驗為代價的,這在游戲或模擬環(huán)境之外是不切實際的。研究人員認為減少經(jīng)驗量是深度學(xué)習的下一個挑戰(zhàn)。

研究人員表示,從今天開始OpenAIFive將不會繼續(xù)打比賽,但取得的進步和技術(shù)的發(fā)展將繼續(xù)推動未來的工作。研究人員認為Dota對于監(jiān)督學(xué)習開發(fā)來說比現(xiàn)在使用的標準環(huán)境更具有內(nèi)在的趣味性和難度。

算力

OpenAIFive這次的勝利是由于一次重大變化:訓(xùn)練計算量增加了8倍。前期階段研究人員通過提高培訓(xùn)規(guī)模來推動進一步的發(fā)展,之后將絕大部分算力用于培訓(xùn)單一的OpenAIFive模型,相當于延長了訓(xùn)練時間。

總的來說,當前版本的OpenAIFive已經(jīng)消耗了800petaflop/s-days,并且在10個實時月內(nèi)獲得了45000年的游戲經(jīng)驗,平均每天獲得250年的模擬經(jīng)驗。OpenAIFive的總決賽版本與TI版本相比,勝率為99.9%。

遷移學(xué)習

盡管模型大小和游戲規(guī)則發(fā)生了變化,但目前版本的OpenAIFive自2018年6月以來一直在不斷訓(xùn)練。在每種情況下,研究人員都能夠?qū)⒛P娃D(zhuǎn)移并繼續(xù)培訓(xùn),這對于其他領(lǐng)域的監(jiān)督學(xué)習來說是一個開放的挑戰(zhàn)。

據(jù)悉,這可能是監(jiān)督學(xué)習智能體第一次使用如此長期的訓(xùn)練課程進行訓(xùn)練。

更多Dota英雄

研究人員看到從訓(xùn)練5個英雄到訓(xùn)練18英雄速度并沒有減弱的很明顯,于是假設(shè)對更多英雄來說也是如此,隨后開始大量嘗試整合新英雄。

研究人員花了幾個星期的時間訓(xùn)練英雄池,最多達到了25個英雄。將這些英雄帶到大約5kMMR(大約95%的Dota玩家)。盡管在進步,但學(xué)習速度還不夠快,無法在總決賽之前達到職業(yè)水平。

研究人員沒有太多時間調(diào)查原因,但他們認為可能需要更好的匹配擴展的英雄池,需要更多的訓(xùn)練時間讓新英雄達到老英雄的同等水平。想象一下當你習慣了某個英雄后,學(xué)習新英雄的難度是多么大!

協(xié)同模式

它實際上感覺很好;我的毒蛇在某些時候為我獻出了生命。他試圖幫助我,想著“我確定她知道她在做什么”然后顯然我沒有。但是,你知道,他相信我。對于[人類]隊友,我并沒有那么多.-無論如何

在總決賽期間,研究人員展示了OpenAI Five與人類一起在團隊中的表現(xiàn),兩隊的成員都是2個真人帶3個智能體

OpenAIFive與人類的協(xié)同作戰(zhàn)能力為人類與人工智能互動的未來提供了一個引人注目的愿景:人工智能系統(tǒng)能夠和人類協(xié)作并增強人類體驗。

玩家認為從機器人隊友哪里感受到了戰(zhàn)友之情,并從這些先進的系統(tǒng)中學(xué)到了很多東西,整體來說是一種有趣的體驗。

值得注意的是,OpenAIFive展示了zero-shot遷移學(xué)習,與人類并肩作戰(zhàn)或者對抗人類。研究人員非常驚訝這一點和它一樣有效。事實上,研究人員考慮在國際上進行協(xié)同作案韓比賽,但認為需要專門的訓(xùn)練。

OpenAI Five Arena

目前研究人員還不知道OpenAIFive在多大程度上能夠通過更機智的策略被擊敗,所以研究人員推出了OpenAIFiveArena。這是一項公開的實驗,任何人都可以跟OpenAIFive組隊或者對戰(zhàn)。

競技場于4月18日星期四太平洋標準時間下午6點開放,并于4月21日星期日太平洋標準時間晚上11:59關(guān)閉。玩家需要注冊,所有游戲的結(jié)果將自動報告給競技場公共排行榜。

下一步干什么

一旦研究人員審查了OpenAIFiveArena的結(jié)果,研究人員將發(fā)布對OpenAIFive的更多技術(shù)分析,之后將繼續(xù)使用OpenAI中的Dota2環(huán)境。

研究人員已經(jīng)看到過去兩年在監(jiān)督學(xué)習能力方面取得了快速進展,并認為Dota2將在推進無論是通過較少的數(shù)據(jù)還是真正的人工智能合作實現(xiàn)有能力的表現(xiàn)方面,持續(xù)提供幫助。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    48987

    瀏覽量

    249134
  • 深度學(xué)習
    +關(guān)注

    關(guān)注

    73

    文章

    5560

    瀏覽量

    122767
  • 遷移學(xué)習
    +關(guān)注

    關(guān)注

    0

    文章

    74

    瀏覽量

    5727

原文標題:官方揭秘OpenAI Five如何打敗人類:遷移學(xué)習+海量訓(xùn)練,10個月訓(xùn)練4.5萬年

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    海思SD3403邊緣計算AI數(shù)據(jù)訓(xùn)練概述

    AI數(shù)據(jù)訓(xùn)練:基于用戶特定應(yīng)用場景,用戶采集照片或視頻,通過AI數(shù)據(jù)訓(xùn)練工程師**(用戶公司****員工)** ,進行特征標定后,將標定好的訓(xùn)練
    發(fā)表于 04-28 11:11

    利用RAKsmart服務(wù)器托管AI模型訓(xùn)練的優(yōu)勢

    AI模型訓(xùn)練需要強大的計算資源、高效的存儲和穩(wěn)定的網(wǎng)絡(luò)支持,這對服務(wù)器的性能提出了較高要求。而RAKsmart服務(wù)器憑借其核心優(yōu)勢,成為托管AI模型訓(xùn)練的理想
    的頭像 發(fā)表于 03-18 10:08 ?259次閱讀

    訓(xùn)練好的ai模型導(dǎo)入cubemx不成功怎么處理?

    訓(xùn)練好的ai模型導(dǎo)入cubemx不成功咋辦,試了好幾個模型壓縮了也不行,ram占用過大,有無解決方案?
    發(fā)表于 03-11 07:18

    OpenAI簡化大模型選擇:薩姆·奧特曼制定路線圖

    OpenAI的首席執(zhí)行官薩姆·奧特曼(Sam Altman)近期為公司的GPT-4.5和GPT-5大模型開發(fā)制定了一項重要的路線圖,旨在極大地簡化和優(yōu)化用戶及開發(fā)人員在選擇AI模型時的體驗。 在當
    的頭像 發(fā)表于 02-18 09:12 ?495次閱讀

    Figure AI宣布終止與OpenAI合作,專注內(nèi)部研發(fā)

    近日,人形機器人領(lǐng)域的獨角獸企業(yè)Figure AI宣布了一個重要決定:因已取得“重大突破”,將終止與OpenAI的合作,并專注于內(nèi)部人工智能技術(shù)的研發(fā)。這一決定距離Figure AI宣布
    的頭像 發(fā)表于 02-06 14:33 ?617次閱讀

    OpenAI CEO訪印,共商AI戰(zhàn)略

    、模型和應(yīng)用程序這三個關(guān)鍵領(lǐng)域。阿什維尼·維什瑙部長表示,OpenAI對于與印度在這三方面展開合作表現(xiàn)出了濃厚的興趣。 GPU作為人工智能領(lǐng)域的重要基礎(chǔ)設(shè)施,對于提升AI模型的訓(xùn)練和推理能力具有至關(guān)重要的作用。而
    的頭像 發(fā)表于 02-06 10:10 ?405次閱讀

    OpenAI進軍傳媒,蘋果暫停AI新聞功能

    技術(shù)支持的地方新聞編輯室”。這一舉措標志著OpenAI正式涉足傳媒領(lǐng)域,意圖通過AI技術(shù)推動新聞業(yè)的創(chuàng)新與發(fā)展。 與此同時,蘋果公司在AI新聞功能方面卻遭遇了挫折。面對外界關(guān)于AI能力
    的頭像 發(fā)表于 01-21 10:10 ?461次閱讀

    OpenAI GPT-5開發(fā)滯后:訓(xùn)練成本高昂

    近日,據(jù)最新消息,OpenAI在推進其備受期待的下一代旗艦?zāi)P虶PT-5的開發(fā)進程上遇到了困難。由于計算成本高昂且高質(zhì)量訓(xùn)練數(shù)據(jù)稀缺,GPT-5的開發(fā)已經(jīng)落后于原定計劃半年之久。 據(jù)悉,OpenAI
    的頭像 發(fā)表于 12-23 11:04 ?726次閱讀

    GPU是如何訓(xùn)練AI大模型的

    AI模型的訓(xùn)練過程中,大量的計算工作集中在矩陣乘法、向量加法和激活函數(shù)等運算上。這些運算正是GPU所擅長的。接下來,AI部落小編帶您了解GPU是如何訓(xùn)練
    的頭像 發(fā)表于 12-19 17:54 ?726次閱讀

    訓(xùn)練AI大模型需要什么樣的gpu

    訓(xùn)練AI大模型需要選擇具有強大計算能力、足夠顯存、高效帶寬、良好散熱和能效比以及良好兼容性和擴展性的GPU。在選擇時,需要根據(jù)具體需求進行權(quán)
    的頭像 發(fā)表于 12-03 10:10 ?644次閱讀

    如何訓(xùn)練自己的AI大模型

    訓(xùn)練自己的AI大模型是一個復(fù)雜且耗時的過程,涉及多個關(guān)鍵步驟。以下是一個詳細的訓(xùn)練流程: 一、明確需求和目標 首先,需要明確自己的需求和目標。不同的任務(wù)和應(yīng)用領(lǐng)域需要不同類型的AI模型
    的頭像 發(fā)表于 10-23 15:07 ?4937次閱讀

    ai模型訓(xùn)練需要什么配置

    較小的數(shù)據(jù)集和簡單的計算任務(wù),如數(shù)據(jù)預(yù)處理、模型評估等。因此,選擇一款高性能的CPU對于提高AI模型訓(xùn)練的整體效率至關(guān)重要。 推薦選擇Intel Core i7或更高性能的處理器,或者
    的頭像 發(fā)表于 10-17 18:10 ?3804次閱讀

    AI訓(xùn)練的基本步驟

    AI(人工智能)訓(xùn)練是一個復(fù)雜且系統(tǒng)的過程,它涵蓋了從數(shù)據(jù)收集到模型部署的多個關(guān)鍵步驟。以下是對AI訓(xùn)練過程的詳細闡述,包括每個步驟的具體內(nèi)容,并附有相關(guān)代碼示例(以Python和sc
    的頭像 發(fā)表于 07-17 16:57 ?5226次閱讀

    ai大模型訓(xùn)練方法有哪些?

    AI大模型訓(xùn)練方法是一個復(fù)雜且不斷發(fā)展的領(lǐng)域。以下是ai大模型訓(xùn)練方法: 數(shù)據(jù)預(yù)處理和增強 數(shù)據(jù)清洗:去除噪聲和不完整的數(shù)據(jù)。 數(shù)據(jù)標準化:將數(shù)據(jù)縮放到統(tǒng)一的范圍。 數(shù)據(jù)增強:通過旋轉(zhuǎn)
    的頭像 發(fā)表于 07-16 10:11 ?3145次閱讀