chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

騰訊宣布其人工智能球隊(duì)獲首屆谷歌足球Kaggle競賽冠軍

lhl545545 ? 來源:21世紀(jì)經(jīng)濟(jì)報(bào)道 ? 作者:21世紀(jì)經(jīng)濟(jì)報(bào)道 ? 2020-12-30 15:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

12月30日,騰訊宣布其人工智能球隊(duì)摘得了首屆谷歌足球Kaggle競賽冠軍。這是一場由Google Research與英超曼城俱樂部在Kaggle平臺上聯(lián)合舉辦的足球AI比賽,經(jīng)過多輪角逐,騰訊AI Lab研發(fā)的絕悟WeKick版本以1785.8的總分成為冠軍球隊(duì)。

創(chuàng)立于2010年的Kaggle是全球最大的數(shù)據(jù)科學(xué)社區(qū)和數(shù)據(jù)科學(xué)競賽平臺,今年,也是Kaggle首次針對足球AI領(lǐng)域發(fā)布賽題。

比賽使用Google Research Football強(qiáng)化Learning環(huán)境,基于開源足球游戲Gameplay Football開發(fā),采取11vs11的賽制,參賽團(tuán)隊(duì)需要控制其中1個(gè)智能體與10個(gè)內(nèi)置智能體組成球隊(duì)。

WeKick的比賽場景該賽事發(fā)布后,吸引了來自世界頂級院校和研究機(jī)構(gòu)的1100多支隊(duì)伍參加,而騰訊此次派出的隊(duì)伍其實(shí)是11月底剛剛升級為完全體的“絕悟”,當(dāng)時(shí),騰訊“絕悟”首次精通了王者榮耀所有英雄的所有技能,此次參加足球賽,就是在其基礎(chǔ)上進(jìn)行了一些針對足球的調(diào)整。

AI如何踢足球?

Google Football(on Kaggle)以流行的足球游戲?yàn)槟P?,就像是一款由AI操作的FIFA游戲,智能體控制足球隊(duì)中的一個(gè)或所有足球運(yùn)動(dòng)員,學(xué)習(xí)如何在他們之間傳球,并設(shè)法克服對手的防守以進(jìn)球。其競賽規(guī)則與普通足球比賽類似,比如目標(biāo)都是將球踢入對方球門以及越位、黃牌和紅牌規(guī)則。

不同于常見足球視頻游戲的統(tǒng)一調(diào)控式NPC球隊(duì),在本次Kaggle競賽中,每個(gè)球員都各由一個(gè)單獨(dú)的智能體控制,而參賽的AI模型則根據(jù)比賽情況控制其中一個(gè)智能體,與其他10個(gè)內(nèi)置智能體配合。這要求每個(gè)球員不僅需要觀察對手的行為,還需要留意己方隊(duì)員的情況,背后需要非常復(fù)雜的團(tuán)隊(duì)協(xié)作和競爭策略作為支撐。

比如,當(dāng)對方球員控球時(shí),己方智能體不僅要根據(jù)球場上雙方球員的分布位置預(yù)測控球球員的下一步動(dòng)作,還需要與己方其他球員協(xié)同如何合規(guī)地奪取足球的控制權(quán)。且由于球場動(dòng)態(tài)瞬息萬變,因此高速的實(shí)時(shí)決策能力也是必需的。

此外,從零開始完全采用強(qiáng)化學(xué)習(xí)方法來訓(xùn)練完整的足球AI實(shí)際上也相當(dāng)困難。與MOBA游戲中不斷有經(jīng)濟(jì)、血量、經(jīng)驗(yàn)等實(shí)時(shí)學(xué)習(xí)信號不同,足球的游戲激勵(lì)非常稀疏,基本只能依靠進(jìn)球,而稀疏激勵(lì)一直是目前強(qiáng)化Learning一大難題。

“絕悟”的冠軍之路

據(jù)騰訊方面介紹,絕悟WeKick版本首先采用了強(qiáng)化學(xué)習(xí)和自博弈(Self-Play)來從零開始訓(xùn)練模型,并部署了一種異步的分布式強(qiáng)化學(xué)習(xí)框架。雖然該異步架構(gòu)犧牲了訓(xùn)練階段的部分實(shí)時(shí)性能,但靈活性卻得到顯著提升,而且還支持在訓(xùn)練過程中按需調(diào)整計(jì)算資源,使其能適應(yīng) 11 智能體足球游戲訓(xùn)練環(huán)境。

由于MOBA游戲和足球游戲任務(wù)目標(biāo)的差異,絕悟WeKick版本還采用了生成對抗模擬學(xué)習(xí)(GAIL)與人工設(shè)計(jì)的獎(jiǎng)勵(lì)結(jié)合,在特征與獎(jiǎng)勵(lì)設(shè)計(jì)上進(jìn)行了擴(kuò)展和創(chuàng)新。

該方案利用了生成對抗訓(xùn)練機(jī)制來擬合專家行為的狀態(tài)和動(dòng)作分布,使得絕悟WeKick版本可以從其它球隊(duì)學(xué)習(xí)。然后,再將 GAIL 訓(xùn)練的模型作為固定對手進(jìn)行進(jìn)一步自博弈訓(xùn)練,進(jìn)一步提升策略的穩(wěn)健性。

但這種通過自博弈強(qiáng)化學(xué)習(xí)得到的模型有一個(gè)天然的缺點(diǎn):很容易收斂到單一風(fēng)格。在實(shí)際比賽的時(shí)候單一風(fēng)格的模型很容易發(fā)生由于沒見過某種打法而表現(xiàn)失常,最終導(dǎo)致成績不佳的情況。因此,為了提升策略的多樣性和穩(wěn)健性,絕悟還采用了針對多智能體學(xué)習(xí)任務(wù)的League(若干策略池)多風(fēng)格強(qiáng)化學(xué)習(xí)訓(xùn)練方案。

這種League多風(fēng)格強(qiáng)化學(xué)習(xí)訓(xùn)練方案的主要流程可簡單總結(jié)為先專精后綜合。

首先訓(xùn)練一個(gè)具備一定程度競技能力的基礎(chǔ)模型,比如運(yùn)球過人、傳球配合、射門得分;

接著基于基礎(chǔ)模型訓(xùn)練出多個(gè)風(fēng)格化模型,每個(gè)模型專注一種風(fēng)格打法,在風(fēng)格化模型訓(xùn)練的過程中會(huì)定期加入主模型作為對手,避免過度堅(jiān)持風(fēng)格,丟失基本能力;

最后基于多個(gè)基礎(chǔ)模型訓(xùn)練一個(gè)主模型,主模型除了以自己的歷史模型為對手以外,還會(huì)定期加入所有風(fēng)格化對手的最新模型作為對手,確保主模型能夠適應(yīng)風(fēng)格完全不同的對手。

最終,基于絕悟完全體的架構(gòu)遷移,定制化的框架改進(jìn),加上關(guān)鍵性的生成對抗模擬學(xué)習(xí)(GAIL)方案和 League (若干策略池)多風(fēng)格強(qiáng)化學(xué)習(xí)訓(xùn)練方案,使得絕悟?qū)崿F(xiàn)了優(yōu)于其它競爭AI球隊(duì)的優(yōu)勢,成就了冠軍之路。
責(zé)任編輯:pj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6245

    瀏覽量

    110271
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49751

    瀏覽量

    261621
  • 騰訊
    +關(guān)注

    關(guān)注

    7

    文章

    1682

    瀏覽量

    50771
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    智芯公司首屆人工智能+”創(chuàng)新創(chuàng)意大賽圓滿落幕

    10月20日,智芯公司首屆人工智能+”創(chuàng)新創(chuàng)意大賽決賽圓滿落幕。來自公司各部門及分子公司的10支隊(duì)伍同臺角逐,智芯公司領(lǐng)導(dǎo)班子出席決賽現(xiàn)場,全程參與打分并為獲獎(jiǎng)隊(duì)伍頒獎(jiǎng),以實(shí)際行動(dòng)傳遞“以創(chuàng)新驅(qū)動(dòng)發(fā)展”的戰(zhàn)略導(dǎo)向。
    的頭像 發(fā)表于 10-24 15:31 ?538次閱讀

    是德科技如何提升AI數(shù)據(jù)中心集群的可擴(kuò)展性

    全球范圍內(nèi),一場高投入的競賽正在展開:各國與各類企業(yè)不斷擴(kuò)建數(shù)據(jù)中心,以支撐其人工智能(AI)的發(fā)展。
    的頭像 發(fā)表于 09-25 17:09 ?839次閱讀

    墨芯人工智能亮相2025外灘大會(huì)

    9月10日至13日,墨芯人工智能在2025外灘大會(huì)盛大亮相,成為"數(shù)據(jù)與計(jì)算展區(qū)"備受矚目的焦點(diǎn)之一。作為深耕稀疏計(jì)算的AI芯片企業(yè),墨芯在此次展會(huì)上全方位展示了其人工智能芯片、高性能計(jì)算卡及行業(yè)解決方案,吸引了大量專業(yè)觀眾駐足交流。
    的頭像 發(fā)表于 09-11 14:04 ?597次閱讀

    Lambda采用Supermicro NVIDIA Blackwell GPU服務(wù)器集群構(gòu)建人工智能工廠

    人工智能/機(jī)器學(xué)習(xí)、HPC、云、存儲和 5G/邊緣的整體 IT 解決方案提供商 Super Micro Computer, Inc. (SMCI)今天宣布,超級智能云提供商 Lambda 已部署
    的頭像 發(fā)表于 08-30 16:55 ?626次閱讀

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學(xué),便捷拉滿 這個(gè)實(shí)驗(yàn)箱真的是為使用者
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學(xué),便捷拉滿 這個(gè)實(shí)驗(yàn)箱真的是為使用者
    發(fā)表于 08-07 14:23

    2025人工智能十大趨勢

    在2025世界人工智能大會(huì)·騰訊論壇上,騰訊研究院聯(lián)合騰訊優(yōu)圖實(shí)驗(yàn)室、騰訊智能
    的頭像 發(fā)表于 08-05 11:42 ?4988次閱讀
    2025<b class='flag-5'>人工智能</b>十大趨勢

    特朗普宣布5000億美元人工智能投資計(jì)劃

    近日,美國人工智能領(lǐng)域迎來重磅消息。美國總統(tǒng)特朗普宣布,OpenAI、軟銀和甲骨文三家行業(yè)巨頭正攜手推進(jìn)一項(xiàng)名為 “星際之門”(Stargate)的人工智能基礎(chǔ)設(shè)施建設(shè)計(jì)劃,總投資預(yù)計(jì)高達(dá) 5000 億美元。這一舉措旨在助力美國
    的頭像 發(fā)表于 02-05 17:48 ?961次閱讀

    蘋果軟件更新默認(rèn)啟用人工智能

    蘋果公司近期發(fā)布了針對iPhone、iPad和Mac的最新軟件更新,這一更新舉措標(biāo)志著蘋果在全面推廣其人工智能服務(wù)方面邁出了重要一步。 據(jù)悉,此次更新包括iOS 18.3、iPadOS 18.3以及
    的頭像 發(fā)表于 02-05 14:04 ?650次閱讀

    谷歌再投10億美元于人工智能公司Anthropic

    近日,Alphabet Inc.旗下的谷歌再度出手,向人工智能開發(fā)商Anthropic追加了10億美元的投資,進(jìn)一步提升了其在這家潛力無限、有望與OpenAI展開競爭的公司中的持股比例。 據(jù)一位
    的頭像 發(fā)表于 01-23 10:57 ?849次閱讀

    谷歌加速AI部門整合:AI Studio團(tuán)隊(duì)并入DeepMind

    近日,谷歌正緊鑼密鼓地推進(jìn)其人工智能(AI)部門的整合工作。據(jù)谷歌AI Studio主管Logan Kilpatrick在領(lǐng)英頁面上的透露,谷歌已將AI Studio團(tuán)隊(duì)整體轉(zhuǎn)移至De
    的頭像 發(fā)表于 01-13 14:40 ?1149次閱讀

    商湯科技當(dāng)選工信部人工智能標(biāo)準(zhǔn)技術(shù)委員會(huì)首屆委員單位

    參會(huì)。 ? ? 會(huì)上宣布正式成立第一屆工業(yè)和信息化部人工智能標(biāo)準(zhǔn)化技術(shù)委員會(huì),商湯科技位列首屆委員單位之中。 12月13日,工信部公示決定成立人工智能標(biāo)準(zhǔn)化技術(shù)委員會(huì),遴選多位院士、產(chǎn)
    的頭像 發(fā)表于 01-02 16:58 ?1158次閱讀
    商湯科技當(dāng)選工信部<b class='flag-5'>人工智能</b>標(biāo)準(zhǔn)技術(shù)委員會(huì)<b class='flag-5'>首屆</b>委員單位

    依圖“城市之眼感知系統(tǒng)融合平臺”人工智能先鋒案例

    科技的“城市之眼感知系統(tǒng)融合平臺”在本次大會(huì)中“2024年人工智能先鋒案例”。此次先鋒案例由中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)、工業(yè)和信息化部新聞宣傳中心、中國信息通信研究院聯(lián)合發(fā)布,涵蓋安防、政務(wù)、制造、水利、金融、交通等
    的頭像 發(fā)表于 12-28 15:44 ?1583次閱讀

    潤芯微科技評2024 AI蘇州“人工智能+”融合應(yīng)用企業(yè)

    人工智能+”發(fā)展路徑,驅(qū)動(dòng)產(chǎn)業(yè)轉(zhuǎn)型升級。潤芯微科技憑借啟航操作系統(tǒng)的創(chuàng)新理念,評“人工智能+”融合應(yīng)用企業(yè)。
    的頭像 發(fā)表于 12-23 10:15 ?860次閱讀

    Infosys與谷歌云加強(qiáng)合作,推動(dòng)企業(yè)人工智能創(chuàng)新,建立卓越中心

    Infosys(NSE, BSE, NYSE: INFY),近日宣布啟動(dòng)由Infosys Topaz提供支持的谷歌云卓越中心,以促進(jìn)企業(yè)人工智能創(chuàng)新。該中心將成為共同創(chuàng)造的催化劑,助力企業(yè)利用生成式
    的頭像 發(fā)表于 12-19 15:33 ?603次閱讀