chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

史上最強棋類AI降臨!也是迄今最強的棋類AI——AlphaZero

DPVg_AI_era ? 來源:lq ? 2018-12-08 09:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

DeepMind最強棋類算法AlphaZero今天以Science封面論文形式發(fā)表。David Sliver、哈薩比斯等人親自撰文解讀這一棋類終極算法,以及實現(xiàn)通用學習系統(tǒng)的重要一步。

史上最強棋類AI降臨!

今天,DeepMind的通用棋類算法,也是迄今最強的棋類AI——AlphaZero,經(jīng)過同行評議,被頂級期刊 Science 以封面論文的形式,正式引入學界和公眾的視野。

一年前,DeepMind靜靜地在arXiv貼出了AlphaZero的預(yù)印版論文,當即就在圈內(nèi)引發(fā)轟動:AlphaZero從零開始訓(xùn)練,2小時擊敗最強將棋AI,4小時擊敗最強國際象棋AI,8小時擊敗最強圍棋AI(李世石版AlphaGo)。

現(xiàn)在,DeepMind將完整評估后的AlphaZero公之于眾,不僅驗證了上述結(jié)果,還補充了新的提升。

AlphaZero沒有使用人類知識(除了棋類基本規(guī)則),從零開始訓(xùn)練,快速掌握日本將棋、國際象棋和圍棋這三種復(fù)雜棋類游戲,展現(xiàn)出令人耳目一新的獨道風格,拓展了人類智慧,并證明了機器擁有創(chuàng)造性的可能。

國際象棋大師卡斯帕羅夫——20年前輸給IBM深藍的國際象棋世界冠軍,今天在Science發(fā)表社論,表示他很高興看到AlphaZero展現(xiàn)出了像他一樣“動態(tài)、開放”的棋風:

“傳統(tǒng)觀點以為,機器將通過無休止的枯燥操作趨近完美,最終導(dǎo)致平局。但據(jù)我觀察,AlphaZero優(yōu)先考慮棋子的活動而非盤面上的點數(shù)優(yōu)勢,更喜歡在我看來有風險和激進的地方落子。

“計算機程序通常會反映出編程者的側(cè)重和偏見,但由于AlphaZero通過自我對弈訓(xùn)練,我認為它體現(xiàn)了棋的真諦(truth)。正是這種出色的理解使其能夠超越世界頂級的傳統(tǒng)棋類引擎,而且每秒計算的落子位置要少得多?!?/p>

AlphaZero證明了機器也能成為專家,機器生成的知識也值得人類去學習。“AlphaZero以這樣一種強大而有用的方式超越了我們,”卡斯帕羅夫?qū)懙溃骸爸灰谔摂M知識(virtual knowledge)能夠生成的領(lǐng)域,這個模型都可能復(fù)制到任何其他任務(wù)上?!?/p>

IBM深藍的共同創(chuàng)造者之一Murray Campbell,也在Science發(fā)表評論文章,指出DeepMind論文使用通用的搜索方法,結(jié)合蒙特卡羅樹搜索(MCTS),增強了深度強化學習。

“盡管MCTS已經(jīng)成為圍棋程序中的標準搜索方法,但迄今為止,幾乎沒有證據(jù)表明它在國際象棋或?qū)⑵逯杏杏?。”Campbell寫道:“DeepMind展示了深度強化學習與MCTS算法相結(jié)合的力量,從隨機初始化的參數(shù)開始,讓神經(jīng)網(wǎng)絡(luò)通過自我對弈不斷更新參數(shù)。”

下面,就讓我們一起來看看,AlphaZero的論文作者David Silver、Thomas Hubert、Julian Schrittwieser和Demis Hassabis親自撰文,闡述他們?nèi)绾斡?000個TPU,讓AlphaZero快速掌握將棋、國際象棋和圍棋。

用5000個TPU,快速掌握將棋、圍棋和國際象棋

傳統(tǒng)國際象棋的引擎依賴于由人類高手玩家“手工制作”的數(shù)千條規(guī)則和啟發(fā)式方法,它們都試圖解釋游戲中可能發(fā)生的每一種結(jié)果。

日本將棋程序也是特定于游戲的,使用與國際象棋程序類似的搜索引擎和算法。

AlphaZero則采用了一種完全不同的方法,用深度神經(jīng)網(wǎng)絡(luò)和通用算法取代了這些“手工制作”的規(guī)則,而這些算法對基本規(guī)則之外的游戲卻一無所知。

在國際象棋中,AlphaZero僅用了4個小時便首次超越了Stockfish;在日本將棋中,AlphaZero在2小時后首次超過Elmo;在圍棋方面,AlphaZero在2016年的比賽中,經(jīng)過30個小時的鏖戰(zhàn),首次擊敗了傳奇棋手李世石。注:每個訓(xùn)練步驟代表了4096個落子位置。

為了學習每一個游戲,一個未經(jīng)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)通過強化學習與自己對打數(shù)百萬次。

一開始,它完全是隨機的,但是隨著時間的推移,系統(tǒng)從輸贏中開始學習,并根據(jù)神經(jīng)網(wǎng)絡(luò)的參數(shù)進行調(diào)整,使其在未來可以選擇更有利的走法。

網(wǎng)絡(luò)需要的訓(xùn)練量取決于游戲的風格和復(fù)雜性,國際象棋需要9小時,將棋需要12小時,圍棋需要13天。

“AlphaZero的一些舉動,例如將王將移至棋盤中央是有違將棋理論的,從人類的角度來看,它的這些舉動似乎是將自己置于危險境地。但令人難以置信的是,它仍然控制著局面。AlphaZero獨特的游戲風格向我們展示了將棋的新可能性?!?/p>

羽生善治,日本將棋棋士,獲得七項頭銜的“永世稱號”,亦是日本將棋史上第一個達成七冠王與“永世七冠”的人,改寫了將棋界多項歷史紀錄

訓(xùn)練后的網(wǎng)絡(luò)用于指導(dǎo)搜索算法(蒙特卡羅樹搜索,MCTS),選擇游戲中最有有利的動作。對于每次移動,AlphaZero僅搜索傳統(tǒng)國際象棋引擎所考慮的一小部分位置。

例如,在國際象棋中,它每秒僅搜索6萬個位置,相比之下,Stockfish大約有6千萬個位置。

這些經(jīng)過全面訓(xùn)練的系統(tǒng)是在國際象棋(Stockfish)和將棋(Elmo)最強大的“手工引擎”以及我們之前自學的AlphaGo Zero系統(tǒng)(已知最強大的圍棋選手)的幫助下進行測試的。

每個程序都在它們所設(shè)計的硬件上運行。Stockfish和Elmo使用了44個CPU核,而AlphaZero和AlphaGo Zero使用了一臺擁有4個第一代TPU和44個CPU核的機器。第一代TPU在推理速度上與NVIDIA Titan V GPU等商用硬件大致相似,但架構(gòu)并不具有直接可比性。

所有的比賽都有時間控制,每場比賽3小時,外加每一步額外的15秒。

在每次評估中,AlphaZero都毫無懸念地擊敗了對手:

在國際象棋比賽中,AlphaZero擊敗了2016年TCEC(第九季)世界冠軍Stockfish,贏得155場比賽,在1000場比賽中只輸了6場。為了驗證AlphaZero的穩(wěn)健性,我們還進行了一系列比賽,這些比賽都是從常見的“人類開局方式”開始的。在每一種開局情況下,AlphaZero都擊敗了Stockfish。我們還與最新開發(fā)版本的Stockfish以及它的變體打過比賽,在所有的比賽中,AlphaZero都贏了。

在將棋比賽中,AlphaZero擊敗了2017年CSA世界冠軍版Elmo,贏得了91.2%的比賽。

在圍棋比賽中,AlphaZero擊敗了AlphaGo Zero,贏得了61%的比賽。

獨創(chuàng)棋風,拓展人類智慧,邁向通用學習系統(tǒng)重要一步

然而,讓人感到最著迷的是AlphaZero的行棋風格。例如,在國際象棋中,AlphaZero在自我訓(xùn)練中獨立發(fā)現(xiàn)并走出了人類棋手常用的定式,如開局、王不立險地(King safety)和兵的走法。

但是,由于這些都是自學的,因此不會受傳統(tǒng)觀念的影響,AlphaZero還開創(chuàng)出了自己的直覺和策略,產(chǎn)生了一系列令人興奮的新穎思路,為幾個世紀以來國際象棋戰(zhàn)略戰(zhàn)術(shù)的思考提供了有益的補充。

過去一個多世紀以來,國際象棋一直被用作衡量人類和機器認知水平的黃金標準。 AlphaZero取得的非凡成果,刷新了這門古老的棋盤游戲和尖端科學之間的顯著聯(lián)系。

前國際象棋世界冠軍 加里·卡斯帕羅夫

在與AlphaZero對弈時,棋手注意到的第一件事就是它的行棋風格,國際象棋大師Matthew Sadler說道,“它會懷著明確的目的和力量來瓦解對手的王”。Sadler和女子國際象棋大師Natasha Regan一起分析AlphaZero,并寫作出版了專著《Game Changer:AlphaZero的顛覆性國際象棋策略和人工智能潛力》。

AlphaZero的行棋風格非常靈活,最大限度地提升己方子力配備的靈活性和機動性,同時最大限度地降低對手子力的靈活性和機動性。

與我們的通常想法不同的是,AlphaZero似乎對“子力”本身的重視程度較低,而重視“子力”是現(xiàn)代國際象棋的基本行棋思路,棋盤上每個子都具有價值,如果一個玩家在棋盤上的子力高于對手,那么他就擁有子力優(yōu)勢。而AlphaZero甚至愿意在棋局早期犧牲子力,以獲得長期收益。

“令人印象深刻的是,AlphaZero在行棋時能將這種風格應(yīng)用在各種各樣的開局和定式中?!盡atthew說道,他也觀察到,AlphaZero從走第一步開始就體現(xiàn)出了這種明確的的性,且一以貫之,其風格體現(xiàn)得非常明顯。

“過去的傳統(tǒng)國際象棋軟件已經(jīng)非常穩(wěn)定,幾乎不會出現(xiàn)明顯錯誤,但在面對沒有具體和可計算解決方案的時,其行棋會發(fā)生偏差,”他說:“正是在這種時候,才是AlphaZero發(fā)揮其'感覺'、'洞察'或'直覺'的地方?!?/p>

這種獨特的能力,在其他傳統(tǒng)的國際象棋引擎中是看不到的。目前,AlphaZero已經(jīng)被用來在世界國際象棋錦標賽上為棋迷們提供有關(guān)Magnus Carlsen和Fabiano Caruana(現(xiàn)男子國際象棋等級分前兩名)對局的新見解和評論。

“我們可以看看AlphaZero的分析,與頂級國際象棋大師對棋局的分析,甚至和棋手實戰(zhàn)著法有何不同,這真是令人著迷的一件事。AlphaZero可以作為整個國際象棋社區(qū)的強大教學工具。”

AlphaZero的“教誨”,讓我們想起了2016年AlphaGo與圍棋世界冠軍李世乭對弈時的場景。在那次比賽中,AlphaGo走出了許多極具創(chuàng)造性的致勝著法,包括在第2局比賽中的執(zhí)黑第37手,這手棋推翻了人類數(shù)百年的思路。這些著法已經(jīng)被包括李世乭本人在內(nèi)的所有級別的棋手和愛好者研究過。

他們對此表示:“我之前還認為AlphaGo是基于概率來計算的,它只是一臺機器。但當我看到這手棋時,我改變了想法。毫無疑問,AlphaGo是有創(chuàng)造性的。”

“人機大戰(zhàn)”的影響力已經(jīng)遠遠超出了國際象棋本身。這些自學成才的專家級機器不僅表現(xiàn)優(yōu)異,棋力非凡,而且從自己創(chuàng)造的新知識中學習。

加里·卡斯帕羅夫 前國際象棋世界冠軍

和圍棋一樣,我們對AlphaZero在國際象棋上的創(chuàng)造性突破感到興奮,自從計算機時代以來,人工智能時時面臨著巨大挑戰(zhàn),包括巴貝奇、圖靈、馮·諾依曼在內(nèi)的早期計算機先驅(qū)人物,都曾試圖設(shè)計國際象棋程序,但AlphaZero的用途不僅僅是國際象棋、將棋和圍棋。

為了創(chuàng)建能夠解決各種現(xiàn)實問題的智能系統(tǒng),它們需要更加靈活,能夠適應(yīng)新情況。雖然目前在實現(xiàn)這一目標方面取得了一些進展,但AI的通用化問題仍然是研究中的一項重大挑戰(zhàn),經(jīng)過訓(xùn)練的AI系統(tǒng)面對特定任務(wù)時能夠以極高標準完成,但任務(wù)只要稍有變化往往就會失敗。

AlphaZero掌握了三種不同的復(fù)雜游戲,這可能是朝著解決這一問題邁出的重要一步。盡管目前還處于早期階段,但AlphaZero取得的進步,以及在蛋白質(zhì)折疊系統(tǒng)AlphaFold等其他項目上的令人鼓舞的結(jié)果,讓我們對實現(xiàn)通用學習系統(tǒng)的使命充滿信心,相信未來我們能夠找到一些新的解決方案,解決最重要、最復(fù)雜的科學問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35136

    瀏覽量

    279741
  • 強化學習
    +關(guān)注

    關(guān)注

    4

    文章

    269

    瀏覽量

    11599
  • DeepMind
    +關(guān)注

    關(guān)注

    0

    文章

    131

    瀏覽量

    11574

原文標題:Science封面:AlphaZero達成終極進化體,史上最強棋類AI降臨!

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?直接發(fā)個安裝包,謝謝。比如deepseek、Chatgpt、豆包、阿里AI、百度AI、騰訊
    發(fā)表于 07-09 18:30

    制作團隊如何借助NVIDIA RTX AI讓創(chuàng)意成真

    藝術(shù)家和開發(fā)者已經(jīng)在利用生成式 AI 簡化工作、突破創(chuàng)意邊界,無論是探索概念、設(shè)計虛擬世界還是構(gòu)建智能應(yīng)用。借助 RTX AI PC,用戶能夠?qū)⒆钚隆?b class='flag-5'>最強大的模型和工具,以及強大的 AI
    的頭像 發(fā)表于 07-09 16:28 ?211次閱讀

    AI 時代開啟,企業(yè)跟風做 AI 產(chǎn)品是明智之舉?

    AI
    華成工控
    發(fā)布于 :2025年04月10日 17:28:44

    英特爾發(fā)布最強大的商用AI PC產(chǎn)品陣容

    在2025年世界移動通信大會(MWC 2025)上,英特爾發(fā)布了該公司迄今為止最強大的商用AI PC產(chǎn)品陣容,搭載了英特爾 酷睿 Ultra 200V、200U、200H、200HX和200S系列
    的頭像 發(fā)表于 03-08 09:28 ?645次閱讀

    擁有高達99.7%的應(yīng)用程序兼容性!英特爾最強商用AI PC產(chǎn)品陣容亮相MWC

    3月5日,在2025年世界移動通信大會(MWC 2025)上,英特爾發(fā)布了該公司迄今為止最強大的商用AI PC產(chǎn)品陣容,搭載了英特爾? 酷睿? Ultra 200V、200U、200H、200HX
    的頭像 發(fā)表于 03-06 16:39 ?911次閱讀
    擁有高達99.7%的應(yīng)用程序兼容性!英特爾<b class='flag-5'>最強</b>商用<b class='flag-5'>AI</b> PC產(chǎn)品陣容亮相MWC

    天璣 9400拿下AI性能榜冠軍,最強NPU引領(lǐng)手機AI應(yīng)用變革

    近兩年, AI手機端側(cè)AI應(yīng)用和AI體驗開始進入“超級加速”的時期,層出不窮的技術(shù)創(chuàng)新背后其實更離不開手機芯片的核心支持。在這股浪潮中,聯(lián)發(fā)科天璣 9400旗艦芯片憑借其無可匹敵的AI
    的頭像 發(fā)表于 12-30 20:09 ?708次閱讀
    天璣 9400拿下<b class='flag-5'>AI</b>性能榜冠軍,<b class='flag-5'>最強</b>NPU引領(lǐng)手機<b class='flag-5'>AI</b>應(yīng)用變革

    軟銀攜手英偉達打造日本最強AI超算

    軟銀集團近日宣布,將率先采用英偉達最新的Blackwell平臺,打造日本最強AI超級計算機。此舉旨在滿足日本在人工智能領(lǐng)域快速發(fā)展的迫切需求,推動國內(nèi)AI技術(shù)的創(chuàng)新與應(yīng)用。
    的頭像 發(fā)表于 11-14 16:25 ?643次閱讀

    余承東稱史上最強大的Mate11月見

    對于華為的下一代旗艦手機Mate70的關(guān)注一直沒有減少,對于“純血鴻蒙”的期待一直很高,11月4日,華為常務(wù)董事、終端BG董事長、智能汽車解決方案BU董事長余承東在微博上發(fā)文透露一個重要時間點:史上最強大的Mate,11月見。
    的頭像 發(fā)表于 11-04 11:23 ?645次閱讀

    英偉達地表最強AI芯片GB200 NVL72服務(wù)器遭搶購

    10月28日,最新媒體報道顯示,配備有英偉達被譽為“地表最強AI芯片”的GB200的AI服務(wù)器已開始交付,微軟、Meta等行業(yè)巨頭正積極擴大采購更高端的NVL72型號服務(wù)器。
    的頭像 發(fā)表于 10-29 10:42 ?1414次閱讀

    天璣9400生成式AI技術(shù)太牛了!打造最強AI體驗

    的天璣9400不僅在AI性能上全面升級,還進一步推動了手機端生成式AI的應(yīng)用與創(chuàng)新。 ? NPU性能稱霸,以最強端側(cè)AI構(gòu)筑“智能體化”堅實基底 首先看天璣9400的
    的頭像 發(fā)表于 10-14 14:06 ?687次閱讀
    天璣9400生成式<b class='flag-5'>AI</b>技術(shù)太牛了!打造<b class='flag-5'>最強</b><b class='flag-5'>AI</b>體驗

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第二章AI for Science的技術(shù)支撐學習心得

    偏見、倫理道德等問題。此外,如何更好地將AI與科學研究人員的傳統(tǒng)工作模式相融合,也是一個亟待解決的問題。未來,隨著技術(shù)的不斷進步和應(yīng)用場景的拓展,AI for Science有望在更多領(lǐng)域發(fā)揮關(guān)鍵作用
    發(fā)表于 10-14 09:16

    最強服務(wù)器CPU來了!AI性能直接翻倍

    以及AI服務(wù)器及AI數(shù)據(jù)中心場景的CPU產(chǎn)品。它不僅能支持廣泛的第三方GPU及AI加速器,與它們組合形成強大的異構(gòu)計算平臺,還能在其中補足GPU或?qū)S眉铀倨鞲采w不到或不足的地方,為更多樣和復(fù)雜的場景提供靈活的算力選擇,并增強整個
    的頭像 發(fā)表于 09-29 11:00 ?1028次閱讀
    <b class='flag-5'>最強</b>服務(wù)器CPU來了!<b class='flag-5'>AI</b>性能直接翻倍

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進行描訴,有利于總結(jié)經(jīng)驗,擬
    發(fā)表于 09-09 15:36

    AI存儲“最強戰(zhàn)力”是怎樣煉成的?

    行業(yè)資訊
    腦極體
    發(fā)布于 :2024年09月02日 20:31:28

    云開發(fā)AI助手

    AI
    草帽王路飛
    發(fā)布于 :2024年07月22日 14:41:54