根據(jù)《自然》最新發(fā)表的一項研究,一類增強學習算法在雅達利經(jīng)典游戲中的得分超過了人類玩家和已有的人工智能系統(tǒng)。這類算法被統(tǒng)稱為Go-Explore,它改善了對復雜環(huán)境的探索方式,或有望朝著實現(xiàn)真正智能學習體邁出重要一步。
增強學習可以讓人工智能系統(tǒng)通過探索和理解復雜環(huán)境來進行決策,并學習如何以最優(yōu)的方式獲得獎勵。然而,當遇到很少給予反饋的復雜環(huán)境時,目前的加強學習算法似乎很容易碰壁。
但Go-Explore突破了這些障礙。它可以對環(huán)境進行全面探索,同時構建一個檔案庫來記住它去過的地方,確保自己不會忘記通往有望成功的中期階段或是最終勝利(獎勵)的路線。
利用這類算法,論文作者解決了之前未能解決的2600個雅達利游戲,驗證了這類算法的潛力。作者指出,記住并回到有望成功的探索區(qū)域的簡單原則,是一種強大、通用的探索方法。他們認為論文所報道的算法有望應用于機器人、語言理解和藥物設計。
責任編輯:YYX
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
人工智能
+關注
關注
1817文章
50098瀏覽量
265436 -
學習算法
+關注
關注
0文章
16瀏覽量
7619
發(fā)布評論請先 登錄
相關推薦
熱點推薦
人工智能與機器學習在這些行業(yè)的深度應用
自人工智能和機器學習問世以來,多個在線領域的數(shù)字化格局迎來了翻天覆地的變化。這些技術從誕生之初就為企業(yè)賦予了競爭優(yōu)勢,而在線行業(yè)正是受其影響最為顯著的領域。人工智能(AI)與機器學習(
嵌入式系統(tǒng)中的人工智能
等領域,讓這些領域的設備能夠?qū)崟r學習、適應并做出決策。然而,人工智能的發(fā)展也讓網(wǎng)絡安全威脅愈發(fā)普遍,這些安全隱患必須得到解決。英偉達等科技企業(yè)率先在嵌入式系統(tǒng)中植
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+具身智能芯片
為計算機可以處理的數(shù)字信息。
認知層:
認知層是具身智能的第二層,
負責對數(shù)據(jù)進行處理和分析,以便更好地理解和利用這些數(shù)據(jù)。
包括各種算法和模型,如DNN、神經(jīng)形態(tài)計算、決策樹等。
作
發(fā)表于 09-18 11:45
利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能
的框架小 10 倍,速度也快 10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文中,我們將介紹這對開發(fā)人員意味著什么,以及使用 Neuton 模型如何改進您的開發(fā)和終端
發(fā)表于 08-31 20:54
挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器
和生態(tài)體系帶到使用者身邊 ,讓我們在技術學習和使用上不再受制于人。
三、多模態(tài)實驗,解鎖AI全流程
它嵌入了2D視覺、深度視覺、機械手臂、語音識別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能領域主要
發(fā)表于 08-07 14:30
挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!
和生態(tài)體系帶到使用者身邊 ,讓我們在技術學習和使用上不再受制于人。
三、多模態(tài)實驗,解鎖AI全流程
它嵌入了2D視覺、深度視覺、機械手臂、語音識別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能領域主要
發(fā)表于 08-07 14:23
兆芯攜手合作伙伴在WAIC 2025展示人工智能計算與決策解決方案
2025世界人工智能大會近日在上海盛大開幕。大會期間,兆芯攜手上交智算院、科算云共同呈現(xiàn)了基于自研CPU的人工智能計算與決策解決方案,展現(xiàn)了自主CPU技術與AI應用的融合創(chuàng)新,激發(fā)新質(zhì)生產(chǎn)力的強大活力。
超小型Neuton機器學習模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應用.
Neuton 是一家邊緣AI 公司,致力于讓機器 學習模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文中,我們將介紹
發(fā)表于 07-31 11:38
最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型篇)
在人工智能大模型重塑教育與社會發(fā)展的當下,無論是探索未來職業(yè)方向,還是更新技術儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學術研究的智能工具,大模
發(fā)表于 07-04 11:10
光伏電站智能分析決策的系統(tǒng)化應用工具
光伏電站的智能分析決策,主要是通過數(shù)據(jù)驅(qū)動實現(xiàn)運維優(yōu)化,其流程包含多個環(huán)節(jié),數(shù)據(jù)采集與傳輸以及數(shù)據(jù)處理與分析、智能決策與優(yōu)化等。其中數(shù)據(jù)的采
TDK收購SoftEye,打造智能眼鏡系統(tǒng)實現(xiàn)通過眼球運動與人工智能進行交互
·TDK收購了人工智能/智能眼鏡應用領域的領先技術推動者SoftEye,lnc ? ·通過此次收購,TDK將能夠以更快的速度交付完整的智能眼鏡系統(tǒng),并打造全新的人機界面,實現(xiàn)
維智科技為什么提出時空人工智能
在AI技術突飛猛進的今天,語言、圖像和語音的智能能力不斷突破,但一個更本質(zhì)的問題逐漸顯現(xiàn):人工智能真的理解我們所處的空間世界嗎?從智能城市到商業(yè)選址,從應急調(diào)度到人機交互,AI正走向“
開售RK3576 高性能人工智能主板
,HDMI-4K 輸出,支
持千兆以太網(wǎng),WiFi,USB 擴展/重力感應/RS232/RS485/IO 擴展/I2C 擴展/MIPI 攝像頭/紅外遙控
器等功能,豐富的接口,一個全新八核擁有超強性能的人工智能
發(fā)表于 04-23 10:55
聲智APP通過北京市生成式人工智能服務登記
近日,聲智APP已正式通過北京市第二批生成式人工智能服務登記,成為《生成式人工智能服務管理暫行辦法》(以下簡稱《辦法》)實施以來,北京市累計已完成46款生成式人工智能服務登記中的重要一
增強學習可讓人工智能通過探索和理解來進行決策
評論