chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌DeepMind重磅發(fā)布了基礎(chǔ)世界模型:Genie(精靈)

vliwulianw ? 來(lái)源:軟件質(zhì)量報(bào)道 ? 2024-02-28 10:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大家都喜歡玩游戲吧?因?yàn)橛螒蜃畲蟮奈κ亲屛覀兲颖墁F(xiàn)實(shí)、幻想一個(gè)遠(yuǎn)離我們眼前現(xiàn)實(shí)的世界,掌控這個(gè)虛擬的現(xiàn)實(shí)世界?,F(xiàn)在,我們可以想象一下,如果我們有能力創(chuàng)造自己的世界,那該多好了。 讓我們激動(dòng)的這一天來(lái)了! 北美時(shí)間26號(hào)下午,GoogleGenie團(tuán)隊(duì)的負(fù)責(zé)人Tim Rockt?schel非常興奮地宣布:Google DeepMindOpen Endedness團(tuán)隊(duì)開(kāi)發(fā)的基于互聯(lián)網(wǎng)視頻訓(xùn)練的基礎(chǔ)世界模型(foundation world model)——Genie

(幽靈)發(fā)布了,它可以根據(jù)圖像提示生成無(wú)窮無(wú)盡的可控動(dòng)作2D世界的各種變化。這個(gè)110億參數(shù)大模型Genie,能從一張圖片就能創(chuàng)造出可玩的虛擬世界,動(dòng)作可控,這也預(yù)示著,AI已經(jīng)真正殺到視頻游戲領(lǐng)域了。

084845f0-d5db-11ee-a297-92fbcf53809c.png

0853455e-d5db-11ee-a297-92fbcf53809c.png

什么是Genie(精靈)?

根據(jù) Google DeepMind 的官方博客文章,Genie 是一個(gè)基礎(chǔ)世界模型,它是根據(jù)來(lái)自互聯(lián)網(wǎng)的視頻進(jìn)行訓(xùn)練的。該模型可以“從合成圖像、照片甚至草圖中生成無(wú)窮無(wú)盡的可玩(動(dòng)作可控)世界”。 研究論文 “Genie:Generative Interactive Environments” 指出,Genie是第一個(gè)從未標(biāo)記的互聯(lián)網(wǎng)視頻中以無(wú)監(jiān)督方式訓(xùn)練的生成式交互式環(huán)境。在大小方面,Genie 的參數(shù)為 11B,由時(shí)空視頻標(biāo)記器(spatiotemporal videotokenizer)、自回歸動(dòng)力學(xué)模型(autoregressive dynamics model)和簡(jiǎn)單且可擴(kuò)展的潛在動(dòng)作模型(simple and scalable latent action model)組成。

這些技術(shù)規(guī)范允許 Genie 在生成的環(huán)境中逐幀運(yùn)行,即使在沒(méi)有訓(xùn)練、標(biāo)注或任何其他特定領(lǐng)域要求的情況下也是如此。

Genie 能做什么的?

根據(jù)這篇研究論文,Genie是一種新型的生成式人工智能,它使任何人(甚至是兒童)都能夢(mèng)想并進(jìn)入類(lèi)似于人類(lèi)設(shè)計(jì)的模擬環(huán)境的生成世界。可以提示 Genie 生成一組不同的交互式和可控環(huán)境,盡管它是在純視頻數(shù)據(jù)上訓(xùn)練的。

簡(jiǎn)而言之,我們已經(jīng)看到了許多生成式 AI 模型,它們使用語(yǔ)言、圖像甚至視頻生成創(chuàng)意內(nèi)容。Genie 是一個(gè)突破,因?yàn)樗梢詮膯蝹€(gè)圖像提示中創(chuàng)建可玩的環(huán)境。

試著記住《哈利·波特與魔法石》中哈利和他的朋友們?cè)谇巴裉m芬多公共休息室的路上進(jìn)入霍格沃茨城堡的場(chǎng)景。年輕的學(xué)生們看到一面墻上掛滿(mǎn)了畫(huà)作,每個(gè)角色都在他們的畫(huà)面中慢慢地移動(dòng),這些畫(huà)作栩栩如生。Genie能使靜止圖像栩栩如生,賦予我們一個(gè)自己的世界。

根據(jù) Google DeepMind 的說(shuō)法,Genie 可以收到它從未見(jiàn)過(guò)的圖像提示,這包括現(xiàn)實(shí)世界的照片、草圖,允許人們與他們想象的虛擬世界互動(dòng),這就是稱(chēng)之為“基礎(chǔ)世界模型”。在培訓(xùn)方面,研究論文強(qiáng)調(diào),他們更關(guān)注2D平臺(tái)游戲和機(jī)器人技術(shù)的視頻。Genie 使用通用方法進(jìn)行訓(xùn)練,使其能夠在任何類(lèi)型的域上運(yùn)行,并且可以擴(kuò)展到更大的 Internet 數(shù)據(jù)集。

為什么Genie很重要?

Genie 的突出之處在于它能夠從互聯(lián)網(wǎng)視頻中學(xué)習(xí)和重現(xiàn)游戲中角色的控制。這是值得注意的,因?yàn)榛ヂ?lián)網(wǎng)視頻沒(méi)有關(guān)于視頻中執(zhí)行的動(dòng)作的標(biāo)簽,甚至沒(méi)有關(guān)于應(yīng)該控制圖像的哪一部分的標(biāo)簽。

Google 博客文章寫(xiě)道:“Genie不僅可以學(xué)習(xí)觀(guān)察的哪些部分通常是可控的,還可以推斷出在生成的環(huán)境中一致的各種潛在行為。請(qǐng)注意,相同的潛在動(dòng)作如何在不同的提示圖像中產(chǎn)生相似的行為,“ 根據(jù) Google DeepMind 的說(shuō)法,該模型最獨(dú)特的方面是:它允許您從單個(gè)圖像創(chuàng)建一個(gè)全新的交互式環(huán)境。這開(kāi)辟了許多可能性,尤其是創(chuàng)建和進(jìn)入虛擬世界的新方法。為了證明這一點(diǎn),研究人員使用文本到圖像模型Imagen 2創(chuàng)建了一個(gè)圖像,然后將其用作創(chuàng)建虛擬世界的提示。草圖也可以做同樣的事情。

有了 Genie,任何人都可以創(chuàng)建自己完全想象的虛擬世界。此外,該模型學(xué)習(xí)和開(kāi)發(fā)新世界模型的能力標(biāo)志著向通用人工智能代理(一個(gè)獨(dú)立的程序或?qū)嶓w,通過(guò)傳感器感知其周?chē)h(huán)境來(lái)與環(huán)境交互)的重大飛躍。 開(kāi)啟另一個(gè)旅程:




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6238

    瀏覽量

    109851
  • 人工智能
    +關(guān)注

    關(guān)注

    1811

    文章

    49506

    瀏覽量

    258337
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3351

    瀏覽量

    4728

原文標(biāo)題:基礎(chǔ)世界模型Google Genie誕生了:根據(jù)提示生成無(wú)窮無(wú)盡的、可交互的2D世界

文章出處:【微信號(hào):軟件質(zhì)量報(bào)道,微信公眾號(hào):軟件質(zhì)量報(bào)道】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    中科曙光助力紫東太初4.0大模型重磅發(fā)布

    近日,全球首個(gè)“深度推理+多模態(tài)”大模型——“紫東太初”4.0在2025東湖國(guó)際人工智能高峰論壇上正式發(fā)布。中科曙光作為核心生態(tài)伙伴,依托中國(guó)首個(gè)AI計(jì)算開(kāi)放架構(gòu),為“紫東太初”4.0提供圖文多模態(tài)模型訓(xùn)推、大語(yǔ)言
    的頭像 發(fā)表于 09-24 09:33 ?310次閱讀

    谷歌DeepMind重磅發(fā)布Genie 3,首次實(shí)現(xiàn)世界模型實(shí)時(shí)交互

    電子發(fā)燒友網(wǎng)綜合報(bào)道 當(dāng)?shù)貢r(shí)間2025年8月5日,谷歌DeepMind正式推出第三代通用世界模型Genie3。這款被英偉達(dá)科學(xué)家Jim Fa
    的頭像 發(fā)表于 08-13 08:27 ?6336次閱讀

    商湯大裝置重磅發(fā)布多項(xiàng)標(biāo)志性成果

    在2025世界人工智能大會(huì)(WAIC 2025)期間,作為“最懂大模型的AI基礎(chǔ)設(shè)施”,商湯大裝置重磅發(fā)布多項(xiàng)標(biāo)志性成果,持續(xù)打造AI基礎(chǔ)設(shè)施發(fā)展新范式,力推動(dòng)產(chǎn)業(yè)生態(tài)與應(yīng)用場(chǎng)景的系統(tǒng)
    的頭像 發(fā)表于 08-05 10:07 ?737次閱讀

    愛(ài)芯元智重磅發(fā)布邊緣計(jì)算戰(zhàn)略

    近日,愛(ài)芯元智在2025世界人工智能大會(huì)上重磅發(fā)布邊緣計(jì)算戰(zhàn)略。展會(huì)現(xiàn)場(chǎng)匯聚了眾多行業(yè)精英,共同見(jiàn)證愛(ài)芯元智邊緣計(jì)算與AI融合發(fā)展的新路徑,為AI普惠美好生活擘畫(huà)新的藍(lán)圖。
    的頭像 發(fā)表于 08-01 10:45 ?907次閱讀

    三張圖深入分析京東開(kāi)源Genie的8大亮點(diǎn)

    京東開(kāi)源的Genie智能體的8大亮點(diǎn): 可插拔多Agent和多種工具 迭代式規(guī)劃 跨任務(wù)上下文和文件共享 數(shù)字員工提升用戶(hù)體驗(yàn) 大模型+搜索構(gòu)建深度搜素 CodeTool構(gòu)建智能代碼生命周期管理 精心打磨的System Prompt 可配置的MCP Server 審核編輯
    的頭像 發(fā)表于 07-27 12:40 ?301次閱讀
    三張圖深入分析京東開(kāi)源<b class='flag-5'>Genie</b>的8大亮點(diǎn)

    genie nano c2020無(wú)法顯示畫(huà)面

    一開(kāi)始顯示“the packet size may be too large for the network setup”后面減小了數(shù)據(jù)包大小,沒(méi)有報(bào)錯(cuò),但是點(diǎn)擊grab之后沒(méi)有畫(huà)面 NI MAX和labview都試過(guò)了,換另外一個(gè)鏡頭就有畫(huà)面,genie nano c2020應(yīng)該沒(méi)有壞,請(qǐng)問(wèn)是為什么呢
    發(fā)表于 04-16 14:19

    軟通計(jì)算機(jī)重磅發(fā)布DeepSeek大模型一體機(jī)產(chǎn)品

    3月20日,華為中國(guó)合作伙伴大會(huì)2025在深圳盛大啟幕。大會(huì)上,軟通計(jì)算機(jī)重磅發(fā)布“DeepSeek大模型一體機(jī)產(chǎn)品”,為用戶(hù)提供一站式的AI應(yīng)用算力平臺(tái),讓大
    的頭像 發(fā)表于 03-22 10:40 ?1217次閱讀
    軟通計(jì)算機(jī)<b class='flag-5'>重磅</b><b class='flag-5'>發(fā)布</b>DeepSeek大<b class='flag-5'>模型</b>一體機(jī)產(chǎn)品

    谷歌加速AI部門(mén)整合:AI Studio團(tuán)隊(duì)并入DeepMind

    近日,谷歌正緊鑼密鼓地推進(jìn)其人工智能(AI)部門(mén)的整合工作。據(jù)谷歌AI Studio主管Logan Kilpatrick在領(lǐng)英頁(yè)面上的透露,谷歌已將AI Studio團(tuán)隊(duì)整體轉(zhuǎn)移至DeepMi
    的頭像 發(fā)表于 01-13 14:40 ?983次閱讀

    英偉達(dá)發(fā)布Cosmos世界基礎(chǔ)模型

    近日,在2025年1月6日于拉斯維加斯拉開(kāi)帷幕的國(guó)際消費(fèi)類(lèi)電子產(chǎn)品展覽會(huì)(CES)上,英偉達(dá)宣布一項(xiàng)重大創(chuàng)新——Cosmos世界基礎(chǔ)模型平臺(tái)。該平臺(tái)集成了先進(jìn)的生成世界基礎(chǔ)
    的頭像 發(fā)表于 01-09 10:23 ?845次閱讀

    NVIDIA Cosmos世界基礎(chǔ)模型平臺(tái)發(fā)布

    NVIDIA 宣布推出NVIDIA Cosmos,該平臺(tái)由先進(jìn)的生成式世界基礎(chǔ)模型、高級(jí) tokenizer、護(hù)欄和加速視頻處理管線(xiàn)組成,將推動(dòng)自動(dòng)駕駛汽車(chē)(AV)和機(jī)器人等物理 AI 系統(tǒng)的發(fā)展。
    的頭像 發(fā)表于 01-08 10:39 ?851次閱讀

    Meta重磅發(fā)布Llama 3.3 70B:開(kāi)源AI模型的新里程碑

    ?在人工智能領(lǐng)域,Meta的最新動(dòng)作再次引起了全球的關(guān)注。今天,我們見(jiàn)證Meta發(fā)布的 Llama 3.3 70B 模型,這是一個(gè)開(kāi)源的人工智能模型,它不僅令人印象深刻,而且在性能上
    的頭像 發(fā)表于 12-18 16:46 ?789次閱讀
    Meta<b class='flag-5'>重磅</b><b class='flag-5'>發(fā)布</b>Llama 3.3 70B:開(kāi)源AI<b class='flag-5'>模型</b>的新里程碑

    谷歌發(fā)布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名為“深度研究”的新特性,旨在為用戶(hù)提供更加全面和深入的復(fù)雜主題探索與報(bào)告撰寫(xiě)輔助。 Gemini 2.0通過(guò)高級(jí)推理和長(zhǎng)上
    的頭像 發(fā)表于 12-12 10:13 ?851次閱讀

    Google DeepMind發(fā)布Genie 2:打造交互式3D虛擬世界

    在OpenAI宣布即將發(fā)布模型和新功能后,Google DeepMind也不甘落后,于近日推出了大型基礎(chǔ)世界模型——
    的頭像 發(fā)表于 12-05 14:16 ?1465次閱讀

    Waymo利用谷歌Gemini大模型,研發(fā)端到端自動(dòng)駕駛系統(tǒng)

    10月31日訊,自動(dòng)駕駛領(lǐng)域的先鋒Waymo,作為Alphabet旗下的一員,長(zhǎng)久以來(lái)將其與谷歌DeepMind的緊密合作及深厚的AI研究底蘊(yùn)視為其在自動(dòng)駕駛競(jìng)賽中脫穎而出的關(guān)鍵。如今,Waymo再
    的頭像 發(fā)表于 10-31 16:55 ?2152次閱讀

    谷歌計(jì)劃12月發(fā)布Gemini 2.0模型

    近日,有消息稱(chēng)谷歌計(jì)劃在12月發(fā)布其下一代人工智能模型——Gemini 2.0。這一消息引發(fā)了業(yè)界的廣泛關(guān)注,因?yàn)?b class='flag-5'>谷歌在人工智能領(lǐng)域一直保持著領(lǐng)先地位,而Gemini系列
    的頭像 發(fā)表于 10-29 11:02 ?1318次閱讀