chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌DeepMind重磅發(fā)布Genie 3,首次實現(xiàn)世界模型實時交互

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2025-08-13 08:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)綜合報道 當(dāng)?shù)貢r間2025年8月5日,谷歌DeepMind正式推出第三代通用世界模型Genie3。這款被英偉達(dá)科學(xué)家Jim Fan譽為“游戲引擎2.0”的模型,通過單文本提示即可生成實時交互的720p動態(tài)世界,將世界模擬技術(shù)推向全新高度。

技術(shù)突破:實時交互與超真實模擬

Genie3的核心創(chuàng)新在于首次實現(xiàn)了世界模型的實時交互能力。傳統(tǒng)生成模型需完整處理輸入后輸出結(jié)果,而Genie3采用流式處理架構(gòu),支持每秒24幀的持續(xù)生成,用戶可實時導(dǎo)航并修改生成環(huán)境。這種突破性設(shè)計使模型能即時響應(yīng)用戶輸入,在動態(tài)世界中保持?jǐn)?shù)分鐘的環(huán)境一致性。

在物理模擬層面,Genie3展現(xiàn)出驚人的真實感。模型可精準(zhǔn)呈現(xiàn)水體流動、光影變化等復(fù)雜現(xiàn)象,在佛羅里達(dá)颶風(fēng)場景演示中,系統(tǒng)精確模擬了海浪拍打、棕櫚樹彎曲等細(xì)節(jié),連雨衣的褶皺變化都符合物理規(guī)律。這種深度模擬能力源于對海量視頻數(shù)據(jù)的無監(jiān)督學(xué)習(xí),模型通過110億參數(shù)構(gòu)建起對現(xiàn)實世界的深層理解。

視覺記憶技術(shù)是Genie3的另一大亮點。系統(tǒng)采用自回歸生成機(jī)制,每幀生成時需參考此前所有幀信息。當(dāng)用戶一分鐘后重返某地,模型能準(zhǔn)確還原之前生成的物體狀態(tài),建筑物左側(cè)的樹木在整個交互過程中始終保持一致。這種"涌現(xiàn)能力"使生成的世界更具沉浸感,遠(yuǎn)超依賴3D表示的傳統(tǒng)方法。

可提示的世界事件功能為模型注入動態(tài)靈魂。用戶可通過文本指令改變天氣、引入新物體,甚至創(chuàng)造反事實場景。在威尼斯汽船演示中,系統(tǒng)不僅重現(xiàn)了運河的逼真倒影,還能根據(jù)指令添加貢多拉船和水上出租車,這種靈活性使Genie3超越單純的環(huán)境生成,成為真正的交互式創(chuàng)作平臺。

應(yīng)用革命:從游戲開發(fā)到具身智能

在游戲產(chǎn)業(yè),Genie3正引發(fā)創(chuàng)作范式的根本變革。傳統(tǒng)3D游戲開發(fā)需數(shù)月構(gòu)建場景,而Genie3通過單張圖片和文本描述即可生成可交互的虛擬世界。在面包房任務(wù)演示中,系統(tǒng)為通用智能體SIMA創(chuàng)建了包含工業(yè)攪拌機(jī)、冷卻架的復(fù)雜環(huán)境,智能體通過發(fā)送導(dǎo)航指令即可完成任務(wù)學(xué)習(xí)。這種能力不僅縮短開發(fā)周期,更可能催生《我的世界》級別的開放世界游戲革命。

機(jī)器人訓(xùn)練領(lǐng)域迎來突破性進(jìn)展。DeepMind已將Genie3與Gemini Robotics模型結(jié)合,為機(jī)械臂和雙足機(jī)器人創(chuàng)建多樣化訓(xùn)練場景。在物流分揀測試中,系統(tǒng)生成的動態(tài)環(huán)境包含隨機(jī)障礙物和突發(fā)狀況,使機(jī)器人能在接近真實的風(fēng)險條件下完成策略學(xué)習(xí)。這種訓(xùn)練方式相比傳統(tǒng)方法效率提升300%,且無需實體設(shè)備支持。

自動駕駛模擬同樣受益匪淺。Genie3可生成包含極端天氣的駕駛場景,系統(tǒng)能根據(jù)指令隨時引入行人、動物等突發(fā)因素。在暴雨場景測試中,模型不僅模擬了路面反光和水花飛濺,還能通過世界事件功能制造輪胎打滑等意外狀況,為自動駕駛算法提供前所未有的訓(xùn)練數(shù)據(jù)。
教育領(lǐng)域的應(yīng)用前景同樣廣闊。歷史教師可通過文本提示重現(xiàn)古羅馬斗獸場,學(xué)生能在虛擬場景中自由探索;地理課堂可生成實時演變的火山噴發(fā)模型,配合可提示的世界事件功能,讓學(xué)生直觀理解地質(zhì)變化規(guī)律。這種沉浸式學(xué)習(xí)體驗,正重新定義教育技術(shù)的可能性邊界。

盡管Genie3已實現(xiàn)重大突破,仍存在三大技術(shù)瓶頸:智能體行動空間受限,復(fù)雜多智能體交互模擬不足,地理精度無法完美復(fù)現(xiàn)現(xiàn)實世界。DeepMind研究團(tuán)隊透露,下一代模型將重點突破這些限制,計劃通過分層強(qiáng)化學(xué)習(xí)擴(kuò)展行動維度,引入社會規(guī)范約束提升多智能體交互真實度。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    成都匯陽投資關(guān)于大模型白熱化,應(yīng)用加速分化

    Gemini 2.5 Flash Image登頂 多主流圖像榜,Meta 也從 Midjourney 授權(quán) AI 圖像模型;視頻領(lǐng)域,阿里字節(jié)等刷新能力高度 ,谷歌將視頻模型推進(jìn)至實時
    的頭像 發(fā)表于 09-09 09:30 ?497次閱讀

    商湯大裝置重磅發(fā)布多項標(biāo)志性成果

    在2025世界人工智能大會(WAIC 2025)期間,作為“最懂大模型的AI基礎(chǔ)設(shè)施”,商湯大裝置重磅發(fā)布多項標(biāo)志性成果,持續(xù)打造AI基礎(chǔ)設(shè)施發(fā)展新范式,力推動產(chǎn)業(yè)生態(tài)與應(yīng)用場景的系統(tǒng)
    的頭像 發(fā)表于 08-05 10:07 ?736次閱讀

    廣和通發(fā)布自研端側(cè)語音識別大模型FiboASR

    7月,全球領(lǐng)先的無線通信模組及AI解決方案提供商廣和通,發(fā)布其自主研發(fā)的語音識別大模型FiboASR。該模型專為端側(cè)設(shè)備上面臨的面對面實時對話及多人會議場景深度優(yōu)化,在低延遲語音
    的頭像 發(fā)表于 08-04 11:43 ?1186次閱讀

    德賽西威與面壁智能發(fā)布端側(cè)大模型語音交互方案

    日前,全球領(lǐng)先的移動出行科技公司德賽西威與端側(cè)大模型技術(shù)領(lǐng)軍企業(yè)面壁智能共同發(fā)布業(yè)界首個基于高通座艙平臺(SA8255P,簡稱8255)的端側(cè)大模型語音交互方案,這是雙方自2024年1
    的頭像 發(fā)表于 05-14 17:40 ?908次閱讀

    軟通計算機(jī)重磅發(fā)布DeepSeek大模型一體機(jī)產(chǎn)品

    3月20日,華為中國合作伙伴大會2025在深圳盛大啟幕。大會上,軟通計算機(jī)重磅發(fā)布了“DeepSeek大模型一體機(jī)產(chǎn)品”,為用戶提供一站式的AI應(yīng)用算力平臺,讓大
    的頭像 發(fā)表于 03-22 10:40 ?1214次閱讀
    軟通計算機(jī)<b class='flag-5'>重磅</b><b class='flag-5'>發(fā)布</b>DeepSeek大<b class='flag-5'>模型</b>一體機(jī)產(chǎn)品

    DeepSeek發(fā)表重磅論文!推出NSA技術(shù),讓AI模型降本增效

    這是自1月20日DeepSeek發(fā)布R1模型震撼AI圈以來,DeepSeek首次發(fā)布的技術(shù)動態(tài)。
    的頭像 發(fā)表于 02-19 10:22 ?1951次閱讀
    DeepSeek發(fā)表<b class='flag-5'>重磅</b>論文!推出NSA技術(shù),讓AI<b class='flag-5'>模型</b>降本增效

    谷歌加速AI部門整合:AI Studio團(tuán)隊并入DeepMind

    近日,谷歌正緊鑼密鼓地推進(jìn)其人工智能(AI)部門的整合工作。據(jù)谷歌AI Studio主管Logan Kilpatrick在領(lǐng)英頁面上的透露,谷歌已將AI Studio團(tuán)隊整體轉(zhuǎn)移至DeepMi
    的頭像 發(fā)表于 01-13 14:40 ?980次閱讀

    英偉達(dá)發(fā)布Cosmos世界基礎(chǔ)模型

    近日,在2025年1月6日于拉斯維加斯拉開帷幕的國際消費類電子產(chǎn)品展覽會(CES)上,英偉達(dá)宣布了一項重大創(chuàng)新——Cosmos世界基礎(chǔ)模型平臺。該平臺集成了先進(jìn)的生成世界基礎(chǔ)模型,旨在
    的頭像 發(fā)表于 01-09 10:23 ?841次閱讀

    望獲實時Linux系統(tǒng)與大語言模型深度融合,開創(chuàng)實時智能無限可能!

    控制領(lǐng)域,大語言模型能夠顯著提升控制系統(tǒng)的智能化水平,確保實時性的同時實現(xiàn)高質(zhì)量的人機(jī)交互,為具身機(jī)器人、智能駕駛等對實時性和智能化有強(qiáng)烈需
    的頭像 發(fā)表于 01-08 13:44 ?900次閱讀

    NVIDIA Cosmos世界基礎(chǔ)模型平臺發(fā)布

    NVIDIA 宣布推出NVIDIA Cosmos,該平臺由先進(jìn)的生成式世界基礎(chǔ)模型、高級 tokenizer、護(hù)欄和加速視頻處理管線組成,將推動自動駕駛汽車(AV)和機(jī)器人等物理 AI 系統(tǒng)的發(fā)展。
    的頭像 發(fā)表于 01-08 10:39 ?851次閱讀

    巨人網(wǎng)絡(luò)發(fā)布“千影QianYing”有聲游戲生成大模型

    模型YingSound。 YingGame是巨人網(wǎng)絡(luò)AI Lab與清華大學(xué)SATLab攜手研發(fā)的成果,專為開放世界游戲設(shè)計。該模型首次實現(xiàn)
    的頭像 發(fā)表于 12-13 09:59 ?977次閱讀

    谷歌發(fā)布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名為“深度研究”的新特性,旨在為用戶提供更加全面和深入的復(fù)雜主題探索與報告撰寫輔助。 Gemini 2.0通過高級推理和長上
    的頭像 發(fā)表于 12-12 10:13 ?850次閱讀

    Google DeepMind發(fā)布Genie 2:打造交互3D虛擬世界

    在OpenAI宣布即將發(fā)布模型和新功能后,Google DeepMind也不甘落后,于近日推出了大型基礎(chǔ)世界模型——
    的頭像 發(fā)表于 12-05 14:16 ?1462次閱讀

    Waymo利用谷歌Gemini大模型,研發(fā)端到端自動駕駛系統(tǒng)

    10月31日訊,自動駕駛領(lǐng)域的先鋒Waymo,作為Alphabet旗下的一員,長久以來將其與谷歌DeepMind的緊密合作及深厚的AI研究底蘊視為其在自動駕駛競賽中脫穎而出的關(guān)鍵。如今,Waymo再
    的頭像 發(fā)表于 10-31 16:55 ?2150次閱讀

    谷歌計劃12月發(fā)布Gemini 2.0模型

    近日,有消息稱谷歌計劃在12月發(fā)布其下一代人工智能模型——Gemini 2.0。這一消息引發(fā)了業(yè)界的廣泛關(guān)注,因為谷歌在人工智能領(lǐng)域一直保持著領(lǐng)先地位,而Gemini系列
    的頭像 發(fā)表于 10-29 11:02 ?1312次閱讀