chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌大腦的“世界模型”簡述與啟發(fā)

mK5P_AItists ? 來源:lq ? 2019-01-30 09:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摘要:我們的視覺看到什么,部分取決于大腦預(yù)測未來會看到什么。

我們的視覺看到什么,部分取決于大腦預(yù)測未來會看到什么,例如下圖中,如果你預(yù)計要看到突出的球體,那也許你就會看到,如果讓機器也具有了這樣的能力,會帶來什么了?

18年谷歌大腦提出“世界模型”(World Models)可以在復(fù)雜的環(huán)境中通過自我學(xué)習(xí)產(chǎn)生相應(yīng)的策略,例如玩賽車游戲。

下面是世界模型的整體架構(gòu):

整個模型分為3個組件:視覺組件(V),記憶組件(M),控制組件(C)。視覺組件V用來壓縮圖片信息到一個隱變量z上(其實只是一個VAE編碼解碼器):

記憶組件M的輸入是一幀幀的游戲圖片(論文中的一幀圖像似乎叫一個rollout),輸出是預(yù)測下一幀圖像的可能分布,其實就是比一般LSTM更高級一些的MDN-RNN:

最后控制組件C的目標(biāo),就是把前面視覺組件V和記憶組件M的輸出一起作為輸入,并輸出這個時刻智能體agent應(yīng)該做出的動作(action)。

在所謂的“世界模型”,其中的組件模型幾乎沒有是谷歌大腦自己創(chuàng)新研制的。但世界模型會很大提高強化學(xué)習(xí)訓(xùn)練穩(wěn)定性和成績 從而使其與其他強化學(xué)習(xí)相比有一些明顯優(yōu)勢,如下表所示;

世界模型有如下的3個特點

1. 模型拼接得足夠巧妙,這個巧妙的拼接模型做到所謂的世界想象能力,就是模型在學(xué)習(xí)時,自身對環(huán)境假想一個模擬的環(huán)境,甚至可以在沒有環(huán)境訓(xùn)練的情況下,自己想象一個環(huán)境去訓(xùn)練。其實就是我們?nèi)祟愮R像神經(jīng)元的功能。

2. 抓住了一些“強視覺”游戲的“痛點”。記憶組件M中的RNN是生成序列的能手,所以根據(jù)之前游戲圖像再“想象”一些圖像幀應(yīng)該不成問題(RNN生成一些隱變量z,再根據(jù)隱變量z,由視覺組件VAE的decode生成的圖像幀即可)。所以對于“強視覺”的游戲,把RNN的記憶能力用在視覺預(yù)測和控制上是個好主意 。

3不同于我們常見的“不可生”智能算法,例如遺傳算法和進(jìn)化策略只是強調(diào)了基因的“變異”與在解空間中進(jìn)行搜索,神經(jīng)網(wǎng)絡(luò)只是固定網(wǎng)絡(luò)結(jié)構(gòu);而生物界的基因卻可以指導(dǎo)蛋白質(zhì)構(gòu)成并且“生長”。如果基因可以構(gòu)造自身個體,外部環(huán)境和個體情況也可以反過來影響基因,而我們的模型都太固定呆板了,模型結(jié)構(gòu)不能隨內(nèi)部隱變量改進(jìn),當(dāng)然最佳的設(shè)計形式也許誰也不知道。而世界模型做到了讓在內(nèi)部”幻想“的環(huán)境中產(chǎn)生的策略轉(zhuǎn)移到外部世界中。

最后簡單看一下世界模型的訓(xùn)練過程:

world models代碼基于chainer計算框架,步驟如下:

1. 準(zhǔn)備數(shù)據(jù)集,隨機玩游戲生成訓(xùn)練幀(rollouts意思應(yīng)該就是多少幀):

python random_rollouts.py--gameCarRacing-v0 --num_rollouts10000

2. 訓(xùn)練視覺組件V,即前面提到的VAE:

python vision.py--gameCarRacing-v0 --z_dim32--epoch1

3. 訓(xùn)練記憶組件M,即前面提到的RNN:

python model.py--gameCarRacing-v0 --z_dim32--hidden_dim256--mixtures5--epoch20

4. 訓(xùn)練控制組件C,即前面提到的CMA-ES算法(其實就是支持更復(fù)雜輸入和更新的ES):

python controller.py--gameCarRacing-v0 --lambda_64--mu0.25--trials16--target_cumulative_reward900--z_dim32--hidden_dim256--mixtures5--temperature1.0--weights_type1[--cluster_mode]

5. 測試訓(xùn)練結(jié)果:

python test.py--gameCarRacing-v0 --z_dim32--hidden_dim256--mixtures5--temperature1.0--weights_type1--rollouts100[--record]

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6246

    瀏覽量

    110407
  • 機器
    +關(guān)注

    關(guān)注

    0

    文章

    796

    瀏覽量

    41789
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    404

    瀏覽量

    11536

原文標(biāo)題:谷歌大腦的“世界模型”簡述與啟發(fā)

文章出處:【微信號:AItists,微信公眾號:人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    VLA與世界模型有什么不同?

    Language Action,VLA),另一些則致力于構(gòu)建并應(yīng)用世界模型(World Model)。這兩種路徑有什么不同? 什么是VLA,什么是世界模型 先說說VLA。VLA是英文
    的頭像 發(fā)表于 12-17 09:13 ?149次閱讀
    VLA與<b class='flag-5'>世界</b><b class='flag-5'>模型</b>有什么不同?

    構(gòu)建生態(tài)新范式!開源大腦+小腦,地平線發(fā)布兩款具身智能模型

    在2025地平線技術(shù)生態(tài)大會上,地平線創(chuàng)始人兼CEO余凱正式發(fā)布兩大具身智能開源模型——具身智能小腦基座模型HoloMotion和具身智能大腦基座模型HoloBrain。
    的頭像 發(fā)表于 12-16 15:01 ?1w次閱讀
    構(gòu)建生態(tài)新范式!開源<b class='flag-5'>大腦</b>+小腦,地平線發(fā)布兩款具身智能<b class='flag-5'>模型</b>

    世界模型是讓自動駕駛汽車?yán)斫?b class='flag-5'>世界還是預(yù)測未來?

    ? [首發(fā)于智駕最前沿微信公眾號]世界模型在自動駕駛技術(shù)中已有廣泛應(yīng)用。但當(dāng)談及它對自動駕駛的作用時,難免會出現(xiàn)分歧。它到底是讓自動駕駛汽車得以理解世界,還是為其提供了預(yù)測未來的視角? 世界
    的頭像 發(fā)表于 12-16 09:27 ?553次閱讀
    <b class='flag-5'>世界</b><b class='flag-5'>模型</b>是讓自動駕駛汽車?yán)斫?b class='flag-5'>世界</b>還是預(yù)測未來?

    泰凌微:布局端側(cè)AI,產(chǎn)品支持谷歌LiteRT、TVM開源模型

    。 ? 公司發(fā)布的基于TL721X系列芯片的TL-EdgeAI平臺,支持谷歌LiteRT、TVM等開源模型,是目前世界上功耗最低的智能物聯(lián)網(wǎng)連接協(xié)議平臺。其芯片已在谷歌(Google)
    的頭像 發(fā)表于 12-15 08:21 ?8209次閱讀

    Gemini AI 再進(jìn)化:谷歌聯(lián)合XREAL發(fā)布Project Aura, 打開“看見世界”的新能力

    被定位為迄今為止最完整、最接近 Android XR 理想形態(tài)的硬件樣本。作為谷歌官方認(rèn)可的系統(tǒng)級參考硬件,Project Aura 標(biāo)志著 Gemini AI 第一次真正擁有“看見世界”的能力
    發(fā)表于 12-09 11:06 ?1092次閱讀
    Gemini AI 再進(jìn)化:<b class='flag-5'>谷歌</b>聯(lián)合XREAL發(fā)布Project Aura, 打開“看見<b class='flag-5'>世界</b>”的新能力

    谷歌AlphaEarth和維智時空AI大模型的核心差異

    谷歌AlphaEarth和維智時空AI大模型在技術(shù)理念上存在諸多共性,但兩者在目標(biāo)尺度、數(shù)據(jù)來源、技術(shù)實現(xiàn)和應(yīng)用模式上存在顯著差異。
    的頭像 發(fā)表于 10-22 14:50 ?583次閱讀

    谷歌AlphaEarth和維智時空AI大模型的技術(shù)路徑

    谷歌AlphaEarth和維智時空AI大模型在應(yīng)用場景和技術(shù)實現(xiàn)上各有側(cè)重,但兩者在底層技術(shù)理念上存在顯著共性。
    的頭像 發(fā)表于 10-22 14:48 ?682次閱讀

    谷歌DeepMind重磅發(fā)布Genie 3,首次實現(xiàn)世界模型實時交互

    電子發(fā)燒友網(wǎng)綜合報道 當(dāng)?shù)貢r間2025年8月5日,谷歌DeepMind正式推出第三代通用世界模型Genie3。這款被英偉達(dá)科學(xué)家Jim Fan譽為“游戲引擎2.0”的模型,通過單文本提
    的頭像 發(fā)表于 08-13 08:27 ?6564次閱讀

    自動駕駛中常提的世界模型是個啥?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)的不斷成熟,車輛需要在復(fù)雜多變的道路環(huán)境中安全地行駛,這就要求系統(tǒng)不僅能“看見”周圍的世界,還要能“理解”和“推測”未來的變化。世界模型可以被看作一種
    的頭像 發(fā)表于 06-24 08:53 ?836次閱讀
    自動駕駛中常提的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>是個啥?

    世界模型:多模態(tài)融合+因果推理,解鎖AI認(rèn)知邊界

    電子發(fā)燒友網(wǎng)綜合報道 在人工智能的蓬勃發(fā)展進(jìn)程中,世界模型正嶄露頭角,成為推動其邁向更高智能水平的關(guān)鍵力量。世界模型作為 AI 系統(tǒng)對外部世界
    的頭像 發(fā)表于 06-23 04:49 ?3539次閱讀

    谷歌 Gemini 2.0 Flash 系列 AI 模型上新

    谷歌旗下 AI 大模型 Gemini 系列全面上新,正式版 Gemini 2.0 Flash、Gemini 2.0 Flash-Lite 以及新一代旗艦大模型 Gemini 2.0 Pro 實驗
    的頭像 發(fā)表于 02-07 15:07 ?1120次閱讀

    華為、理想、特斯拉、商湯的世界模型是做什么用的

    最近世界模型(World Model)很火,甚至有人說世界模型是終極自動駕駛解決方案,實際上它只是端到端大模型的一種,和VLM沒有本質(zhì)區(qū)別。
    的頭像 發(fā)表于 01-14 09:27 ?1830次閱讀
    華為、理想、特斯拉、商湯的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>是做什么用的

    英偉達(dá)發(fā)布Cosmos世界基礎(chǔ)模型

    近日,在2025年1月6日于拉斯維加斯拉開帷幕的國際消費類電子產(chǎn)品展覽會(CES)上,英偉達(dá)宣布了一項重大創(chuàng)新——Cosmos世界基礎(chǔ)模型平臺。該平臺集成了先進(jìn)的生成世界基礎(chǔ)模型,旨在
    的頭像 發(fā)表于 01-09 10:23 ?959次閱讀

    NVIDIA Cosmos世界基礎(chǔ)模型平臺發(fā)布

    NVIDIA 宣布推出NVIDIA Cosmos,該平臺由先進(jìn)的生成式世界基礎(chǔ)模型、高級 tokenizer、護(hù)欄和加速視頻處理管線組成,將推動自動駕駛汽車(AV)和機器人等物理 AI 系統(tǒng)的發(fā)展。
    的頭像 發(fā)表于 01-08 10:39 ?1067次閱讀

    借助谷歌Gemini和Imagen模型生成高質(zhì)量圖像

    在快速發(fā)展的生成式 AI 領(lǐng)域,結(jié)合不同模型的優(yōu)勢可以帶來顯著的成果。通過利用谷歌的 Gemini 模型來制作詳細(xì)且富有創(chuàng)意的提示,然后使用 Imagen 3 模型根據(jù)這些提示生成高質(zhì)
    的頭像 發(fā)表于 01-03 10:38 ?1384次閱讀
    借助<b class='flag-5'>谷歌</b>Gemini和Imagen<b class='flag-5'>模型</b>生成高質(zhì)量圖像