chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

<meter id="pqj6e"></meter>

<meter id="pqj6e"></meter>

<button id="pqj6e"></button>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復(fù)

查看更多

查看更多

查看更多

VIP于到期續(xù)費

登錄后你可以

下載海量資料
學(xué)習(xí)在線課程
觀看技術(shù)視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認識你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

谷歌大腦的“世界模型”簡述與啟發(fā)

摘要：我們的視覺看到什么，部分取決于大腦預(yù)測未來會看到什么。

我們的視覺看到什么，部分取決于大腦預(yù)測未來會看到什么，例如下圖中，如果你預(yù)計要看到突出的球體，那也許你就會看到，如果讓機器也具有了這樣的能力，會帶來什么了？

18年谷歌大腦提出“世界模型”(World Models)可以在復(fù)雜的環(huán)境中通過自我學(xué)習(xí)產(chǎn)生相應(yīng)的策略，例如玩賽車游戲。

下面是世界模型的整體架構(gòu):

整個模型分為3個組件：視覺組件（V），記憶組件（M），控制組件（C）。視覺組件V用來壓縮圖片信息到一個隱變量z上（其實只是一個VAE編碼解碼器）：

記憶組件M的輸入是一幀幀的游戲圖片（論文中的一幀圖像似乎叫一個rollout），輸出是預(yù)測下一幀圖像的可能分布，其實就是比一般LSTM更高級一些的MDN-RNN：

最后控制組件C的目標(biāo)，就是把前面視覺組件V和記憶組件M的輸出一起作為輸入，并輸出這個時刻智能體agent應(yīng)該做出的動作（ac tion）。

在所謂的“世界模型”，其中的組件模型幾乎沒有是谷歌大腦自己創(chuàng)新研制的。但世界模型會很大提高強化學(xué)習(xí)訓(xùn)練穩(wěn)定性和成績從而使其與其他強化學(xué)習(xí)相比有一些明顯優(yōu)勢，如下表所示;

世界模型有如下的3個特點

1. 模型拼接得足夠巧妙，這個巧妙的拼接模型做到所謂的世界想象能力，就是模型在學(xué)習(xí)時，自身對環(huán)境假想一個模擬的環(huán)境，甚至可以在沒有環(huán)境訓(xùn)練的情況下，自己想象一個環(huán)境去訓(xùn)練。其實就是我們?nèi)祟愮R像神經(jīng)元的功能。

2. 抓住了一些“強視覺”游戲的“痛點”。記憶組件M中的RNN是生成序列的能手，所以根據(jù)之前游戲圖像再“想象”一些圖像幀應(yīng)該不成問題（RNN生成一些隱變量z，再根據(jù)隱變量z，由視覺組件VAE的decode生成的圖像幀即可）。所以對于“強視覺”的游戲，把RNN的記憶能力用在視覺預(yù)測和控制上是個好主意。

3不同于我們常見的“不可生”智能算法，例如遺傳算法和進化策略只是強調(diào)了基因的“變異”與在解空間中進行搜索，神經(jīng)網(wǎng)絡(luò)只是固定網(wǎng)絡(luò)結(jié)構(gòu)；而生物界的基因卻可以指導(dǎo)蛋白質(zhì)構(gòu)成并且“生長”。如果基因可以構(gòu)造自身個體，外部環(huán)境和個體情況也可以反過來影響基因，而我們的模型都太固定呆板了，模型結(jié)構(gòu)不能隨內(nèi)部隱變量改進，當(dāng)然最佳的設(shè)計形式也許誰也不知道。而世界模型做到了讓在內(nèi)部”幻想“的環(huán)境中產(chǎn)生的策略轉(zhuǎn)移到外部世界中。

最后簡單看一下世界模型的訓(xùn)練過程：

world models代碼基于chainer計算框架，步驟如下:

1. 準(zhǔn)備數(shù)據(jù)集，隨機玩游戲生成訓(xùn)練幀（rollouts意思應(yīng)該就是多少幀）：

python random_rollouts.py--gameCarRacing-v0 --num_rollouts10000

2. 訓(xùn)練視覺組件V，即前面提到的VAE：

python vision.py--gameCarRacing-v0 --z_dim32--epoch1

3. 訓(xùn)練記憶組件M，即前面提到的RNN：

python model.py--gameCarRacing-v0 --z_dim32--hidden_dim256--mixtures5--epoch20

4. 訓(xùn)練控制組件C，即前面提到的CMA-ES算法（其實就是支持更復(fù)雜輸入和更新的ES）：

python controller.py--gameCarRacing-v0 --lambda_64--mu0.25--trials16--target_cumulative_reward900--z_dim32--hidden_dim256--mixtures5--temperature1.0--weights_type1[--cluster_mode]

5. 測試訓(xùn)練結(jié)果：

python test.py--gameCarRacing-v0 --z_dim32--hidden_dim256--mixtures5--temperature1.0--weights_type1--rollouts100[--record]

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

谷歌

谷歌

+關(guān)注

關(guān)注
27

文章
6254

瀏覽量
111326
機器

機器

+關(guān)注

關(guān)注
0

文章
798

瀏覽量
41869
智能體

智能體

+關(guān)注

關(guān)注
1

文章
467

瀏覽量
11604

原文標(biāo)題：谷歌大腦的“世界模型”簡述與啟發(fā)

文章出處：【微信號：AItists，微信公眾號：人工智能學(xué)家】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

評論

精選推薦
更多

文章

資料

帖子

步進控制的光柵尺全閉環(huán)EtherCAT運動控制器ZMC432CL-V2快速入門：二維螺距補償(下)

正運動技術(shù)
15小時前

1339 閱讀

地平線HSD賦能iCAR V27：超強算力+真一段式端到端，定義硬派SUV智駕標(biāo)桿

章鷹觀察
16小時前

854 閱讀

如何在邊緣AI應(yīng)用場景中實現(xiàn)高性能、低功耗推理（上）

RA生態(tài)工作室
17小時前

1086 閱讀

基于XILINX Vivado平臺的GTX收發(fā)器的開發(fā)

FPGA設(shè)計論壇
17小時前

1025 閱讀

瑞薩RA系列FSP庫開發(fā)實戰(zhàn)指南之QSPI讀寫外部Flash芯片實驗

瑞薩嵌入式小百科
18小時前

1068 閱讀

GSM網(wǎng)絡(luò)小區(qū)參數(shù)ISSUE

liuxin
1.31 MB

免費

53下載

MSP430和nRF905的塔吊無線遙控系統(tǒng)

0.18 MB

免費

6下載

MSVC-STL MSVC的C++標(biāo)準(zhǔn)庫實現(xiàn)

李芳
6.36 MB

2積分

1下載

J ACE Arcade控制編碼器

萬航渡路
0.07 MB

免費

0下載

基于LM386芯片的聲音探測器

陳鍵
0.26 MB

2積分

9下載

RDMA設(shè)計47：雙邊語義驗證

xianuser2012
2天前

437 閱讀

飛凌嵌入式ElfBoard-進程之什么是進程

jf_13411809
2天前

873 閱讀

RDMA設(shè)計46：RoCE v2原語功能：單邊語義

xianuser2012
3天前

851 閱讀

基于STM32F103C8T6的智能超聲波測距尺：從原理到代碼的完整實現(xiàn)

jf_51201288
4天前

1801 閱讀

《Altium Designeder 25電路設(shè)計精講實踐》SAM V71章節(jié)有感

HXM1539
5天前

1749 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

電子發(fā)燒友

My ElecFans

APP
網(wǎng)站地圖

設(shè)計技術(shù)

可編程邏輯

電源/新能源

MEMS/傳感技術(shù)

測量儀表

嵌入式技術(shù)

制造/封裝

模擬技術(shù)

RF/無線

接口/總線/驅(qū)動

處理器/DSP

EDA/IC設(shè)計

存儲技術(shù)

光電顯示

EMC/EMI設(shè)計

連接器

行業(yè)應(yīng)用

LEDs

汽車電子

音視頻及家電

通信網(wǎng)絡(luò)

醫(yī)療電子

人工智能

虛擬現(xiàn)實

可穿戴設(shè)備

機器人

安全設(shè)備/系統(tǒng)

軍用/航空電子

移動通信

工業(yè)控制

便攜設(shè)備

觸控感測

物聯(lián)網(wǎng)

智能電網(wǎng)

區(qū)塊鏈

新科技

特色內(nèi)容

專欄推薦

學(xué)院

設(shè)計資源

設(shè)計技術(shù)

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術(shù)文章

產(chǎn)品地圖

品牌地圖

社區(qū)

小組

論壇

問答

評測試用

企業(yè)服務(wù)

產(chǎn)品

資料

文章

方案

企業(yè)

供應(yīng)鏈服務(wù)

硬件開發(fā)

媒體服務(wù)

網(wǎng)站廣告

在線研討會

活動策劃

新聞發(fā)布

新品發(fā)布

小測驗

設(shè)計大賽

電子發(fā)燒友

關(guān)于我們

聯(lián)系我們

舉報投訴

社交網(wǎng)絡(luò)

微博

移動端

發(fā)燒友APP

WAP

聯(lián)系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內(nèi)容合作

張迎輝：mikezhang@elecfans.com

關(guān)注我們的微信

下載發(fā)燒友APP

電子發(fā)燒友觀察

版權(quán)所有 ? 長沙勒克斯教育咨詢有限公司

湖南省長沙市開福區(qū)月湖街道匍園路20號聚恒科技園1棟2301-1房
電子發(fā)燒友 （電路圖） 湘公網(wǎng)安備43011202000918 工商網(wǎng)監(jiān) 湘ICP備2023036445號-105-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费