chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于最近將深度強(qiáng)化學(xué)習(xí)應(yīng)用于迷宮導(dǎo)航的研究

zhKF_jqr_AI ? 來(lái)源:未知 ? 作者:李倩 ? 2018-04-08 09:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在每個(gè)人的童年時(shí)期,我們是如何學(xué)會(huì)記住自己家附近的路的?我們是怎樣學(xué)會(huì)自己去朋友家、學(xué)?;蛘呷バ≠u(mài)部的?在沒(méi)有地圖的情況下,我們可能只是簡(jiǎn)單地記住了某條路長(zhǎng)什么樣,憑記憶引導(dǎo)自己。慢慢地,我們逐漸熟悉了自己的日?;顒?dòng)范圍,就變得有信心了,能知道自己身在何處,并且學(xué)習(xí)了新的更復(fù)雜的道路。偶爾你可能會(huì)迷路,但是憑借某個(gè)標(biāo)志甚至太陽(yáng)你又能找到正確的路。

在非結(jié)構(gòu)化的環(huán)境中導(dǎo)航是智能生物的特有的功能,想要實(shí)現(xiàn)遠(yuǎn)程導(dǎo)航,首先要對(duì)空間進(jìn)行內(nèi)部探索,然后要識(shí)別地標(biāo),同時(shí)還要有強(qiáng)大的視覺(jué)處理能力。基于最近將深度強(qiáng)化學(xué)習(xí)應(yīng)用于迷宮導(dǎo)航的研究,DeepMind的研究人員也提出了一種端到端的深度強(qiáng)化學(xué)習(xí)方法,他們讓智能體在真實(shí)的城市空間中導(dǎo)航,無(wú)需地圖,并且這種方法還能遷移到不同城市環(huán)境。

導(dǎo)航是一項(xiàng)重要的認(rèn)知任務(wù),它能讓人類(lèi)和動(dòng)物在沒(méi)有地圖的情況下,穿越過(guò)一片阡陌縱橫的區(qū)域。這種遠(yuǎn)距離導(dǎo)航可以同時(shí)進(jìn)行自我定位(我在這里)和目標(biāo)表示(我要去那里)。

在Learning to Navigate in Cities Without a Map這篇論文里,我們展示了一種交互式導(dǎo)航環(huán)境,利用第一人稱視角的谷歌街景照片做素材,將其游戲化以訓(xùn)練AI。標(biāo)準(zhǔn)的街景照片,人臉和車(chē)牌都被模糊,無(wú)法識(shí)別。我們建立了一個(gè)基于神經(jīng)網(wǎng)絡(luò)的智能體,學(xué)習(xí)使用視覺(jué)信息在多個(gè)城市中導(dǎo)航。注意,這項(xiàng)研究關(guān)注的是一般導(dǎo)航,而非駕駛導(dǎo)航;我們沒(méi)有使用交通信息,也沒(méi)有對(duì)車(chē)輛控制進(jìn)行建模。

數(shù)據(jù)來(lái)源于真實(shí)街景。從左至右分別為紐約時(shí)代廣場(chǎng)、中央公園和倫敦圣保羅大教堂

當(dāng)智能體達(dá)到目的地時(shí),它就會(huì)獲得獎(jiǎng)勵(lì)(具體來(lái)說(shuō)是一個(gè)經(jīng)緯度坐標(biāo)),就像一個(gè)沒(méi)有地圖的郵遞員,要送無(wú)數(shù)的快遞。隨著時(shí)間的發(fā)展,智能體慢慢學(xué)會(huì)了用這種方法穿越整個(gè)城市。我們同樣證明了智能體可以學(xué)習(xí)多個(gè)城市的道路,并且這種學(xué)習(xí)方法能有效遷移到新的城市中。

在沒(méi)有地圖的情況下學(xué)習(xí)導(dǎo)航

我們不使用傳統(tǒng)的依賴外部映射和探索的傳統(tǒng)方法,而是讓智能體學(xué)習(xí)像人類(lèi)一樣導(dǎo)航,不用地圖、GPS定位或其他輔助工具,只用視覺(jué)觀察。我們創(chuàng)建了一個(gè)神經(jīng)網(wǎng)絡(luò)智能體,向其中輸入在環(huán)境中觀察到的圖像,并預(yù)測(cè)它在該環(huán)境中執(zhí)行的下一項(xiàng)操作。我們使用深度強(qiáng)化學(xué)習(xí)對(duì)其進(jìn)行端到端訓(xùn)練,類(lèi)似最近讓智能體在復(fù)雜的3D迷宮中學(xué)習(xí)導(dǎo)航的研究,以及用無(wú)監(jiān)督輔助方法玩游戲。與迷宮不同,我們利用真實(shí)的城市數(shù)據(jù),例如倫敦、巴黎和紐約的復(fù)雜交叉路口、人行道、隧道和各種城市道路。此外,我們使用的方法可以遷移到不同城市,并可以優(yōu)化導(dǎo)航行為。

模塊化神經(jīng)網(wǎng)絡(luò)

我們智能體的神經(jīng)網(wǎng)絡(luò)包括三個(gè)部分:

能夠處理圖像并提取視覺(jué)特征的卷積網(wǎng)絡(luò);

一個(gè)特定場(chǎng)所的循環(huán)神經(jīng)網(wǎng)絡(luò),在內(nèi)部進(jìn)行對(duì)環(huán)境的記憶并學(xué)習(xí)表示“這里”(智能體的當(dāng)前位置)和“那里”(目標(biāo)位置);

一個(gè)位置不變的循環(huán)網(wǎng)絡(luò),能夠根據(jù)智能體位置的變化進(jìn)行導(dǎo)航。

特定場(chǎng)所的模塊被設(shè)計(jì)成可互換的,并且正如其名,對(duì)于每個(gè)城市都是唯一的,而視覺(jué)模塊和策略模塊是不隨著場(chǎng)景而變換的。

就像谷歌街景的界面一樣,智能體可以在原地打轉(zhuǎn),也可以向前進(jìn)入到下一個(gè)場(chǎng)景。但與谷歌地圖和街景不同的是,智能體看不到小箭頭、局部或全景地圖以及標(biāo)志性的街景小人,它還需要學(xué)習(xí)區(qū)分開(kāi)放道路和人行道。目的地可能是幾公里以外的地方,智能體需要搜索幾百個(gè)全景圖才能到達(dá)。

我們證明了這種方法能提供一種機(jī)制,將導(dǎo)航知識(shí)遷移到新城市中。和人類(lèi)一樣,當(dāng)智能體來(lái)到一個(gè)新城市,我們會(huì)希望它學(xué)習(xí)一組新的地標(biāo),但不必重新學(xué)習(xí)它的視覺(jué)表現(xiàn)或行為(例如,沿著街道向前縮放,或者在交叉路口轉(zhuǎn)向)。因此,使用MultiCity架構(gòu),我們?cè)谠S多城市進(jìn)行首次訓(xùn)練,然后凍結(jié)策略網(wǎng)絡(luò)和視覺(jué)卷積網(wǎng)絡(luò),并在一個(gè)新城市中建立唯一一個(gè)新的特定地區(qū)路徑。這種方法讓智能體在獲取新知識(shí)的同時(shí)不忘之前學(xué)到的東西,類(lèi)似漸進(jìn)式神經(jīng)網(wǎng)絡(luò)架構(gòu)。

學(xué)習(xí)導(dǎo)航是人工智能領(lǐng)域的基礎(chǔ),試圖在智能體中復(fù)制導(dǎo)航功能還可以幫助科學(xué)家了解其生物學(xué)基礎(chǔ)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4829

    瀏覽量

    106828
  • 導(dǎo)航
    +關(guān)注

    關(guān)注

    7

    文章

    570

    瀏覽量

    43726
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49757

    瀏覽量

    261686

原文標(biāo)題:無(wú)需地圖,DeepMind讓智能體在城市中自我導(dǎo)航

文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何訓(xùn)練好自動(dòng)駕駛端到端模型?

    [首發(fā)于智駕最前沿微信公眾號(hào)]最近有位小伙伴在后臺(tái)留言提問(wèn):端到端算法是怎樣訓(xùn)練的?是模仿學(xué)習(xí)強(qiáng)化學(xué)習(xí)和離線強(qiáng)化學(xué)習(xí)這三類(lèi)嗎?其實(shí)端到端(end-to-end)算法在自動(dòng)駕駛、智能體
    的頭像 發(fā)表于 12-08 16:31 ?960次閱讀
    如何訓(xùn)練好自動(dòng)駕駛端到端模型?

    中國(guó)研究發(fā)布新型混合微電網(wǎng)系統(tǒng)

    該系統(tǒng)核心是管理能源的方法。團(tuán)隊(duì)采用調(diào)度框架,多目標(biāo)分布魯棒優(yōu)化(DRO)與實(shí)時(shí)強(qiáng)化學(xué)習(xí)(RL)輔助機(jī)制結(jié)合。能源管理系統(tǒng)(EMS)是運(yùn)行“大腦”,分布式響應(yīng)系統(tǒng)(DRO)生成基準(zhǔn)調(diào)度策略,強(qiáng)化學(xué)習(xí)(RL)模塊實(shí)時(shí)調(diào)整控制信號(hào)
    的頭像 發(fā)表于 11-27 17:05 ?413次閱讀

    今日看點(diǎn):智元推出真機(jī)強(qiáng)化學(xué)習(xí);美國(guó)軟件公司SAS退出中國(guó)市場(chǎng)

    智元推出真機(jī)強(qiáng)化學(xué)習(xí),機(jī)器人訓(xùn)練周期從“數(shù)周”減至“數(shù)十分鐘” ? 近日,智元機(jī)器人宣布其研發(fā)的真機(jī)強(qiáng)化學(xué)習(xí)技術(shù),已在與龍旗科技合作的驗(yàn)證產(chǎn)線中成功落地。據(jù)介紹,此次落地的真機(jī)強(qiáng)化學(xué)習(xí)方案,機(jī)器人
    發(fā)表于 11-05 09:44 ?908次閱讀

    自動(dòng)駕駛中常提的“強(qiáng)化學(xué)習(xí)”是個(gè)啥?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在談及自動(dòng)駕駛時(shí),有些方案中會(huì)提到“強(qiáng)化學(xué)習(xí)(Reinforcement Learning,簡(jiǎn)稱RL)”,強(qiáng)化學(xué)習(xí)是一類(lèi)讓機(jī)器通過(guò)試錯(cuò)來(lái)學(xué)會(huì)做決策的技術(shù)。簡(jiǎn)單理解
    的頭像 發(fā)表于 10-23 09:00 ?340次閱讀
    自動(dòng)駕駛中常提的“<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>”是個(gè)啥?

    NVIDIA Isaac Lab可用環(huán)境與強(qiáng)化學(xué)習(xí)腳本使用指南

    Lab 是一個(gè)適用于機(jī)器人學(xué)習(xí)的開(kāi)源模塊化框架,其模塊化高保真仿真適用于各種訓(xùn)練環(huán)境,Isaac Lab 同時(shí)支持模仿學(xué)習(xí)(模仿人類(lèi))和強(qiáng)化學(xué)習(xí)
    的頭像 發(fā)表于 07-14 15:29 ?1858次閱讀
    NVIDIA Isaac Lab可用環(huán)境與<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>腳本使用指南

    思嵐科技AI工業(yè)機(jī)器人開(kāi)放底盤(pán)Phoebus P350全新發(fā)布:深度學(xué)習(xí)導(dǎo)航+300KG負(fù)載

    工業(yè)4.0時(shí)代,智能搬運(yùn)的“底盤(pán)力”決定效率天花板。 SLAMTEC全新推出 Phoebus P350工業(yè)級(jí)機(jī)器人底盤(pán) ,以 “開(kāi)放AI架構(gòu)+深度學(xué)習(xí)導(dǎo)航” 為核心,融合300KG超強(qiáng)負(fù)載、60cm
    的頭像 發(fā)表于 05-12 11:33 ?787次閱讀
    思嵐科技AI工業(yè)機(jī)器人開(kāi)放底盤(pán)Phoebus P350全新發(fā)布:<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>導(dǎo)航</b>+300KG負(fù)載

    上海光機(jī)所在基于深度時(shí)空先驗(yàn)的動(dòng)態(tài)定量相位成像研究方面取得進(jìn)展

    和PSNR曲線。 近期,中國(guó)科學(xué)院上海光學(xué)精密機(jī)械研究所空天激光技術(shù)與系統(tǒng)部研究團(tuán)隊(duì)提出了一種引入深度時(shí)空先驗(yàn)(STeP)的輕量級(jí)神經(jīng)網(wǎng)絡(luò)架構(gòu),無(wú)需訓(xùn)練集即可應(yīng)用于動(dòng)態(tài)物體的定量相位成
    的頭像 發(fā)表于 04-27 06:23 ?493次閱讀
    上海光機(jī)所在基于<b class='flag-5'>深度</b>時(shí)空先驗(yàn)的動(dòng)態(tài)定量相位成像<b class='flag-5'>研究</b>方面取得進(jìn)展

    18個(gè)常用的強(qiáng)化學(xué)習(xí)算法整理:從基礎(chǔ)方法到高級(jí)模型的理論技術(shù)與代碼實(shí)現(xiàn)

    本來(lái)轉(zhuǎn)自:DeepHubIMBA本文系統(tǒng)講解從基本強(qiáng)化學(xué)習(xí)方法到高級(jí)技術(shù)(如PPO、A3C、PlaNet等)的實(shí)現(xiàn)原理與編碼過(guò)程,旨在通過(guò)理論結(jié)合代碼的方式,構(gòu)建對(duì)強(qiáng)化學(xué)習(xí)算法的全面理解。為確保內(nèi)容
    的頭像 發(fā)表于 04-23 13:22 ?1320次閱讀
    18個(gè)常用的<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>算法整理:從基礎(chǔ)方法到高級(jí)模型的理論技術(shù)與代碼實(shí)現(xiàn)

    詳解RAD端到端強(qiáng)化學(xué)習(xí)后訓(xùn)練范式

    受限于算力和數(shù)據(jù),大語(yǔ)言模型預(yù)訓(xùn)練的 scalinglaw 已經(jīng)趨近于極限。DeepSeekR1/OpenAl01通過(guò)強(qiáng)化學(xué)習(xí)后訓(xùn)練涌現(xiàn)了強(qiáng)大的推理能力,掀起新一輪技術(shù)革新。
    的頭像 發(fā)表于 02-25 14:06 ?1027次閱讀
    詳解RAD端到端<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>后訓(xùn)練范式

    SLAMTEC Aurora:把深度學(xué)習(xí)“卷”進(jìn)機(jī)器人日常

    在人工智能和機(jī)器人技術(shù)飛速發(fā)展的今天,深度學(xué)習(xí)與SLAM(同步定位與地圖構(gòu)建)技術(shù)的結(jié)合,正引領(lǐng)著智能機(jī)器人行業(yè)邁向新的高度。最近科技圈頂流DeepSeek簡(jiǎn)直殺瘋了!靠著逆天的深度
    的頭像 發(fā)表于 02-19 15:49 ?728次閱讀

    軍事應(yīng)用中深度學(xué)習(xí)的挑戰(zhàn)與機(jī)遇

    人工智能尤其是深度學(xué)習(xí)技術(shù)的最新進(jìn)展,加速了不同應(yīng)用領(lǐng)域的創(chuàng)新與發(fā)展。深度學(xué)習(xí)技術(shù)的發(fā)展深刻影響了軍事發(fā)展趨勢(shì),導(dǎo)致戰(zhàn)爭(zhēng)形式和模式發(fā)生重大變化。本文
    的頭像 發(fā)表于 02-14 11:15 ?828次閱讀

    BP神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的關(guān)系

    BP神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)之間存在著密切的關(guān)系,以下是對(duì)它們之間關(guān)系的介紹: 一、BP神經(jīng)網(wǎng)絡(luò)的基本概念 BP神經(jīng)網(wǎng)絡(luò),即反向傳播神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network
    的頭像 發(fā)表于 02-12 15:15 ?1362次閱讀

    淺談適用規(guī)模充電站的深度學(xué)習(xí)有序充電策略

    深度強(qiáng)化學(xué)習(xí)能夠有效計(jì)及電動(dòng)汽車(chē)出行模式和充電需求的不確定性,實(shí)現(xiàn)充電場(chǎng)站充電成本化的目標(biāo)。通過(guò)對(duì)電動(dòng)汽車(chē)泊車(chē)時(shí)間和充電需求特征進(jìn)行提取,建立適用于大規(guī)模電動(dòng)汽車(chē)有序充電的馬爾可夫決策過(guò)程模型,并
    的頭像 發(fā)表于 02-08 15:00 ?820次閱讀
    淺談適用規(guī)模充電站的<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>有序充電策略

    OpenAI發(fā)布深度研究智能體功能

    OpenAI的o3模型提供支持,通過(guò)端到端的強(qiáng)化學(xué)習(xí)訓(xùn)練,實(shí)現(xiàn)了高效、準(zhǔn)確的研究能力。它能夠在5-30分鐘內(nèi)完成一份專業(yè)報(bào)告,大大縮短了研究時(shí)間,提高了研究效率。 該功能由四個(gè)模塊協(xié)同
    的頭像 發(fā)表于 02-05 15:05 ?909次閱讀

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)

    ,逐漸學(xué)習(xí)并優(yōu)化自己的行為,以更好地服務(wù)家庭成員。 目前,具身智能機(jī)器人在解決實(shí)際問(wèn)題中已展現(xiàn)出巨大的潛力,例如它已應(yīng)用于養(yǎng)老、醫(yī)療、災(zāi)害救援等領(lǐng)域。 盡管具身智能已取得了顯著進(jìn)展,但未來(lái)的研究還需要
    發(fā)表于 12-20 19:17