chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種避免碰撞的算法—GA3C-CADRL分析

ml8z_IV_Technol ? 來源:未知 ? 作者:李倩 ? 2018-05-11 10:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一般來說,在行人間行進的智能體在進行導(dǎo)航時,需要能夠?qū)Ξ斍暗沫h(huán)境做出相應(yīng)的觀察,以避免碰撞,進行下一步動作。在本文中,麻省理工學院航空航天控制實驗室的Michael Everett和 Jonathan P. How教授,以及Oculus Research的Yu Fan Chen教授,提出一種新型避免碰撞的算法—GA3C-CADRL,通過深度強化學習進行模擬訓練,而不需要智能體對其他智能體的動態(tài)行為有所了解,并通過在網(wǎng)絡(luò)的輸入端使用LSTM,使得算法能夠依據(jù)對相鄰智能體的觀察結(jié)果來做出決策,進而選擇下一個動作。

一般來說,在行人之間進行導(dǎo)航的機器人是使用避免碰撞算法(collision avoidance algorithms)來實現(xiàn)安全且高效的操作的。在最近的一些研究中,提出了將深度強化學習算法作為對復(fù)雜的交互和協(xié)作進行建模的框架。然而,當環(huán)境中智能體的數(shù)量增加時,該操作的實現(xiàn)是通過對其他智能體偏離現(xiàn)實的行為的關(guān)鍵性假設(shè)來實現(xiàn)的。這項研究對我們以往的研究方法進行了擴展,開發(fā)出一種算法,該算法可以在各種類型的動態(tài)智能體中學習避免碰撞,而不必假設(shè)它們遵循任何特定的行為規(guī)則。此外,這項研究還引入了一種使用長短期記憶網(wǎng)絡(luò)(LSTM)的策略,該策略使得算法能夠使用任意數(shù)量的其他智能體的觀測值,而不是像以往那些需要具有固定觀測值大小的方法。當智能體的數(shù)量增加時,我們所提出的算法在模擬中的性能表現(xiàn)要優(yōu)于我們以往的方法,并且該算法是在一個沒有使用3D激光雷達的、以人類行走速度行駛的全自動機器車輛上運行得以證明的。

可以這樣說,在行人之間進行導(dǎo)航的機器人將能夠觀察到許多人類行為,例如合作或遺忘。行人不僅能夠移動障礙物,而且還可以不斷地做出機器人只能部分觀察的決策。這項研究解決了在存在其他決策智能體的世界中運行的智能體所面對的避免碰撞問題,特別是考慮到機器人—行人領(lǐng)域。分散式避免碰撞算法的一個基本問題是:智能體所知道和假定的其他智能體的信念狀態(tài)、策略和意圖是什么?如果沒有智能體之間的溝通,這些屬性不是可以直接進行衡量的,但它們可以通過推理得到。

圖1:機器人在行人之間進行導(dǎo)航。機器人使用機載傳感器來感知環(huán)境并運行避免碰撞算法以保持安全和有效的操作。

智能體對其他智能體行為的假設(shè)將會影響其決定采取何種行動。在最簡單的情況下,智能體假設(shè)其他智能體是靜態(tài)的,并且足夠快地進行重新規(guī)劃以避免碰撞。另一種方法是,假定其他智能體是動態(tài)障礙,但速度保持不變。此外,智能體可以假定其智能體是決策制定者,其中,它們的速度可能會隨時根據(jù)已知或未知的策略(決策規(guī)則)進行改變。即使機器人知道行人的決策規(guī)則,但因為其他智能體的意圖是未知的(例如目標目的地),所以也不可能完全預(yù)測其他非溝通的決策智能體(例如行人)將如何響應(yīng)智能體所作出的決策。因此,與其試圖明確預(yù)測其他智能體的行為,最近的研究方法已經(jīng)使用強化學習(RL)來對智能體之間復(fù)雜的相互作用和協(xié)作進行建模。

圖2:LSTM展開以顯示每個輸入。在每個決策步驟中,智能體將一個可觀察的狀態(tài)向量,即每個附近的智能體,依次送入LSTM單元。LSTM單元將相關(guān)信息存儲在隱藏狀態(tài)中,hi。 最終隱藏狀態(tài)hn,將其他智能體的整個狀態(tài)編碼成固定長度的向量,然后饋送到網(wǎng)絡(luò)的前饋部分。智能體的順序是通過減少到自我智能體的距離來進行排序的,以便最近的智能體對hn有近因效應(yīng)(recent effect)。

雖然基于學習的方法已被證明在這個領(lǐng)域內(nèi)具有良好的性能表現(xiàn),但現(xiàn)有方法對其他智能體,如同質(zhì)性或短時間尺度上的特定運動模型做了細微的假設(shè)。在這項研究中,我們對以往的研究方法進行了擴展以學習避免碰撞策略,而不假設(shè)其他智能體遵循任何特定的行為模型。

圖3:網(wǎng)絡(luò)架構(gòu)。附近智能體的的可觀察狀態(tài)被按順序饋送到LSTM中。

避免碰撞的另一項關(guān)鍵挑戰(zhàn)是環(huán)境中其他智能體的數(shù)量有所不同,而在這一領(lǐng)域中使用的前饋神經(jīng)網(wǎng)絡(luò)需要固定維度的輸入。現(xiàn)有的策略明確了網(wǎng)絡(luò)可觀察到的智能體的最大數(shù)量,或使用原始傳感器數(shù)據(jù)作為輸入。本次研究采用自然語言處理的思想,通過在網(wǎng)絡(luò)輸入端使用長短期記憶網(wǎng)路(LSTM)單元,將現(xiàn)實世界中不同的大小狀態(tài)(例如:其他智能體的位置)編碼成固定長度的向量。這使得該算法可以根據(jù)機器人周圍任意數(shù)量的智能體,來做出相應(yīng)的決策。

本次研究的主要貢獻在于:

?我們對避免碰撞的算法做了擴展,使其不必假定其他智能體的行為。

?我們提出了一種策略,使得算法能夠利用任意數(shù)量智能體的觀察結(jié)果。

?我們通過模擬結(jié)果證明了新框架的優(yōu)點。

?在不使用3D激光雷達的情況下,通過在行人間運行的機器人進行了算法演示。

目前,該軟件已經(jīng)作為開源ROS軟件包cadrl_ros發(fā)布。

圖4:機器人硬件。這款緊湊、低成本(<1000美元)的感測套件使用單個2D激光雷達和3個Intel RealSense R200攝像頭。總傳感器和計算組件的高度小于3英寸,為貨物留出足夠的空間。

本次研究提出了一種避免碰撞的算法—GA3C-CADRL,該算法僅通過深度強化學習進行模擬訓練,而不需要對其他智能體的動態(tài)有所了解。此外,我們還提出了一種策略,通過在網(wǎng)絡(luò)的輸入端使用LSTM,使得算法能夠依據(jù)對任意數(shù)量的相鄰智能體的觀察結(jié)果來做出決策進而選擇下一個動作。隨著環(huán)境中智能體數(shù)量的增加,新方法的性能將優(yōu)于現(xiàn)有方法。研究結(jié)果表明,該算法能夠在不被明確執(zhí)行(explicity enforced)的情況下學習問題結(jié)構(gòu),并支持使用LSTM將大量智能體在現(xiàn)實世界中的狀態(tài)編碼為固定長度的表征。新算法在一個小型真實機器人上成功運行,該機器人在不使用3D激光雷達的情況下,可以在保持人類行走速度的同時,在行人之間進行導(dǎo)航。今后的研究將利用本文全新的、更為通用的公式,借助智能體的行為選擇,更為明確地研究信號意圖所帶來的影響。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    31060

    瀏覽量

    222119
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4784

    瀏覽量

    98020
  • 導(dǎo)航
    +關(guān)注

    關(guān)注

    7

    文章

    577

    瀏覽量

    43908
  • 激光雷達
    +關(guān)注

    關(guān)注

    979

    文章

    4465

    瀏覽量

    196466

原文標題:MIT提出使用「深度強化學習」幫助智能體在運動中做出「動作決策」

文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    8常用的CRC算法分享

    CRC 計算單元可按所選擇的算法和參數(shù)配置來生成數(shù)據(jù)流的 CRC 碼。有些應(yīng)用中,可利用 CRC 技術(shù)來驗證數(shù)據(jù)的傳輸和存儲的完整性。 8 常用的 CRC 算法,包括: CRC16_IBM
    發(fā)表于 11-13 07:25

    【道生物聯(lián)TKB-623評估板試用】基于新代 TurMass?無線通信的 TKB-623 塔吊防碰撞系統(tǒng)

    基于新代 TurMass?無線通信的 TKB-623 塔吊防碰撞系統(tǒng)是一種應(yīng)用于建筑施工領(lǐng)域的塔吊安全防護系統(tǒng),該系統(tǒng)利用 TurMass?無線通信技術(shù)的優(yōu)勢,實現(xiàn)了塔吊之間以及塔吊與周邊環(huán)境
    發(fā)表于 11-06 22:19

    復(fù)雜的軟件算法硬件IP核的實現(xiàn)

    源代碼編譯為 HDL 的過程共分為兩步: (1)C to HASM (2)HASM to HDL 第C to HASM 是將 C
    發(fā)表于 10-30 07:02

    國密系列算法簡介及SM4算法原理介紹

    使用了Feistel結(jié)構(gòu)(分組密碼中的一種對稱結(jié)構(gòu)),其中密鑰擴展部分也使用了Feistel結(jié)構(gòu),所以對數(shù)據(jù)和密鑰的處理流程極為相似。下面對SM4加密過程進行闡述: 對于密鑰擴展部分,采用固定參數(shù)FK
    發(fā)表于 10-24 08:25

    加密算法的應(yīng)用

    保證信息傳輸過程中的安全性。只有經(jīng)過特定的解密算法才能還原出原始的明文。因此,加密算法一種保護信息安全的手段。 3. 加密算法的分
    發(fā)表于 10-24 08:03

    AES和SM4算法的可重構(gòu)分析

    、AES和SM4算法特點分析 基于前面幾篇分享,我們對AES和SM4的算法流程有了較為清晰的認識,接下來對AES和SM4算法的共同點進行
    發(fā)表于 10-23 07:26

    3C認證如何辦理,流程是什么

    3C認證(CCC認證,全稱:中國強制性產(chǎn)品認證),是我國政府為保障消費者人身安全、國家安全、環(huán)境保護而實施的一種產(chǎn)品準入制度。凡列入《強制性產(chǎn)品認證目錄》的產(chǎn)品,未取得3C證書、未加貼3C
    的頭像 發(fā)表于 10-21 17:21 ?2237次閱讀
    <b class='flag-5'>3C</b>認證如何辦理,流程是什么

    3c認證怎么辦理

    3C認證(CCC認證,全稱:中國強制性產(chǎn)品認證),是我國政府為保障消費者人身安全、國家安全、環(huán)境保護而實施的一種產(chǎn)品準入制度。 凡列入《強制性產(chǎn)品認證目錄》的產(chǎn)品,未取得3C證書、未加貼3C
    的頭像 發(fā)表于 10-21 16:50 ?2152次閱讀
    <b class='flag-5'>3c</b>認證怎么辦理

    DFT算法與FFT算法的優(yōu)劣分析

    概述 在諧波分析儀中,我們常常提到的兩個詞語,就是DFT算法與FFT算法,那么款功率分析儀/
    的頭像 發(fā)表于 08-04 09:30 ?1383次閱讀

    SPWM波形生成算法分析與實現(xiàn)

    摘要:變頻技術(shù)作為現(xiàn)代電力電子的核心技術(shù),集現(xiàn)代電子、信息和智能技術(shù)于體。而SPW(正弦波脈寬調(diào)制)波的產(chǎn)生和控制則是變頻技術(shù)的核心之。本文對SPI波形生成的三算法-對稱規(guī)則采樣
    發(fā)表于 07-31 13:34

    介紹一種直流過壓保護電路

    本篇博文將詳細分析一種典型的過壓保護電路,探討其工作原理、元件選擇及實際應(yīng)用,幫助大家深入理解如何保護電子設(shè)備。
    的頭像 發(fā)表于 07-05 11:06 ?1430次閱讀
    介紹<b class='flag-5'>一種</b>直流過壓保護電路

    寬調(diào)速范圍低轉(zhuǎn)矩脈動的一種新型內(nèi)置式永磁同步電機的設(shè)計與分析

    摘要:寬調(diào)速范圍與低轉(zhuǎn)矩脈動直是設(shè)計電動汽車用內(nèi)置式永礎(chǔ)同步電機時所追求的重要目標。設(shè)計了一種轉(zhuǎn)子結(jié)構(gòu)為胃的新型內(nèi)置式永礎(chǔ)同步電機,并進行了繞組結(jié)構(gòu)優(yōu)化與性能分析。利用有限元分析法,
    發(fā)表于 06-06 14:13

    電機控制器出現(xiàn)的一種偶發(fā)故障排查與分析

    通信方式傳輸信息,控制器接收總控系統(tǒng)發(fā)出的電機啟動和轉(zhuǎn)速指令,同時向總控系統(tǒng)反饋電機的工作狀態(tài),包括電壓、電流、轉(zhuǎn)速、轉(zhuǎn)向等信息。純分享帖,需要者可點擊附件獲取完整資料~~~*附件:電機控制器出現(xiàn)的一種
    發(fā)表于 04-14 21:32

    一種基于分數(shù)階 PID 直流電機調(diào)速的 AGV 控制系統(tǒng)

    為設(shè)計一種低成本、抗干擾、穩(wěn)定可靠的 AGV,提出一種基于磁帶導(dǎo)航的 AGV 系統(tǒng)。采用 Megawin 公司的80C51單片機為控制核心,以并排對稱設(shè)計的霍爾傳感器實現(xiàn)循跡和糾偏,紅外光
    發(fā)表于 03-25 15:10

    一種以圖像為中心的3D感知模型BIP3D

    在具身智能系統(tǒng)中,3D感知算法個關(guān)鍵組件,它在端側(cè)幫助可以幫助智能體理解環(huán)境信息,在云端可以用來輔助生成3D場景和3D標簽,具備重要的研
    的頭像 發(fā)表于 03-17 13:44 ?1223次閱讀
    <b class='flag-5'>一種</b>以圖像為中心的<b class='flag-5'>3</b>D感知模型BIP<b class='flag-5'>3</b>D