chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

美國陸軍研發(fā)了一種高效的地面機器人學(xué)習(xí)模型

姚小熊27 ? 來源:人工智能實驗室 ? 作者:人工智能實驗室 ? 2021-01-06 09:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

美國陸軍面向未來多域作戰(zhàn)概念研發(fā)了一種高效的地面機器人學(xué)習(xí)模型,該模型提出基于強化學(xué)習(xí)的策略,可有效減少當(dāng)前訓(xùn)練強化學(xué)習(xí)策略的不可預(yù)測性,使自主智能體能夠推理并適應(yīng)不斷變化的戰(zhàn)場條件。

強化學(xué)習(xí)是智能體(Agent)以“試錯”的方式進(jìn)行學(xué)習(xí),通過與環(huán)境進(jìn)行交互獲得的獎賞指導(dǎo)行為,目標(biāo)是使智能體獲得最大的獎賞。強化學(xué)習(xí)技術(shù)具備解決復(fù)雜問題的能力,近年來在如圍棋、象棋和電子游戲等領(lǐng)域有較為長足的發(fā)展。美國陸軍將這種強化學(xué)習(xí)技術(shù)應(yīng)用在地面機器人面臨著兩個巨大挑戰(zhàn)。首先是算法的限制。在強化學(xué)習(xí)中,策略梯度方法(Policy Gradient Methods)是連續(xù)空間可伸縮算法的基礎(chǔ),但是現(xiàn)有技術(shù)無法支持更廣泛的決策目標(biāo),例如風(fēng)險敏感性、安全約束、對先驗知識的探索和發(fā)散。其次就是數(shù)據(jù)量的問題。強化學(xué)習(xí)需要大量的樣本復(fù)雜性,而美國陸軍多域作戰(zhàn)概念和下一代戰(zhàn)斗車輛(NGCV)項目目前數(shù)據(jù)匱乏并不支持現(xiàn)有訓(xùn)練機制。

在陸軍多域作戰(zhàn)概念和NGCV項目中應(yīng)用強化學(xué)習(xí),訓(xùn)練機制必須提高連續(xù)空間中的樣本效率和可靠性,ARL通過將現(xiàn)有的策略搜索方案推廣到通用工具,取得了重要突破。研究人員為通用程序開發(fā)了新的策略搜索方案,并且還確定了其樣本復(fù)雜度。由此產(chǎn)生的策略搜索方案減少了獎勵積累的波動性,形成了對未知領(lǐng)域的有效探索和先驗的機制。值得注意的是,地面機器人獲取數(shù)據(jù)的成本很高。減少獎勵積累的波動性,確保以有效的方式探索未知領(lǐng)域,或者吸收以前的經(jīng)驗,都將有助于打破強化學(xué)習(xí)中現(xiàn)行實踐的樣本效率壁壘。通過減少隨機抽樣的數(shù)量,可以實現(xiàn)策略優(yōu)化。

這項研究為強化學(xué)習(xí)中的經(jīng)典策略梯度定理做出了貢獻(xiàn)。裝備有強化學(xué)習(xí)功能的自主機器人將能夠協(xié)助戰(zhàn)士在未來戰(zhàn)場上進(jìn)行偵察探索和風(fēng)險評估。研究人員下一步計劃在強化學(xué)習(xí)中將更廣泛的決策目標(biāo)納入多主體設(shè)置,并研究強化學(xué)習(xí)主體之間的交互設(shè)置如何在團隊之間產(chǎn)生協(xié)同和對抗性推理。
責(zé)任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    30263

    瀏覽量

    217901
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA開源物理引擎與OpenUSD加速機器人學(xué)習(xí)

    開發(fā)能在工廠、醫(yī)院和公共空間與人類協(xié)同作業(yè)的機器人項巨大的技術(shù)挑戰(zhàn)。這類機器人需具備與人類接近的靈巧性、感知能力、認(rèn)知能力和全身協(xié)調(diào)性,以便于實時應(yīng)對充滿不確定性的真實環(huán)境。
    的頭像 發(fā)表于 10-13 11:15 ?415次閱讀

    NVIDIA 發(fā)布三大利器,推動人形機器人邁向新紀(jì)元

    電子發(fā)燒友網(wǎng)綜合報道 在節(jié)前的機器人學(xué)習(xí)大會(CoRL)上,NVIDIA 發(fā)布了系列突破性技術(shù),包括開源物理引擎 Newton、機器人基礎(chǔ)模型 Isaac GROOT N1.6以及全
    的頭像 發(fā)表于 10-13 04:42 ?4755次閱讀

    NVIDIA展示機器人領(lǐng)域的研究成果

    在今年的機器人科學(xué)與系統(tǒng)會議 (RSS) 上,NVIDIA 研究中心展示了系列推動機器人學(xué)習(xí)的研究成果,展示了在仿真、現(xiàn)實世界遷移和決策制定領(lǐng)域的突破。
    的頭像 發(fā)表于 07-23 10:43 ?916次閱讀

    通過NVIDIA Cosmos模型增強機器人學(xué)習(xí)

    通用機器人的時代已經(jīng)到來,這得益于機械電子技術(shù)和機器人 AI 基礎(chǔ)模型的進(jìn)步。但目前機器人技術(shù)的發(fā)展仍面臨個關(guān)鍵挑戰(zhàn):
    的頭像 發(fā)表于 07-14 11:49 ?571次閱讀
    通過NVIDIA Cosmos<b class='flag-5'>模型</b>增強<b class='flag-5'>機器人學(xué)習(xí)</b>

    構(gòu)建人形機器人學(xué)習(xí)的合成運動生成流程

    通用人形機器人需要能夠快速適應(yīng)現(xiàn)有的以人類為中心的城市和工業(yè)工作空間,處理繁瑣、重復(fù)或體力要求高的任務(wù)。這些移動機器人經(jīng)過設(shè)計,能在以人類為中心的環(huán)境中有出色的表現(xiàn),從工廠車間到醫(yī)療醫(yī)療機構(gòu),它們的價值日益凸顯。
    的頭像 發(fā)表于 04-10 09:36 ?843次閱讀
    構(gòu)建人形<b class='flag-5'>機器人學(xué)習(xí)</b>的合成運動生成流程

    深度解讀英偉達(dá)Newton機器人平臺:技術(shù)革新與跨界生態(tài)構(gòu)建

    的基礎(chǔ)上,它使機器人能夠學(xué)習(xí)如何以更高的精度處理復(fù)雜的任務(wù),與MuJoCo Playground或 NVIDIA Isaac Lab 等學(xué)習(xí)框架兼容,這是個開源的
    的頭像 發(fā)表于 03-20 15:15 ?2206次閱讀
    深度解讀英偉達(dá)Newton<b class='flag-5'>機器人</b>平臺:技術(shù)革新與跨界生態(tài)構(gòu)建

    機器人Blue亮相 搭載英偉達(dá)最新GR00T N1人形機器人通用基礎(chǔ)模型

    GR00T N1以及新的數(shù)據(jù)生成和機器人學(xué)習(xí)框架,我們將共同開啟AI時代的新邊疆?!?黃仁勛還強調(diào)其泛化能力和多任務(wù)執(zhí)行潛力?。 機器人Blue由英偉達(dá)公司、谷歌DeepMind、迪士尼聯(lián)合開發(fā),行走動作流暢自然,聲音設(shè)計可愛,具備擬人化交互表現(xiàn)?很好。?
    的頭像 發(fā)表于 03-20 10:50 ?1547次閱讀
    <b class='flag-5'>機器人</b>Blue亮相 搭載英偉達(dá)最新GR00T N1人形<b class='flag-5'>機器人</b>通用基礎(chǔ)<b class='flag-5'>模型</b>

    AgiBot World Colosseo:構(gòu)建通用機器人智能的規(guī)?;瘮?shù)據(jù)平臺

    數(shù)據(jù)的匱乏,制約了通用操縱能力的突破。上海人工智能實驗室與AgiBot公司聯(lián)合研發(fā)的AgiBot World Colosseo平臺,通過構(gòu)建大規(guī)模、多模態(tài)的真實世界數(shù)據(jù)集與通用政策模型,為機器人學(xué)習(xí)
    的頭像 發(fā)表于 03-12 11:42 ?1522次閱讀
    AgiBot World Colosseo:構(gòu)建通用<b class='flag-5'>機器人</b>智能的規(guī)模化數(shù)據(jù)平臺

    構(gòu)建人形機器人學(xué)習(xí)的合成運動生成管線

    通用人形機器人旨在快速適應(yīng)現(xiàn)有的以人類為中心的城市和工業(yè)工作空間,處理繁瑣、重復(fù)或體力要求高的任務(wù)。這些移動機器人經(jīng)過設(shè)計,能在以人類為中心的環(huán)境中有出色的表現(xiàn),從工廠車間到醫(yī)療保健機構(gòu),它們的價值日益凸顯。
    的頭像 發(fā)表于 01-16 10:58 ?1468次閱讀
    構(gòu)建人形<b class='flag-5'>機器人學(xué)習(xí)</b>的合成運動生成管線

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人模型

    的局限性以及衡量大模型的關(guān)鍵指標(biāo)。閱讀了該部分后,我感受到了一種前所未有的震撼,這種震撼不僅來源于技術(shù)本身的先進(jìn)性,更來源于它對傳統(tǒng)機器人控制方式的顛覆。 傳統(tǒng)機器人的局限性與大
    發(fā)表于 12-29 23:04

    【「具身智能機器人系統(tǒng)」閱讀體驗】1.初步理解具身智能

    工智能 認(rèn)知發(fā)展機器人學(xué) 進(jìn)化機器人學(xué) 物理體現(xiàn)與互動 五、具身智能的現(xiàn)代技術(shù)方向 另外,隨著GPT等大語言模型的發(fā)展,這些技術(shù)也在具身智能機器人領(lǐng)域掀起了
    發(fā)表于 12-28 21:12

    【「具身智能機器人系統(tǒng)」閱讀體驗】1.全書概覽與第學(xué)習(xí)

    非常感謝電子發(fā)燒友提供的這次書籍測評活動!最近,我一直在學(xué)習(xí)模型和人工智能的相關(guān)知識,深刻體會到機器人技術(shù)是個極具潛力的未來方向,甚至可以說是推動時代變革的重要力量。能參與這次活動
    發(fā)表于 12-27 14:50

    《具身智能機器人系統(tǒng)》第7-9章閱讀心得之具身智能機器人與大模型

    醫(yī)療領(lǐng)域,手術(shù)輔助機器人需要毫米級的精確控制,書中有介紹基于視覺伺服的實時控制算法,以及如何利用大模型優(yōu)化手術(shù)路徑規(guī)劃。工業(yè)場景中,協(xié)作機器人面臨的主要挑戰(zhàn)是快速適應(yīng)新工藝流程。具身智能通過在線
    發(fā)表于 12-24 15:03

    【「具身智能機器人系統(tǒng)」閱讀體驗】+初品的體驗

    動態(tài)互動的。 該理論強調(diào)智能行為源于智能體的物理存在和行為能力,智能體必須具備感知環(huán)境并在其中執(zhí)行任務(wù)的能力。具身智能的實現(xiàn)涵蓋了機器學(xué)習(xí)、人工智能、機器人學(xué)、計算機視覺、自然語言處理及強化學(xué)
    發(fā)表于 12-20 19:17

    麻省理工學(xué)院推出新型機器人訓(xùn)練模型

    近日,據(jù)TechCrunch報道,麻省理工學(xué)院的研究團隊展示了一種創(chuàng)新的機器人訓(xùn)練模型,該模型突破了傳統(tǒng)模仿學(xué)習(xí)方法的局限,不再依賴標(biāo)準(zhǔn)數(shù)據(jù)
    的頭像 發(fā)表于 11-04 14:56 ?1155次閱讀