chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在NVIDIA Isaac Lab中訓練四足機器人運動

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2024-09-06 14:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

由于涉及復雜的動力學,為四足機器人制定有效的運動策略是機器人領(lǐng)域面臨的重大挑戰(zhàn)。在現(xiàn)實世界中訓練四足機器人上下樓梯可能會損壞設(shè)備和環(huán)境,因此,在學習過程中,仿真器在確保安全和消除時間限制方面都發(fā)揮著關(guān)鍵作用。

利用深度強化學習(RL)在仿真環(huán)境中訓練機器人,這樣可以更有效、更安全地執(zhí)行復雜任務。然而,這種方法帶來了一個新的挑戰(zhàn):如何確保在仿真環(huán)境中訓練的策略能夠無縫地切換到現(xiàn)實世界。換句話說,我們?nèi)绾慰s小仿真與現(xiàn)實之間的差距?

要縮小仿真與現(xiàn)實之間的差距,需要一個高保真、基于物理的訓練仿真器、一臺高性能 AI 計算機(如 NVIDIA Jetson)以及一個具有關(guān)節(jié)級控制能力的機器人。強化學習研究工具包是波士頓動力公司、NVIDIA 和波士頓動力人工智能研究所合作開發(fā)的,它整合了上述能力,實現(xiàn)了四足機器人從虛擬世界到現(xiàn)實世界的無縫部署。它包括 Spot 四足機器人的關(guān)節(jié)級控制 API(用于控制機器人如何運動)、NVIDIA Jetson AGX Orin 有效載荷運行策略所需的安裝硬件(AGX Orin 單獨出售),以及在 NVIDIA Isaac Lab 中為 Spot 提供的仿真環(huán)境。

Isaac Lab 是一個基于 NVIDIA Isaac Sim 平臺開發(fā)的輕量級參考應用程序,專為大規(guī)模機器人學習進行了優(yōu)化。它利用 GPU 并行化進行大規(guī)模物理并行仿真,以提高最終的策略效果,并減少機器人強化學習的訓練時間。憑借其高保真物理和域隨機化功能,Isaac Lab 彌合了仿真與現(xiàn)實的差距,使經(jīng)過訓練的模型能夠通過零樣本無縫部署到物理機器人上。要了解更多信息,請參閱NVIDIA Isaac Sim 4.0 和 NVIDIA Isaac Lab 為機器人工作流和仿真提供強大助力。

本文解釋了如何在 Isaac Sim 和 Isaac Lab 中為 Spot 四足機器人創(chuàng)建運動強化學習策略,并使用強化學習研究工具包中的組件在硬件上部署。

在 Isaac Lab 中

訓練四足機器人運動

本章節(jié)介紹了如何在 Isaac Lab 中訓練運動強化學習策略。

wKgZombapeuAeDXoAAFOgDp1hYI227.jpg

圖 1. 從 Isaac Sim 到 Isaac Lab的

運動策略訓練框架工作流

目標

訓練 Spot 機器人在平地上走動時,去追蹤目標 x、y 和偏航基本速度。

觀察和行動空間

目標速度在每次重置時都會隨機分配,并與圖 1 所示的其他觀察結(jié)果一起提供。行動空間僅包括 12 個自由度關(guān)節(jié)位置,這些位置作為參考關(guān)節(jié)位置傳遞給底層關(guān)節(jié)控制器

域隨機化

在關(guān)鍵訓練階段,對各種參數(shù)進行隨機化處理,如隨機化參數(shù)下的圖 1 所示。這些隨機化有助于模型確?,F(xiàn)實世界部署的魯棒性,這個過程被稱為域隨機化。

網(wǎng)絡(luò)架構(gòu)和強化學習算法的詳情

運動策略被構(gòu)建成一個具有三層的多層感知器(MLP),包含 [512、156、128] 個神經(jīng)元,并使用 RSL-rl 的近端策略優(yōu)化(PPO)算法進行訓練,該算法針對 GPU 計算進行了優(yōu)化。

必備條件

要想訓練運動策略,您需要:

配備 NVIDIA RTX GPU 的系統(tǒng)。詳細的最低規(guī)格,請參閱 Isaac Sim 文檔。

NVIDIA Isaac Sim、Isaac Lab 和 RSL-rl。

使用

本章節(jié)展示了如何訓練策略、回放策略和檢查結(jié)果。

訓練一個策略

cd 
./isaaclab.sh-psource/standalone/workflows/rsl_rl/train.py--taskIsaac-Velocity-Flat-Spot-v0--num_envs4096--headless--video--enable_cameras

--video--enable_cameras 參數(shù)記錄了智能體在訓練過程中的行為視頻,它是可選的。

播放經(jīng)過訓練的策略

該步驟將播放經(jīng)過訓練的模型,并將 .pt 策略導出到日志目錄下導出文件夾中的 .onnx 中。

cd 
./isaaclab.sh-psource/standalone/workflows/rsl_rl/play.py--taskIsaac-Velocity-Flat-Spot-v0--num_envs64

結(jié)果

視頻 1 演示了在 Spot 機器人上執(zhí)行經(jīng)過訓練的策略。機器人能夠通過跟蹤目標 x、y 和偏航速度在平地上行走。通過 4096 個環(huán)境和 15000 次迭代,相當于在 NVIDIA RTX GPU 上大約 4 小時的訓練時間,我們實現(xiàn)了每秒 85000 到 95000 幀(FPS)的訓練速度。

視頻 1. 經(jīng)過訓練的策略在 Isaac Lab

仿真的 Spot 機器人上進行了測試

使用 Jetson Orin 在 Spot 機器人

上部署經(jīng)過訓練的強化學習策略

將經(jīng)過仿真訓練的模型部署到機器人應用的現(xiàn)實世界中會帶來一些挑戰(zhàn),包括實時控制、安全約束和其他現(xiàn)實世界的條件。Isaac Lab 具有精確的物理和域隨機化功能,使其能夠?qū)⒎抡姝h(huán)境中訓練的策略部署到基于 Jetson Orin 零樣本的真實 Spot 機器人上,從而在虛擬和現(xiàn)實世界中實現(xiàn)類似的性能。

圖 2 顯示了真實的 Spot 機器人框架策略部署,將策略神經(jīng)網(wǎng)絡(luò)加載到實際機器人上并進行推理。與仿真中相同的觀察結(jié)果是使用波士頓動力的 State API 來計算的。

wKgZombapgSAMvIcAAEZ6hKJw2o335.jpg

圖 2. 真實 Spot 機器人框架策略部署

將訓練好的模型轉(zhuǎn)移到 Spot 機器人需要將模型部署到邊緣,并低延遲、高頻率地控制機器人。NVIDIA Jetson AGX Orin 的高性能計算能力和低延遲 AI 處理確保了快速的推理和響應,這對現(xiàn)實世界的機器人應用至關(guān)重要。仿真的策略可以直接部署并進行推理,簡化了部署流程。

必備條件

部署時需要:

Spot 機器人與 Jetson Orin 連接,并配置為使用以太網(wǎng)端口、電源線和安裝支架的自定義有效載荷,按照所提供的安裝說明進行操作。

Spot 強化學習研究工具包中的部署代碼和 Spot Python SDK。

通過藍牙連接到 Jetson Orin 的 PS4 游戲手柄控制器。

外部 PC 通過 SSH 進入 Jetson 并運行代碼。

來自 Isaac Lab 的經(jīng)過訓練的模型和配置文件。

Jetson Orin 上的硬件和網(wǎng)絡(luò)設(shè)置

在配備 Ubuntu 22.04 的外部 PC 上安裝 SDK Manager。

按照“如何使用 SDK Manager 對 L4T BSP 進行刷新”的說明,使用 SDK Manager,將配備 JetPack 6 的 Jetson Orin 進行刷新。完成后重新啟動。

把 Jetson Orin 連接到顯示器端口、鍵盤和鼠標。

使用步驟 2 中設(shè)置的用戶名和密碼登錄 Jetson Orin。

為了實現(xiàn) Jetson Orin 和 Spot 之間的通信,請手動設(shè)置 Jetson Orin 上以太網(wǎng)端口的有線網(wǎng)絡(luò)配置,并閱讀有關(guān)選擇 IP 地址的說明。

a) 進入 Settings -> Network -> Wired -> + 在 IPv4(Routes)下添加信息:地址 – Jetson IP 地址(選擇 192.168.50.5)、 網(wǎng)絡(luò)掩碼 – 255.255.255.0,和默認網(wǎng)關(guān) -192.168.50.3。

b) 點擊“Add”按鈕。

wKgaombaphaAfYPiAABamUm4Ioc991.png

圖 3. Spot 的 Jetson Orin 有線網(wǎng)絡(luò)配置

Jetson 上的軟件設(shè)置

首先,將仿真中的訓練策略從 .pt 轉(zhuǎn)換為 .onnx 格式,并導出環(huán)境配置。這是在訓練 PC 上完成的。

cd 
./isaac_lab.sh-psource/standalone/workflows/rsl_rl/play.py--taskIsaac-Velocity-Flat-Spot-v0

結(jié)果將在該模型的訓練日志目錄中的導出文件夾中,該文件夾包含 env_cfg.json 和 .onnx 文件。

在訓練 PC 上創(chuàng)建一個文件夾,并將 env.yaml 文件和 .onnx 文件復制到該文件夾中。請注意:env.yaml 在 params 文件夾中,.onnx 文件在訓練日志目錄的導出文件夾中。

在訓練 PC 上使用 SSH,將步驟 1 中的文件夾復制到 Jetson Orin。確保 PC 和 Jetson 處在同一網(wǎng)絡(luò),比如 Spot 本地 wifi。在 PC 的終端上運行以下命令:

scp-P20022-r/path/to/folder/*orinusername@network_IP:

接下來,在 Orin 的終端上從主目錄運行以下命令:

mkdir spot-rl-deployment && cd spot-rl-deployment && mkdir models 
git clone https://github.com/boston-dynamics/spot-rl-example.git 
cd spot-rl-example && mkdir external && cd external && mkdir spot_python_sdk

下載具有聯(lián)合級 API 的 Spot Python SDK,并將內(nèi)容解壓縮到步驟 3 中的 spot_python_sdk 文件夾中。

安裝部署代碼需要的東西:

cd ~/spot-rl-deployment/spot-rl-example
sudo apt update
sudo apt install python3-pip
cd external/spot_python_sdk/prebuilt
pip3 install bosdyn_api-4.0.0-py3-none-any.whl
pip3 install bosdyn_core-4.0.0-py3-none-any.whl
pip3 install bosdyn_client-4.0.0-py3-none-any.whl
pip3 install pygame
pip3 install pyPS4Controller
pip3 install spatialmath-python
pip3 install onnxruntime

把 env.yaml 文件轉(zhuǎn)換為 env_cfg.json 文件:

cd ~/spot-rl-deployment/spot-rl-example/python/utils/
python env_convert.py 
#input the path to the .yaml file e.g ~/env.yaml
#Thefileoutputsaenv_cfg.jsonfileinthesamedirectoryasthe.yamlfile

將步驟 6 中的 env_cfg.json 和步驟 2 中經(jīng)過訓練的模型 policy.onnx 文件移動到 models 文件夾中:

mv env_cfg.json policy.onnx ~/spot-rl-deployment/models

運行策略

1. 啟動 Spot,然后按下機器人背面的電機鎖定按鈕,并確保 Jetson Orin 已通電。

wKgaombapiiAG22HAAaaInQ6XI4759.png

圖 4. Spot 的背面

2. 在 Spot 平板電腦控制器上打開 Spot 應用。選擇一個機器人,按照提示登錄并操作 Spot。確保從平板電腦解除控制以運行策略:打開“Motor Status”菜單(電源圖標),導航到高級設(shè)置,然后選擇“Release Control”。

3. 將 PC 連接到 Spot 本地 wifi,并從終端通過 SSH 連接到 Orin。Spot 將端口 20022 轉(zhuǎn)發(fā)到其有效載荷,以便可以打開與 Spot IP 和該端口的 SSH 連接來訪問 Orin。IPv4 地址 192.168.50.3 是 Spot 的 IP 地址。

ssh @ -p 20022 
e.g
ssh @192.168.50.3 -p 20022

4. 使用 bluetoothctl 把無線游戲手柄連接到 Orin:

bluetoothctl
scan on  // wait for devices populate ~5s
scan off
devices

在列出的設(shè)備中找到游戲手柄的 Mac 地址。將游戲手柄置于配對模式,按住“Select”和“PlayStation”按鈕約 5 秒,然后繼續(xù)使用 bluetoothctl。如果在完成后續(xù)步驟之前退出了配對模式,您可能需要重復此過程。

trust {MAC} 
pair {MAC} 
connect {MAC} 
exit

5. 運行強化學習策略:

cd ~/spot-rl-deployment/spot-rl-example/python
pythonspot_rl_demo.py~/spot-rl-deployment/models--gamepad-config./gamepad_config.json

根據(jù)提示輸入 Spot 的用戶名和密碼。Spot 將保持不變,但在按下回車鍵之前,策略不會控制它。現(xiàn)在,您可以使用游戲手柄驅(qū)動機器人。再次按下回車鍵,讓 Spot 關(guān)閉并退出。 6. 使用 PS4 游戲手柄進行控制。

wKgaombapjiAZOErAAQ0Xfe1wpQ873.png

圖 5. 用戶可以使用游戲手柄控制 Spot 機器人

如游戲手柄圖所示,使用左操縱桿進行 x、y 移動,使用右操縱桿進行旋轉(zhuǎn)。請注意,使用另一個游戲手柄(如 PS5 手柄)將需要不同的軸映射。axis_mapping 是指基于 pygame 的軸索引。

來自 ~/spot-rl-deployment/spot-rl-example/python/utils/test_controller.py 的腳本 test_controller.py 可用來打印每個軸的值,以確定不同手柄的恰當映射。

7. 使用游戲手柄配置選項來運行策略:

pythonspot_rl_demo.py~/spot-rl-deployment/models--gamepad-config/home/gamepad_config.json

視頻 2 展示了經(jīng)過仿真訓練后真實的 Spot 機器人的運行情況。

視頻 2. Spot 機器人根據(jù) NVIDIA Isaac Lab 的訓練行走

開始開發(fā)您的自定義應用

Spot 強化學習研究套件中提供的代碼庫是您在仿真環(huán)境中創(chuàng)建自定義強化學習任務并將其部署到硬件上的起點。為了開發(fā)自定義應用,您可以通過添加自己的機器人模型、環(huán)境、獎勵函數(shù)、課程學習、域隨機化等,來修改和擴展當前的代碼庫。

請參閱文檔了解有關(guān)如何使用 Isaac Lab 為特定任務訓練策略的詳細指導。在其他機器人上部署經(jīng)過訓練的策略是專屬于該機器人架構(gòu)的;但是,如果應用需要進行額外的觀察,Spot 用戶則可以修改當前的部署代碼

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5513

    瀏覽量

    109200
  • 仿真器
    +關(guān)注

    關(guān)注

    14

    文章

    1049

    瀏覽量

    86821
  • AI
    AI
    +關(guān)注

    關(guān)注

    90

    文章

    38414

    瀏覽量

    297708
  • 四足機器人
    +關(guān)注

    關(guān)注

    1

    文章

    96

    瀏覽量

    15656

原文標題:消除仿真與現(xiàn)實之間的差距:使用 NVIDIA Isaac Lab 訓練 Spot 四足機器人運動

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA Isaac Lab可用環(huán)境與強化學習腳本使用指南

    NVIDIA Isaac Sim 是一款基于 NVIDIA Omniverse 構(gòu)建的參考應用,使開發(fā)者能夠基于物理的虛擬環(huán)境模擬和測試
    的頭像 發(fā)表于 07-14 15:29 ?1935次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Isaac</b> <b class='flag-5'>Lab</b>可用環(huán)境與強化學習腳本使用指南

    什么是龍機器人?

    機器人是一種仿生機器人,由Openduino控制板控制,有條腿,每條腿兩個自由度,由兩
    發(fā)表于 03-24 16:17

    仿生機器人

    本帖最后由 紅塵。破 于 2016-8-19 14:59 編輯 今天整理資料時發(fā)現(xiàn)了一年前做的仿生機器人,當時買了一個仿生
    發(fā)表于 08-19 14:59

    機器人

    `這是創(chuàng)客集結(jié)號的作品機器人身體和都是通過3D打印技術(shù)打印出來的,通過自己安裝連接上超聲波傳感器,制作成功的
    發(fā)表于 09-29 09:55

    機器人的機構(gòu)設(shè)計

    機器人屬于復雜機電系統(tǒng),需要綜合生物、機械、電子、控制等學科內(nèi)容,具體涉及仿生機構(gòu)設(shè)計、靈巧運動機構(gòu)設(shè)計、高性能驅(qū)動器制造,行走穩(wěn)定性控制、強化學習等在內(nèi)的多個研究方向。其中,機構(gòu)
    發(fā)表于 09-15 06:54

    如何完整的組裝機器人?

    如何完整的組裝機器人?
    發(fā)表于 09-24 07:00

    NVIDIA AI機器人開發(fā)— NVIDIA Isaac Sim入門

    NVIDIA 最新公開課來了,本次將圍繞用于開發(fā)和訓練智能機器人的模擬平臺—— NVIDIA Isaac Sim 。
    的頭像 發(fā)表于 10-19 15:58 ?2756次閱讀

    CES | 用 NVIDIA Isaac Sim 2022.2 模擬未來智能機器人

    NVIDIA 宣布推出? NVIDIA Isaac Sim ?的 ?2022.2 版本 。作為機器人仿真和 合成數(shù)據(jù) 生成( SDG )工具,該?
    的頭像 發(fā)表于 01-06 22:30 ?1818次閱讀

    使用 NVIDIA Isaac 仿真并定位 Husky 機器人

    如何使用 ROS 2 Husky 官方軟件包將該機器人導入 NVIDIA Isaac Sim 并創(chuàng)建仿真。 本 Demo 的 Husky 機器人
    的頭像 發(fā)表于 12-26 18:05 ?3156次閱讀
    使用 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Isaac</b> 仿真并定位 Husky <b class='flag-5'>機器人</b>

    堅米智能借助NVIDIA Isaac Lab加速機器人開發(fā)

    堅米智能(中堅科技)借助NVIDIA Isaac Lab平臺,通過NVIDIA Isaac Sim的 3D 生成與建模技術(shù)構(gòu)建高度逼真的虛擬
    的頭像 發(fā)表于 12-29 14:01 ?2167次閱讀

    NVIDIA Isaac Sim與NVIDIA Isaac Lab的更新

    COMPUTEX 2025 上,NVIDIA 宣布了機器人仿真參考應用 NVIDIA Isaac Sim 和
    的頭像 發(fā)表于 05-28 10:06 ?1802次閱讀

    NVIDIA Isaac Sim和Isaac Lab現(xiàn)已推出早期開發(fā)者預覽版

    NVIDIA 發(fā)布了機器人仿真參考應用 Isaac Sim 和機器人學習框架 Isaac Lab
    的頭像 發(fā)表于 07-04 14:23 ?1529次閱讀

    NVIDIA Isaac Lab多GPU多節(jié)點訓練指南

    NVIDIA Isaac Lab 是一個適用于機器人學習的開源統(tǒng)一框架,基于 NVIDIA Isaac
    的頭像 發(fā)表于 09-23 17:15 ?2054次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Isaac</b> <b class='flag-5'>Lab</b>多GPU多節(jié)點<b class='flag-5'>訓練</b>指南

    如何在NVIDIA Isaac Lab中使用Newton訓練機器人

    物理機器人仿真中發(fā)揮著至關(guān)重要的作用,它為機器人在真實環(huán)境的行為及交互提供了精準的虛擬呈現(xiàn)基礎(chǔ)。借助仿真器,研究人員和工程師能夠以安全、高效且經(jīng)濟的方式
    的頭像 發(fā)表于 10-13 11:10 ?1607次閱讀
    如何在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Isaac</b> <b class='flag-5'>Lab</b>中使用Newton<b class='flag-5'>訓練</b><b class='flag-5'>四</b><b class='flag-5'>足</b><b class='flag-5'>機器人</b>

    NVIDIA Isaac Lab推動機器人技術(shù)突破

    Isaac LabIsaac Gym 的替代版本,該框架已將 GPU 原生機器人仿真擴展至大規(guī)模多模態(tài)學習的全新領(lǐng)域。Isaac
    的頭像 發(fā)表于 10-21 11:20 ?965次閱讀