chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

教機(jī)器用計(jì)算機(jī)視覺閱讀樂高手冊(cè)

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:Michelle Horton ? 2022-10-11 09:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

樂高愛好者抓撓他們的頭,閱讀組裝說(shuō)明,可能很快有助于復(fù)雜的建設(shè),感謝一個(gè)新的 學(xué)習(xí) 來(lái)自斯坦福大學(xué)、麻省理工學(xué)院和 Autodesk 。研究人員設(shè)計(jì)了一個(gè)深度學(xué)習(xí)框架,將 2D 手冊(cè)翻譯成機(jī)器可以理解的步驟,以構(gòu)建 3D 樂高套件。這項(xiàng)工作可以推動(dòng)專注于制造機(jī)器的研究,幫助人們組裝物體。

“樂高手冊(cè)提供了一個(gè)獨(dú)立的環(huán)境,展示了人類的一項(xiàng)核心技能:在指導(dǎo)下學(xué)習(xí)完成任務(wù)。利用視覺場(chǎng)景解析和程序合成的最新進(jìn)展,我們旨在構(gòu)建具有類似技能的機(jī)器,從樂高開始,最終以現(xiàn)實(shí)世界場(chǎng)景為目標(biāo),”該研究資深作者吳家軍說(shuō),斯坦福大學(xué)計(jì)算機(jī)科學(xué)助理教授。

研究人員表示,用人工智能翻譯 2D 手冊(cè)面臨兩大挑戰(zhàn)。首先, AI 必須基于 2D 手動(dòng)圖像在每個(gè)裝配步驟中學(xué)習(xí)和理解 3D 形狀之間的對(duì)應(yīng)關(guān)系。這包括考慮工件的方向和對(duì)齊。

它還必須能夠?qū)Υu塊進(jìn)行分類,并在半組裝模型中推斷出磚塊的三維姿態(tài)。作為樂高積木制作過程的一部分,小部件被組合成更大的部件,如吉他的頭部、頸部和身體。當(dāng)這些較大的部分組合在一起時(shí),將創(chuàng)建一個(gè)完整的項(xiàng)目。這增加了難度,因?yàn)闄C(jī)器必須解析出所有的樂高積木,甚至是那些可能不可見的積木,如樂高釘和反積木。

該團(tuán)隊(duì)致力于創(chuàng)建一個(gè)模型,該模型可以將 2D 手冊(cè)轉(zhuǎn)化為機(jī)器可執(zhí)行計(jì)劃,以構(gòu)建定義的對(duì)象。雖然目前有兩種執(zhí)行此任務(wù)的方法:基于搜索的方法和基于學(xué)習(xí)的方法,但都存在局限性。

基于搜索的方法尋找工件和手動(dòng)圖像的可能三維姿態(tài),尋找正確的姿態(tài)。該方法計(jì)算量大,速度慢,但精度高。

基于學(xué)習(xí)的模型依賴于神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)部件的 3D 姿態(tài)。它們速度快,但精度不高,尤其是在使用看不見的 3D 形狀時(shí)。

為了解決這一局限性,研究人員開發(fā)了手冊(cè)到可執(zhí)行計(jì)劃網(wǎng)絡(luò) ( MEPNet ) ,根據(jù)研究,它使用深度學(xué)習(xí)和 計(jì)算機(jī)視覺 集成“神經(jīng) 2D 關(guān)鍵點(diǎn)檢測(cè)模塊和 2D-3D 投影算法

??根據(jù)一系列預(yù)測(cè),在每一步,模型都會(huì)閱讀手冊(cè),定位要添加的零件,并推導(dǎo)出 3D 定位。在模型預(yù)測(cè)了每一塊和每一步的姿勢(shì)后,它可以從頭開始解析手冊(cè),創(chuàng)建一個(gè)機(jī)器人可以遵循的建筑計(jì)劃來(lái)建造樂高對(duì)象。

研究人員在研究中寫道:“對(duì)于每個(gè)步驟,輸入包括 1 )一組在之前的步驟中構(gòu)建的原始磚塊和零件,以 3D 表示; 2 )一個(gè)顯示組件應(yīng)如何連接的目標(biāo) 2D 圖像。預(yù)期輸出是該步驟中涉及的所有組件的(相對(duì))姿態(tài)?!?。

他們從一個(gè)包含 72 種磚塊的樂高工具包中創(chuàng)建了第一個(gè)合成訓(xùn)練數(shù)據(jù),并使用了來(lái)自 LPub3D ,一個(gè)用于“創(chuàng)建樂高風(fēng)格的數(shù)字建筑說(shuō)明”的開源應(yīng)用程序

研究人員總共生成了 8000 份培訓(xùn)手冊(cè),其中 10 套用于驗(yàn)證, 20 套用于測(cè)試。每個(gè)數(shù)據(jù)集中有大約 200 個(gè)單獨(dú)的步驟,約占培訓(xùn)中的 200000 個(gè)單獨(dú)步驟。

他們?cè)谘芯恐袑懙溃骸拔覀冊(cè)诰C合生成的數(shù)據(jù)集上對(duì) MEPNet 進(jìn)行全面監(jiān)控,在該數(shù)據(jù)集中,我們有基本真相關(guān)鍵點(diǎn)、掩碼和旋轉(zhuǎn)信息?!薄?MEPNet 模型在四個(gè)點(diǎn)上訓(xùn)練 5 天 NVIDIA Titan RTX GPU 由 NVIDIA 圖靈架構(gòu)提供支持。

他們還在 Minecraft house 數(shù)據(jù)集上測(cè)試了該模型,該數(shù)據(jù)集具有與樂高類似的構(gòu)建風(fēng)格。

通過將 MEPNet 與現(xiàn)有模型進(jìn)行比較,研究人員發(fā)現(xiàn),它在現(xiàn)實(shí)世界的樂高積木、合成手冊(cè)和 Minecraft 示例中的表現(xiàn)優(yōu)于其他模型。

MEPNet 在姿勢(shì)估計(jì)方面更準(zhǔn)確,甚至在識(shí)別不可見片段的構(gòu)建方面也更好。研究人員還發(fā)現(xiàn),該模型能夠?qū)暮铣墒謨?cè)中獲得的知識(shí)應(yīng)用于現(xiàn)實(shí)世界的樂高手冊(cè)。

雖然還需要制造一個(gè)能夠執(zhí)行計(jì)劃的機(jī)器人,但研究人員將這項(xiàng)工作視為一個(gè)起點(diǎn)。

“我們的長(zhǎng)期目標(biāo)是制造能夠幫助人類構(gòu)造和組裝復(fù)雜物體的機(jī)器。我們正在考慮將我們的方法擴(kuò)展到其他組裝領(lǐng)域,如宜家家具,”斯坦福大學(xué)計(jì)算機(jī)科學(xué)博士生王若成( Ruocheng Wang )說(shuō)。

關(guān)于作者

Michelle Horton 是 NVIDIA 的高級(jí)開發(fā)人員通信經(jīng)理,擁有通信經(jīng)理和科學(xué)作家的背景。她在 NVIDIA 為開發(fā)者博客撰文,重點(diǎn)介紹了開發(fā)者使用 NVIDIA 技術(shù)的多種方式。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7728

    瀏覽量

    92446
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37213

    瀏覽量

    291980
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    易控智駕榮獲計(jì)算機(jī)視覺頂會(huì)CVPR 2025認(rèn)可

    近日,2025年國(guó)際計(jì)算機(jī)視覺與模式識(shí)別頂級(jí)會(huì)議(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美國(guó)田納西州納什維爾召開。
    的頭像 發(fā)表于 07-29 16:54 ?860次閱讀

    自動(dòng)化計(jì)算機(jī)的功能與用途

    工業(yè)自動(dòng)化是指利用自動(dòng)化計(jì)算機(jī)來(lái)控制工業(yè)環(huán)境中的流程、機(jī)器人和機(jī)械,以制造產(chǎn)品或其部件。工業(yè)自動(dòng)化的目的是提高生產(chǎn)率、增加靈活性,并提升制造過程的質(zhì)量。工業(yè)自動(dòng)化在汽車制造中體現(xiàn)得最為明顯,其中許多
    的頭像 發(fā)表于 07-15 16:32 ?406次閱讀
    自動(dòng)化<b class='flag-5'>計(jì)算機(jī)</b>的功能與用途

    工業(yè)計(jì)算機(jī)與商用計(jì)算機(jī)的區(qū)別有哪些

    工業(yè)計(jì)算機(jī)是一種專為工廠和工業(yè)環(huán)境設(shè)計(jì)的計(jì)算系統(tǒng),具有高可靠性和穩(wěn)定性,能夠應(yīng)對(duì)惡劣環(huán)境下的自動(dòng)化、制造和機(jī)器人操作。其特點(diǎn)包括無(wú)風(fēng)扇散熱技術(shù)、無(wú)電纜連接和防塵防水設(shè)計(jì),使其在各種工業(yè)自動(dòng)化場(chǎng)景中
    的頭像 發(fā)表于 07-10 16:36 ?410次閱讀
    工業(yè)<b class='flag-5'>計(jì)算機(jī)</b>與商<b class='flag-5'>用計(jì)算機(jī)</b>的區(qū)別有哪些

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】視覺實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    必須嚴(yán)謹(jǐn),并定期重新校準(zhǔn)。 OpenCV與ROS2的無(wú)縫結(jié)合 OpenCV是計(jì)算機(jī)視覺的核心工具,書中介紹了如何在ROS2中調(diào)用OpenCV進(jìn)行圖像處理(如邊緣檢測(cè)、顏色空間轉(zhuǎn)換等)。 通過ROS2
    發(fā)表于 05-03 19:41

    英飛凌邊緣AI平臺(tái)通過Ultralytics YOLO模型增加對(duì)計(jì)算機(jī)視覺的支持

    對(duì)計(jì)算機(jī)視覺的支持,擴(kuò)大了當(dāng)前對(duì)音頻、雷達(dá)和其他時(shí)間序列信號(hào)數(shù)據(jù)的支持范圍。在增加這項(xiàng)支持后,該平臺(tái)將能夠用于開發(fā)低功耗、低內(nèi)存的邊緣AI視覺模型。這將給諸多應(yīng)用領(lǐng)域的機(jī)器學(xué)習(xí)開發(fā)人員
    的頭像 發(fā)表于 03-11 15:11 ?588次閱讀
    英飛凌邊緣AI平臺(tái)通過Ultralytics YOLO模型增加對(duì)<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>的支持

    Arm KleidiCV與OpenCV集成助力移動(dòng)端計(jì)算機(jī)視覺性能優(yōu)化

    生成式及多模態(tài)人工智能 (AI) 工作負(fù)載的廣泛增長(zhǎng),推動(dòng)了對(duì)計(jì)算機(jī)視覺 (CV) 技術(shù)日益高漲的需求。此類技術(shù)能夠解釋并分析源自現(xiàn)實(shí)世界的視覺信息,并可應(yīng)用于人臉識(shí)別、照片分類、濾鏡處理及增強(qiáng)現(xiàn)實(shí)
    的頭像 發(fā)表于 02-24 10:15 ?783次閱讀

    AR和VR中的計(jì)算機(jī)視覺

    ):計(jì)算機(jī)視覺引領(lǐng)混合現(xiàn)實(shí)體驗(yàn)增強(qiáng)現(xiàn)實(shí)(AR)和虛擬現(xiàn)實(shí)(VR)正在徹底改變我們與外部世界的互動(dòng)方式。即便是在引人入勝的沉浸式
    的頭像 發(fā)表于 02-08 14:29 ?1898次閱讀
    AR和VR中的<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+兩本互為支持的書

    最近在閱讀《具身智能機(jī)器人系統(tǒng)》這本書的同時(shí),還讀了 《計(jì)算機(jī)視覺之PyTorch數(shù)字圖像處理》一書,這兩本書完全可以視為是互為依托的姊妹篇?!?b class='flag-5'>計(jì)算
    發(fā)表于 01-01 15:50

    云端超級(jí)計(jì)算機(jī)使用教程

    云端超級(jí)計(jì)算機(jī)是一種基于云計(jì)算的高性能計(jì)算服務(wù),它將大量計(jì)算資源和存儲(chǔ)資源集中在一起,通過網(wǎng)絡(luò)向用戶提供按需的計(jì)算服務(wù)。下面,AI部落小編為
    的頭像 發(fā)表于 12-17 10:19 ?757次閱讀

    工業(yè)中使用哪種計(jì)算機(jī)

    在工業(yè)環(huán)境中,工控機(jī)被廣泛使用。這些計(jì)算機(jī)的設(shè)計(jì)可承受極端溫度、灰塵和振動(dòng)等惡劣條件。它們比標(biāo)準(zhǔn)消費(fèi)類計(jì)算機(jī)更耐用、更可靠。工業(yè)計(jì)算機(jī)可控制機(jī)器、監(jiān)控流程并實(shí)時(shí)收集數(shù)據(jù)。其堅(jiān)固的結(jié)構(gòu)和
    的頭像 發(fā)表于 11-29 14:07 ?933次閱讀
    工業(yè)中使用哪種<b class='flag-5'>計(jì)算機(jī)</b>?

    量子計(jì)算機(jī)與普通計(jì)算機(jī)工作原理的區(qū)別

    ? 本文介紹了量子計(jì)算機(jī)與普通計(jì)算機(jī)工作原理的區(qū)別。 量子計(jì)算是一個(gè)新興的研究領(lǐng)域,科學(xué)家們利用量子力學(xué),制造出具有革命性能力的計(jì)算機(jī)。雖然現(xiàn)在的量子
    的頭像 發(fā)表于 11-24 11:00 ?2252次閱讀
    量子<b class='flag-5'>計(jì)算機(jī)</b>與普通<b class='flag-5'>計(jì)算機(jī)</b>工作原理的區(qū)別

    C語(yǔ)言數(shù)組應(yīng)用計(jì)算機(jī)導(dǎo)論A第6講:數(shù)組

    C語(yǔ)言數(shù)組應(yīng)用計(jì)算機(jī)導(dǎo)論A第6講:數(shù)組
    發(fā)表于 11-20 15:33 ?1次下載

    機(jī)器視覺要面臨的挑戰(zhàn)及其解決方法

    機(jī)器視覺是指使用計(jì)算機(jī)和圖像處理技術(shù)從圖像中提取信息,并將其轉(zhuǎn)換為機(jī)器可理解的格式。這種方法已經(jīng)被廣泛應(yīng)用于自動(dòng)化生產(chǎn)、質(zhì)量控制、測(cè)量和檢測(cè)等領(lǐng)域。然而,
    的頭像 發(fā)表于 11-11 01:03 ?1300次閱讀

    工業(yè)計(jì)算機(jī)類型介紹

    工業(yè)領(lǐng)域沒有計(jì)算機(jī)的世界就像沒有管弦樂隊(duì)的交響,缺乏實(shí)現(xiàn)最佳性能所需的和諧和精確度。計(jì)算機(jī)徹底改變了工業(yè)的運(yùn)作方式,將效率、準(zhǔn)確性和創(chuàng)新推向了新的高度。事實(shí)上,根據(jù)最近在印度進(jìn)行的一項(xiàng)研究
    的頭像 發(fā)表于 11-04 15:56 ?880次閱讀
    工業(yè)<b class='flag-5'>計(jì)算機(jī)</b>類型介紹

    【小白入門必看】一文讀懂深度學(xué)習(xí)計(jì)算機(jī)視覺技術(shù)及學(xué)習(xí)路線

    一、什么是計(jì)算機(jī)視覺計(jì)算機(jī)視覺,其實(shí)就是機(jī)器怎么像我們?nèi)艘粯?,用攝像頭看看周圍的世界,然后理
    的頭像 發(fā)表于 10-31 17:00 ?1671次閱讀
    【小白入門必看】一文讀懂深度學(xué)習(xí)<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>技術(shù)及學(xué)習(xí)路線