chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

高分工作!Uni3D:3D基礎(chǔ)大模型,刷新多個SOTA!

CVer ? 來源:CVer ? 2024-01-30 15:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

我們近期的工作:3D視覺大模型Uni3D在ICLR 2024的評審中獲得了688分,被選為Spotlight Presentation

02be4964-b8ed-11ee-8b88-92fbcf53809c.jpg

在本文中,我們第一次將3D基礎(chǔ)模型成功scale up到了十億(1B)級別參數(shù)量,并使用一個模型在諸多3D下游應(yīng)用中取得SoTA結(jié)果。代碼和各個scale的模型(從6M-1B)均已開源,歡迎大家關(guān)注和使用:

論文:https://https://arxiv.org/pdf/2310.06773

代碼:https://https://github.com/baaivision/Uni3D

02cb5d02-b8ed-11ee-8b88-92fbcf53809c.jpg

我們主要探索了3D視覺中scale up模型參數(shù)量和統(tǒng)一模型架構(gòu)的可能性。在NLP / 2D vision領(lǐng)域,scale up大模型(GPT-4,SAM,EVA等)已經(jīng)取得了很impressive的結(jié)果,但是在3D視覺中模型的scale up始終沒有成功。我們旨在將NLP/2D中scale up的成功復(fù)現(xiàn)到3D表征模型上。

02d03426-b8ed-11ee-8b88-92fbcf53809c.jpg

在這項工作中,我們提出了一個3D基礎(chǔ)大模型Uni3D,直接將3D backbone統(tǒng)一為ViT(Vision Transformer),以此利用豐富和強大的2D預(yù)訓(xùn)練大模型作為初始化。Uni3D使用CLIP模型中的文本/圖像表征作為訓(xùn)練目標(biāo),通過學(xué)習(xí)三個模態(tài)的表征對齊(點云-圖像-文本)實現(xiàn)3D點云對圖像和文本的感知。同時,通過使用ViT中成功的scale up策略,我們將Uni3D逐步 scale up,訓(xùn)練了從Tiny到giant的5個不同scale的Uni3D模型,成功地將Uni3D擴展到10億級別參數(shù)。

02df8750-b8ed-11ee-8b88-92fbcf53809c.jpg

Uni3D模型不同scale下的參數(shù)量和zero-shot分類結(jié)果

Uni3D在多個3D任務(wù)上達到SoTA,如:zero-shot classification, few-shot classification,open-world understanding, open-world part segmentation.

02f5e8f6-b8ed-11ee-8b88-92fbcf53809c.jpg

Zero-shot classification

030673b0-b8ed-11ee-8b88-92fbcf53809c.jpg

Real-world zero-shot recognition

由于學(xué)到了強大的多模態(tài)表征能力,Uni3D還能夠做一些有意思的應(yīng)用,如point cloud painting(點云繪畫),text/image-based 3D shape retrieval(基于圖像/文本的3D模型檢索),point cloud captioning(點云描述):

030d818c-b8ed-11ee-8b88-92fbcf53809c.jpg

Point cloud painting

03126e90-b8ed-11ee-8b88-92fbcf53809c.jpg

Image-based 3D shape retrieval

032b3eca-b8ed-11ee-8b88-92fbcf53809c.jpg

Text-based 3D shape retrieval

03421aaa-b8ed-11ee-8b88-92fbcf53809c.jpg

Point cloud captioning.

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 3D視覺
    +關(guān)注

    關(guān)注

    4

    文章

    479

    瀏覽量

    29103
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3579

    瀏覽量

    5077

原文標(biāo)題:ICLR 2024 | 高分工作!Uni3D:3D基礎(chǔ)大模型,刷新多個SOTA!

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    探索TLE493D-P3XX-MS2GO 3D 2Go套件:開啟3D磁傳感器評估之旅

    探索TLE493D-P3XX-MS2GO 3D 2Go套件:開啟3D磁傳感器評估之旅 在電子工程師的日常工作中,評估和開發(fā)磁傳感器是一項常見且重要的任務(wù)。英飛凌(Infineon
    的頭像 發(fā)表于 12-18 17:15 ?605次閱讀

    iDS iToF Nion 3D相機,開啟高性價比3D視覺新紀元!

    、uEye Nion iTof 3D相機 | 產(chǎn)品特點 1. 三大優(yōu)勢特點概括 精度卓越 具備120萬像素超高分
    的頭像 發(fā)表于 12-15 14:59 ?230次閱讀
    iDS iToF Nion <b class='flag-5'>3D</b>相機,開啟高性價比<b class='flag-5'>3D</b>視覺新紀元!

    微納尺度的神筆——雙光子聚合3D打印 #微納3D打印

    3D打印
    楊明遠
    發(fā)布于 :2025年10月25日 13:09:29

    技術(shù)資訊 I 圖文詳解 Allegro X PCB Designer 中的 3D 模型映射

    本文要點面對市面上的一切要將PCB板放進一個盒子里的產(chǎn)品的設(shè)計都離不開3D模型映射這個功能,3D協(xié)同設(shè)計保證了產(chǎn)品的超薄化、高集成度的生命線;3D
    的頭像 發(fā)表于 10-17 16:16 ?1285次閱讀
    技術(shù)資訊 I 圖文詳解 Allegro X PCB Designer 中的 <b class='flag-5'>3D</b> <b class='flag-5'>模型</b>映射

    玩轉(zhuǎn) KiCad 3D模型的使用

    “ ?本文將帶您學(xué)習(xí)如何將 3D 模型與封裝關(guān)聯(lián)、文件嵌入,講解 3D 查看器中的光線追蹤,以及如何使用 CLI 生成 PCBA 的 3D 模型
    的頭像 發(fā)表于 09-16 19:21 ?1.1w次閱讀
    玩轉(zhuǎn) KiCad <b class='flag-5'>3D</b><b class='flag-5'>模型</b>的使用

    AD 3D封裝庫資料

    ?AD ?PCB 3D封裝
    發(fā)表于 08-27 16:24 ?7次下載

    3D AD庫文件

    3D庫文件
    發(fā)表于 05-28 13:57 ?6次下載

    3D閃存的制造工藝與挑戰(zhàn)

    3D閃存有著更大容量、更低成本和更高性能的優(yōu)勢,本文介紹了3D閃存的制造工藝與挑戰(zhàn)。
    的頭像 發(fā)表于 04-08 14:38 ?2180次閱讀
    <b class='flag-5'>3D</b>閃存的制造工藝與挑戰(zhàn)

    一種以圖像為中心的3D感知模型BIP3D

    在具身智能系統(tǒng)中,3D感知算法是一個關(guān)鍵組件,它在端側(cè)幫助可以幫助智能體理解環(huán)境信息,在云端可以用來輔助生成3D場景和3D標(biāo)簽,具備重要的研究價值?,F(xiàn)有主流算法主要依賴于點云作為輸入
    的頭像 發(fā)表于 03-17 13:44 ?1101次閱讀
    一種以圖像為中心的<b class='flag-5'>3D</b>感知<b class='flag-5'>模型</b>BIP<b class='flag-5'>3D</b>

    使用海爾曼太通/HellermannTyton 3D CAD 模型進行快速高效的設(shè)計

    提供 3D 和 2D CAD 數(shù)據(jù),可供免費下載。 直接嵌入三維設(shè)計環(huán)境的模型下載功能 在海爾曼太通官網(wǎng)上點擊【產(chǎn)品】選項,工程師現(xiàn)在可以查看和下載眾多產(chǎn)品的 3D CAD
    發(fā)表于 03-14 16:55

    3D打印可以打印那種柔韌性好,能隨意變形的模型嗎?

    當(dāng)然可以! 一般來講,市面上常見的樹脂材料是比較脆的,一旦受力過大就很容易斷裂,因此不能隨意掰折或扭曲,這就導(dǎo)致很多人對3D打印的認知還停留在它只能制造硬性模型。 但3D打印其實是可以打印出柔韌性好
    發(fā)表于 03-13 11:41

    SciChart 3D for WPF圖表庫

    DirectX 支持的 WPF 3D 圖表和廣泛的 API 完成工作。 WPF 3D 圖表性能 我們傳奇的 WPF 3D 圖表性能由廣泛的端到端性能優(yōu)化、不安全代碼、C++ 互操作、
    的頭像 發(fā)表于 01-23 13:49 ?1377次閱讀
    SciChart <b class='flag-5'>3D</b> for WPF圖表庫

    騰訊混元3D AI創(chuàng)作引擎正式發(fā)布

    的AI技術(shù),能夠根據(jù)用戶提供的提示詞或圖片,直接生成高質(zhì)量的3D模型。這一功能極大地降低了3D內(nèi)容創(chuàng)作的門檻,使得即使是缺乏專業(yè)3D建模技能的用戶也能輕松創(chuàng)作出令人驚嘆的
    的頭像 發(fā)表于 01-23 10:33 ?1079次閱讀

    高分子微納米功能復(fù)合材料3D打印加工介紹

    四川大學(xué)科學(xué)技術(shù)發(fā)展研究院最近公布了該校科研團隊的一項3D打印成果:高分子微納米功能復(fù)合材料實現(xiàn)規(guī)?;苽?。據(jù)悉,功能復(fù)合材料3D打印成果由王琪、陳寧完成,目前處于實驗室階段,已授權(quán)發(fā)明專利12件
    的頭像 發(fā)表于 01-22 11:13 ?1069次閱讀
    <b class='flag-5'>高分</b>子微納米功能復(fù)合材料<b class='flag-5'>3D</b>打印加工介紹

    騰訊混元3D AI創(chuàng)作引擎正式上線

    或上傳一張圖片,該引擎便能迅速生成與之對應(yīng)的3D模型。這一功能極大地降低了3D內(nèi)容創(chuàng)作的門檻,使得更多用戶能夠輕松涉足這一領(lǐng)域。 除了基礎(chǔ)的3D模型
    的頭像 發(fā)表于 01-22 10:26 ?1093次閱讀