chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌AI發(fā)布3D物體數(shù)據(jù)集,附帶標(biāo)記邊界框、相機(jī)位姿、稀疏點(diǎn)云

工程師鄧生 ? 來(lái)源:量子位 ? 作者:蕭簫 ? 2020-11-13 14:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

見(jiàn)過(guò)3D物體數(shù)據(jù)集,見(jiàn)過(guò)會(huì)動(dòng)的3D物體數(shù)據(jù)集嗎?

每段動(dòng)態(tài)視頻都 以目標(biāo)為中心拍攝,不僅自帶標(biāo)注整體的邊界框,每個(gè)視頻還附帶相機(jī)位姿和稀疏點(diǎn)云。

這是谷歌的開(kāi)源3D物體數(shù)據(jù)集 Objectron,包含 15000份短視頻樣本,以及從五個(gè)大洲、十個(gè)國(guó)家里收集來(lái)的 400多萬(wàn)張帶注釋的圖像。

谷歌認(rèn)為,3D目標(biāo)理解領(lǐng)域,缺少像2D中的ImageNet這樣的大型數(shù)據(jù)集,而Objectron數(shù)據(jù)集能在一定程度上解決這個(gè)問(wèn)題。

數(shù)據(jù)集一經(jīng)推出, 1.6k網(wǎng)友點(diǎn)贊。

有網(wǎng)友調(diào)侃,谷歌恰好在自己想“谷歌”這類數(shù)據(jù)集的時(shí)候,把它發(fā)了出來(lái)。

也有團(tuán)隊(duì)前成員表示,很高興看到這樣的數(shù)據(jù)集和模型,給AR帶來(lái)進(jìn)步的可能。

除此之外,谷歌還公布了用Objectron數(shù)據(jù)集訓(xùn)練的針對(duì) 鞋子、椅子、杯子和相機(jī)4種類別的3D目標(biāo)檢測(cè)模型。

來(lái)看看這個(gè)數(shù)據(jù)集包含什么,以及谷歌提供的3D目標(biāo)檢測(cè)方案吧~ (項(xiàng)目地址見(jiàn)文末)

9類物體,對(duì)AR挺友好

目前,這個(gè)數(shù)據(jù)集中包含的3D物體樣本,包括自行車,書(shū)籍,瓶子,照相機(jī),麥片盒子,椅子,杯子,筆記本電腦和鞋子。

當(dāng)然,這個(gè)數(shù)據(jù)集,絕不僅僅只是一些以物體為中心拍攝的視頻和圖像,它具有如下特性:

注釋標(biāo)簽 (3D目標(biāo)立體邊界框)

用于AR數(shù)據(jù)的數(shù)據(jù) (相機(jī)位姿、稀疏點(diǎn)云、二維表面)

數(shù)據(jù)預(yù)處理 (圖像格式為tf.example,視頻格式為SequenceExample)

支持通過(guò)腳本運(yùn)行3D IoU指標(biāo)的評(píng)估

支持通過(guò)腳本實(shí)現(xiàn)Tensorflow、PyTorch、JAX的數(shù)據(jù)加載及可視化,包含“Hello World”樣例

支持Apache Beam,用于處理谷歌云(Google Cloud)基礎(chǔ)架構(gòu)上的數(shù)據(jù)集

所有可用樣本的索引,包括訓(xùn)練/測(cè)試部分,便于下載

圖像部分的畫(huà)風(fēng),基本是這樣的,也標(biāo)注得非常詳細(xì):

而在視頻中,不僅有從各個(gè)角度拍攝的、以目標(biāo)為中心的片段 (從左到右、從下到上):

也有不同數(shù)量的視頻類型 (一個(gè)目標(biāo)、或者兩個(gè)以上的目標(biāo)):

谷歌希望通過(guò)發(fā)布這個(gè)數(shù)據(jù)集,讓研究界能夠進(jìn)一步突破3D目標(biāo)理解領(lǐng)域,以及相關(guān)的如 無(wú)監(jiān)督學(xué)習(xí)等方向的研究應(yīng)用。

怎么用?谷歌“以身示范”

拿到數(shù)據(jù)集的第一刻,并不知道它是否好用,而且總感覺(jué)有點(diǎn)無(wú)從下手?

別擔(dān)心,這個(gè)數(shù)據(jù)集的訓(xùn)練效果,谷歌已經(jīng)替我們?cè)囘^(guò)了。

看起來(lái)還不錯(cuò):

此外,谷歌將訓(xùn)練好的3D目標(biāo)檢測(cè)模型,也一并給了出來(lái)。 (傳送見(jiàn)文末)

算法主要包括兩部分,第一部分是Tensorflow的2D目標(biāo)檢測(cè)模型,用來(lái)“發(fā)現(xiàn)物體的位置”;

第二部分則進(jìn)行圖像裁剪,來(lái)估計(jì)3D物體的邊界框 (同時(shí)計(jì)算目標(biāo)下一幀的2D裁剪,因此不需要運(yùn)行每個(gè)幀),整體結(jié)構(gòu)如下圖:

在模型的評(píng)估上,谷歌采用了 Sutherland-Hodgman多邊形裁剪算法,來(lái)計(jì)算兩個(gè)立體邊界框的交點(diǎn),并計(jì)算出兩個(gè)立方體的 相交體積,最終計(jì)算出3D目標(biāo)檢測(cè)模型的 IoU。

簡(jiǎn)單來(lái)說(shuō),兩個(gè)立方體重疊體積越大,3D目標(biāo)檢測(cè)模型效果就越好。

這個(gè)模型是谷歌推出的MediaPipe中的一個(gè)部分,后者是一個(gè)開(kāi)源的跨平臺(tái)框架,用于構(gòu)建pipeline,以處理不同形式的感知數(shù)據(jù)。

它推出的MediaPipe Objectron實(shí)時(shí)3D目標(biāo)檢測(cè)模型,用移動(dòng)設(shè)備 (手機(jī))就能進(jìn)行目標(biāo)實(shí)時(shí)檢測(cè) 。

看, (他們玩得多歡快)實(shí)時(shí)目標(biāo)檢測(cè)的效果還不錯(cuò):

其他部分3D數(shù)據(jù)集

除了谷歌推出的數(shù)據(jù)集以外,此前視覺(jué)3D目標(biāo)領(lǐng)域,也有許多類型不同的數(shù)據(jù)集,每個(gè)數(shù)據(jù)集都有自己的特點(diǎn)。

例如斯坦福大學(xué)等提出的 ScanNetV2,是個(gè)室內(nèi)場(chǎng)景數(shù)據(jù)集,而ScanNet則是個(gè)RGB-D視頻數(shù)據(jù)集,一共有21個(gè)目標(biāo)類,一共1513個(gè)采集場(chǎng)景數(shù)據(jù),可做語(yǔ)義分割和目標(biāo)檢測(cè)任務(wù)。

而目前在自動(dòng)駕駛領(lǐng)域非常熱門的 KITTI數(shù)據(jù)集,也是一個(gè)3D數(shù)據(jù)集,是目前最大的自動(dòng)駕駛場(chǎng)景下計(jì)算機(jī)視覺(jué)的算法評(píng)測(cè)數(shù)據(jù)集,包含市區(qū)、鄉(xiāng)村和高速公路等場(chǎng)景采集的真實(shí)圖像數(shù)據(jù)。

此外,還有Waymo、SemanticKITTI、H3D等等數(shù)據(jù)集,也都用在不同的場(chǎng)景中。 (例如SemanticKITTI,通常被專門用于自動(dòng)駕駛的3D語(yǔ)義分割)

無(wú)論是視頻還是圖像,這些數(shù)據(jù)集的單個(gè)樣本基本包含多個(gè)目標(biāo),使用場(chǎng)景上也與谷歌的Objectron有所不同。

感興趣的小伙伴們,可以通過(guò)下方傳送門,瀏覽谷歌最新的3D目標(biāo)檢測(cè)數(shù)據(jù)集,以及相關(guān)模型~

Objectron數(shù)據(jù)集傳送門:

https://github.com/google-research-datasets/Objectron/

針對(duì)4種物體的3D目標(biāo)檢測(cè)模型:

https://google.github.io/mediapipe/solutions/objectron

參考鏈接:

https://ai.googleblog.com/2020/11/announcing-objectron-dataset.html

https://ai.googleblog.com/2020/03/real-time-3d-object-detection-on-mobile.html

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2987

    瀏覽量

    113750
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6244

    瀏覽量

    110216
  • AI
    AI
    +關(guān)注

    關(guān)注

    89

    文章

    38027

    瀏覽量

    296085
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    9027

    瀏覽量

    143015
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    3D傳感器到立體相機(jī),解鎖工業(yè)應(yīng)用新可能

    3D傳感器是實(shí)現(xiàn)深度感知的核心技術(shù)。這些傳感器廣泛應(yīng)用于多種常見(jiàn)的3D視覺(jué)技術(shù)中,例如立體相機(jī)、激光雷達(dá)(LiDAR)、飛行時(shí)間(ToF)相機(jī)和激光三角測(cè)量。通常根據(jù)應(yīng)用場(chǎng)景和技術(shù)要求
    的頭像 發(fā)表于 11-28 17:03 ?1515次閱讀
    從<b class='flag-5'>3D</b>傳感器到立體<b class='flag-5'>相機(jī)</b>,解鎖工業(yè)應(yīng)用新可能

    京東11.11直播技術(shù)全面升級(jí),立影3D技術(shù)、JoyAI大模型重構(gòu)沉浸式購(gòu)物體驗(yàn)

    隨著京東 11.11 大促的火熱進(jìn)行,京東直播再度升級(jí)技術(shù)布局,以 “立影 3D 技術(shù)”“JoyAI大模型”等創(chuàng)新技術(shù),打破傳統(tǒng)直播邊界,為用戶帶來(lái)更具沉浸感、趣味性的購(gòu)物體驗(yàn),引領(lǐng)直播電商技術(shù)創(chuàng)新
    的頭像 發(fā)表于 10-27 14:58 ?222次閱讀

    iTOF技術(shù),多樣化的3D視覺(jué)應(yīng)用

    動(dòng)態(tài)模糊,確保高耐光性,同時(shí)輸出2D(紅外)和3D(深度)數(shù)據(jù)。 ◆ Testing Principles ※ 測(cè)量脈沖光的飛行時(shí)間,以檢測(cè) TOF 相機(jī)與被測(cè)
    發(fā)表于 09-05 07:24

    Zivid3D相機(jī)安裝使用教程

    Zivid3D相機(jī)小巧便攜,重量輕,分辨率高,速度快,適合高反光透明物體。本文介紹Zivid 3D相機(jī)的操作流程,幫助用戶掌握其功能。從硬件
    的頭像 發(fā)表于 08-26 15:34 ?416次閱讀
    Zivid<b class='flag-5'>3D</b><b class='flag-5'>相機(jī)</b>安裝使用教程

    3D工業(yè)相機(jī)價(jià)格是?這種3D工業(yè)相機(jī)性價(jià)比最高

    3D 工業(yè)相機(jī)市場(chǎng),一場(chǎng)價(jià)格與質(zhì)量的博弈已然展開(kāi)。企業(yè)在選擇時(shí)面臨著艱難困境,國(guó)際品牌筑起高高的價(jià)格壁壘,國(guó)產(chǎn)品牌又深陷低價(jià)低質(zhì)的怪圈。我們?cè)撊绾螢榇蚱七@一局面?
    的頭像 發(fā)表于 07-29 11:25 ?696次閱讀
    <b class='flag-5'>3D</b>工業(yè)<b class='flag-5'>相機(jī)</b>價(jià)格是?這種<b class='flag-5'>3D</b>工業(yè)<b class='flag-5'>相機(jī)</b>性價(jià)比最高

    英倫科技10.1英寸裸眼3D數(shù)碼相框升級(jí)了,玩轉(zhuǎn)AI文生圖太cool了!

    此次升級(jí)將AI內(nèi)容生成與裸眼3D顯示深度結(jié)合,解決了傳統(tǒng)3D內(nèi)容制作成本高的痛點(diǎn),使普通用戶也能輕松創(chuàng)作個(gè)性化立體圖像。配合無(wú)線傳輸、智能轉(zhuǎn)化等成熟功能,該產(chǎn)品已成為
    的頭像 發(fā)表于 07-03 11:31 ?11.1w次閱讀
    英倫科技10.1英寸裸眼<b class='flag-5'>3D</b>數(shù)碼相框升級(jí)了,玩轉(zhuǎn)<b class='flag-5'>AI</b>文生圖太cool了!

    遷移科技推出全新3D智能相機(jī)

    工業(yè)視覺(jué)領(lǐng)域迎來(lái)里程碑式突破!遷移科技正式發(fā)布全系升級(jí)的3D智能相機(jī),將強(qiáng)悍算力直接嵌入相機(jī)內(nèi)部,替代傳統(tǒng) “相機(jī) + 工控機(jī) + 顯卡”
    的頭像 發(fā)表于 05-29 13:58 ?712次閱讀

    2025年3D工業(yè)相機(jī)選型及推薦

    3D工業(yè)相機(jī)的選型
    的頭像 發(fā)表于 05-21 16:49 ?1084次閱讀
    2025年<b class='flag-5'>3D</b>工業(yè)<b class='flag-5'>相機(jī)</b>選型及推薦

    告別漫長(zhǎng)等待! 3D測(cè)量竟然可以如此的絲滑

    原理介紹海伯森3D閃測(cè)傳感器HPS-DBL系列采用超高速投影方式向測(cè)量對(duì)象上投射出不同波長(zhǎng)的特殊圖案,并采集物體表面的圖案信息,配合海伯森HPS-NB3200高性能視覺(jué)控制器和內(nèi)置AI解碼算法對(duì)
    的頭像 發(fā)表于 05-12 18:01 ?551次閱讀
    告別漫長(zhǎng)等待! <b class='flag-5'>3D</b>測(cè)量竟然可以如此的絲滑

    一種以圖像為中心的3D感知模型BIP3D

    在具身智能系統(tǒng)中,3D感知算法是一個(gè)關(guān)鍵組件,它在端側(cè)幫助可以幫助智能體理解環(huán)境信息,在云端可以用來(lái)輔助生成3D場(chǎng)景和3D標(biāo)簽,具備重要的研究?jī)r(jià)值?,F(xiàn)有主流算法主要依賴于點(diǎn)
    的頭像 發(fā)表于 03-17 13:44 ?947次閱讀
    一種以圖像為中心的<b class='flag-5'>3D</b>感知模型BIP<b class='flag-5'>3D</b>

    對(duì)于結(jié)構(gòu)光測(cè)量、3D視覺(jué)的應(yīng)用,使用100%offset的lightcrafter是否能用于點(diǎn)生成的應(yīng)用?

    你好,我有一些對(duì)于offset的疑問(wèn),希望能夠得到解答。 對(duì)于結(jié)構(gòu)光測(cè)量、3D視覺(jué)的應(yīng)用,使用100%offset的lightcrafter是否能用于點(diǎn)生成的應(yīng)用? 標(biāo)定和三角重建算法和zero
    發(fā)表于 02-28 06:20

    Captic:利用AI3D相機(jī)革新自動(dòng)化生產(chǎn)

    。 Captic的核心競(jìng)爭(zhēng)力在于其先進(jìn)的AI視覺(jué)系統(tǒng),該系統(tǒng)是基于與奧比中光的合作,利用3D相機(jī)技術(shù)精心打造而成。這一創(chuàng)新技術(shù)不僅極大地?cái)U(kuò)展了自動(dòng)化應(yīng)用的功能邊界,更為工廠的生產(chǎn)效率帶
    的頭像 發(fā)表于 02-11 14:39 ?897次閱讀

    騰訊混元3D AI創(chuàng)作引擎正式發(fā)布

    近日,騰訊公司宣布其自主研發(fā)的混元3D AI創(chuàng)作引擎已正式上線。這一創(chuàng)新性的創(chuàng)作工具將為用戶帶來(lái)前所未有的3D內(nèi)容創(chuàng)作體驗(yàn),標(biāo)志著騰訊在AI技術(shù)領(lǐng)域的又一重大突破。 混元
    的頭像 發(fā)表于 01-23 10:33 ?966次閱讀

    騰訊混元3D AI創(chuàng)作引擎正式上線

    近日,騰訊公司宣布其自主研發(fā)的混元3D AI創(chuàng)作引擎已正式上線。這一創(chuàng)新性的創(chuàng)作工具,標(biāo)志著騰訊在3D內(nèi)容生成領(lǐng)域邁出了重要一步。 混元3D AI
    的頭像 發(fā)表于 01-22 10:26 ?937次閱讀

    C#通過(guò)Halcon實(shí)現(xiàn)3D點(diǎn)重繪

    C# 通過(guò) Halcon 實(shí)現(xiàn) 3D 點(diǎn)重繪
    發(fā)表于 01-05 09:16 ?0次下載