chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CVPR 2023論文總結(jié)!CV最熱領(lǐng)域頒給多模態(tài)、擴(kuò)散模型

OpenCV學(xué)堂 ? 來(lái)源:新智元 ? 2023-05-24 15:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【導(dǎo)讀】CVPR 2023有哪些亮點(diǎn)?從錄用論文中我們又能看到CV領(lǐng)域有哪些趨勢(shì)?

一年一度的CVPR即將在6月18-22日加拿大溫哥華正式開(kāi)幕。

每年,來(lái)自世界各地的成千上萬(wàn)的CV研究人員和工程師聚集在一起參加頂會(huì)。這個(gè)久負(fù)盛名的會(huì)議可以追溯到1983年,它代表了計(jì)算機(jī)視覺(jué)發(fā)展的巔峰。

目前,CVPR的h5指數(shù)所有會(huì)議或出版物中位列第四,僅次于《自然》、《科學(xué)》和《新英格蘭醫(yī)學(xué)雜志》。

e4a2cecc-f8f4-11ed-90ce-dac502259ad0.png

前段時(shí)間,CVPR公布了論文接收結(jié)果。根據(jù)官網(wǎng)上統(tǒng)計(jì)數(shù)據(jù),一共接受論文9155篇,錄用2359篇,接受率為25.8%。

此外,還公布了12篇獲獎(jiǎng)候選論文。

那么,今年的CVPR有哪些亮點(diǎn)?從錄用論文中我們又能看到CV領(lǐng)域有哪些趨勢(shì)?

接下來(lái)一并揭曉。

CVPR一覽

初創(chuàng)公司Voxel51就所有被接收論文列表中進(jìn)行了分析。

先來(lái)整體看一張論文標(biāo)題的匯總圖,每個(gè)字的大小與數(shù)據(jù)集中出現(xiàn)的頻率成正比。

簡(jiǎn)要說(shuō)明

- 2359篇論文被接收(9155份論文提交)

- 1724篇Arxiv論文

- 68份文件提交到其他地址

每篇論文的作者

- CVPR論文的平均作者約為5.4人

- 論文當(dāng)中作者最多的是: 「Why is the winner the best?」有125位作者

- 有13篇論文只有一個(gè)作者。

主要Arxiv分類(lèi)

在1724篇Arxiv論文中,有1545篇,或者說(shuō)接近90%的論文將cs.CV列為主要類(lèi)別。

cs.LG位列第二,有101篇。eess.IV (26)和 cs.RO (16)也分得一杯羹。

CVPR 論文的其他類(lèi)別包括: cs.HC,cs.CV,cs.AR,cs.DC,cs.NE,cs.SD,cs.CL,cs.IT,cs.CR,cs.AI,cs.MM,cs.GR,eess.SP,eess.AS,math.OC,math.NT,physics.data-an和stat.ML。

「Meta」數(shù)據(jù)

- 「數(shù)據(jù)集」和「模型」這2個(gè)詞共同出現(xiàn)在567篇摘要中。「數(shù)據(jù)集」在265篇論文摘要中單獨(dú)出現(xiàn),而「模型」則單獨(dú)出現(xiàn)了613次。只有16.2%的 CVPR接收論文沒(méi)有包含這兩個(gè)詞。

- 根據(jù)CVPR論文摘要,今年最受歡迎的數(shù)據(jù)集是ImageNet(105),COCO(94),KITTI(55)和CIFAR(36)。

- 28篇論文提出了一個(gè)新的「基準(zhǔn)」。

縮寫(xiě)詞比比皆是

似乎沒(méi)有首字母縮略詞就沒(méi)有機(jī)器學(xué)習(xí)項(xiàng)目。2359篇論文中,1487篇的標(biāo)題有多個(gè)大寫(xiě)字母的縮略詞或復(fù)合詞,占比63%。

這些首字母縮略詞中有一些很容易記住,甚至可以脫口而出:

- CLAMP: Prompt-based Contrastive Learning for Connecting Language and Animal PoseCLAMP

- PATS: Patch Area Transportation with Subdivision for Local Feature Matching

- CIRCLE: Capture In Rich Contextual Environments

有些則要復(fù)雜得多:

- SIEDOB: Semantic Image Editing by Disentangling Object and Background

- FJMP: Factorized Joint Multi-Agent Motion Prediction over Learned Directed Acyclic Interaction GraphsFJMP

他們中的一些人似乎在首字母縮略詞構(gòu)建上借鑒了別人的創(chuàng)意

- SCOTCH and SODA: A Transformer Video Shadow Detection Framework(荷蘭流行潮牌Scotch & Soda)

- EXCALIBUR: Encouraging and Evaluating Embodied Exploration(Ex咖喱棒,笑)

什么最熱?

除了2023年的論文標(biāo)題,我們抓取了2022年所有接受的論文標(biāo)題。從這兩個(gè)列表中,我們計(jì)算了各種關(guān)鍵詞的相對(duì)頻率,從讓大家對(duì)什么是上升趨勢(shì)、什么是下降趨勢(shì)有更深入的了解。

模型

2023年,擴(kuò)散模型(Diffusion models)占據(jù)了主導(dǎo)地位。

e4d05e00-f8f4-11ed-90ce-dac502259ad0.png

擴(kuò)散模型

隨著Stable Diffusion和Midjourney等圖像生成模型的走紅,擴(kuò)散模型發(fā)展的火熱趨勢(shì)也就不足為奇了。

擴(kuò)散模型在去噪、圖像編輯和風(fēng)格轉(zhuǎn)換方面也有應(yīng)用。把所有這些加起來(lái),到目前為止,它是所有類(lèi)別中最大的贏家,比去年同期增長(zhǎng)了573% 。

輻射場(chǎng)

神經(jīng)輻射場(chǎng)(NERF)也越來(lái)越受歡迎,論文中使用單詞「radiance」增加了80% ,「NERF」增加了39% 。NeRF已經(jīng)從概念驗(yàn)證轉(zhuǎn)向編輯、應(yīng)用和訓(xùn)練過(guò)程優(yōu)化。

Transformers

「Transformer」和「ViT」的使用率下降并不意味著Transformer模型過(guò)時(shí),而是反映了這些模型在2022年的主導(dǎo)地位。2021年,「Transformer」這個(gè)詞只出現(xiàn)在37篇論文中。2022年,這個(gè)數(shù)字飆升至201。Transformer不會(huì)很快消失。

CNN

CNN曾經(jīng)是計(jì)算機(jī)視覺(jué)的寵兒,到了2023年,似乎失去了它們的優(yōu)勢(shì),使用率下降了68%。許多提到 CNN 的標(biāo)題也提到了其他模型。例如,這些論文提到了CNN和Transformer:

- Lite-Mono: A Lightweight CNN and Transformer Architecture for Self-Supervised Monocular Depth EstimationLite-Mono

- Learned Image Compression with Mixed Transformer-CNN Architectures

任務(wù)

掩碼任務(wù)和掩碼圖像建模相結(jié)合,在CVPR中占據(jù)了主導(dǎo)地位。

e4db6624-f8f4-11ed-90ce-dac502259ad0.png

生成

傳統(tǒng)的判別任務(wù),如檢測(cè)、分類(lèi)和分割并沒(méi)有失寵,但是由于生成應(yīng)用的一系列進(jìn)步,它們?cè)贑V的份額正在縮小,包括「編輯」、「合成」以及「生成」的上升就證明這點(diǎn)。

掩碼

關(guān)鍵字「mask」比去年同期增長(zhǎng)了263% ,在2023年被接收的論文中出現(xiàn)了92次,有時(shí)在一個(gè)標(biāo)題中出現(xiàn)了2次。

- SIM: Semantic-aware Instance Mask Generation for Box-Supervised Instance SegmentationSIM

- DynaMask: Dynamic Mask Selection for Instance SegmentationDynaMask

但大多數(shù)(64%)實(shí)際上指的是「掩碼」任務(wù),包括8個(gè)「掩碼圖像建?!购?5個(gè)「掩碼自動(dòng)編碼器」任務(wù)。此外,還有8篇出現(xiàn)「掩碼」。

同樣值得注意的是,3篇帶有單詞「mask」的論文標(biāo)題實(shí)際上指的是「無(wú)掩碼」任務(wù)。

零樣本vs小樣本

隨著遷移學(xué)習(xí)、生成方法、提示和通用模型的興起,「零樣本」學(xué)習(xí)正在獲得關(guān)注。與此同時(shí),「小樣本」學(xué)習(xí)比去年有所下降。然而,就原始數(shù)字而言,至少目前而言,「小樣本」(45)比「零樣本」(35)略有優(yōu)勢(shì)。

模態(tài)

2023年,多模態(tài)和跨模態(tài)應(yīng)用加速發(fā)展。

e4f291fa-f8f4-11ed-90ce-dac502259ad0.png

邊界模糊

雖然傳統(tǒng)計(jì)算機(jī)視覺(jué)關(guān)鍵詞如「圖像」和「視頻」的頻率相對(duì)保持不變,但「文本」/「語(yǔ)言」和「音頻」出現(xiàn)的頻率更高。

即使「多模態(tài)」這個(gè)詞本身沒(méi)有在論文標(biāo)題中出現(xiàn),也很難否認(rèn)計(jì)算機(jī)視覺(jué)正在走向多模態(tài)的未來(lái)。

這在視覺(jué)-語(yǔ)言任務(wù)中尤其明顯,正如「開(kāi)放」、「提示」和「詞匯」的急劇上升所表明的那樣。

這種情況最極端的例子是「開(kāi)放詞匯」這個(gè)復(fù)合詞,它在2022年只出現(xiàn)了3次,但在2023年出現(xiàn)了18次。

e50320d8-f8f4-11ed-90ce-dac502259ad0.png

深入挖掘CVPR 2023論文標(biāo)題中的關(guān)鍵詞

點(diǎn)云9

三維計(jì)算機(jī)視覺(jué)應(yīng)用正在從以二維圖像推斷3D信息(「深度」和「立體」)轉(zhuǎn)向直接在3D點(diǎn)云數(shù)據(jù)上進(jìn)行工作的計(jì)算機(jī)視覺(jué)系統(tǒng)。

CV標(biāo)題的創(chuàng)造力

如果不將ChatGPT納入其中,2023年任何與機(jī)器學(xué)習(xí)相關(guān)的全面報(bào)道都是不完整的。我們決定讓事情變得有趣,并使用ChatGPT來(lái)尋找CVPR 2023中最有創(chuàng)意的標(biāo)題。

對(duì)于每一篇上傳到Arxiv的論文,我們抓取了摘要,并要求 ChatGPT (GPT-3.5 API)為相應(yīng)的CVPR論文生成一個(gè)標(biāo)題。

然后,我們將這些由ChatGPT生成的標(biāo)題和實(shí)際的論文標(biāo)題,使用OpenAI的text-embedding-ada-002模型生成嵌入向量,并計(jì)算ChatGPT生成的標(biāo)題和作者生成的標(biāo)題之間的余弦相似度。

這可以告訴我們什么?ChatGPT越接近實(shí)際的論文標(biāo)題,這個(gè)標(biāo)題就越可預(yù)測(cè)。換句話(huà)說(shuō),ChatGPT的預(yù)測(cè)越「偏」,作者給論文命名的「創(chuàng)造性」就越強(qiáng)。

嵌入和余弦相似度為我們提供了一個(gè)有趣的,盡管遠(yuǎn)非完美的,量化方法。

我們按照這個(gè)指標(biāo)對(duì)論文進(jìn)行了排序。話(huà)不多說(shuō),下面是最具創(chuàng)造性的標(biāo)題:

實(shí)際的標(biāo)題:Tracking Every Thing in the Wild

預(yù)測(cè)的標(biāo)題:Disentangling Classification from Tracking: Introducing TETA for Comprehensive Benchmarking of Multi-Category Multiple Object Tracking

實(shí)際的標(biāo)題:Learning to Bootstrap for Combating Label Noise

預(yù)測(cè)的標(biāo)題:Learnable Loss Objective for Joint Instance and Label Reweighting in Deep Neural Networks

實(shí)際的標(biāo)題:Seeing a Rose in Five Thousand Ways

預(yù)測(cè)的標(biāo)題:Learning Object Intrinsics from Single Internet Images for Superior Visual Rendering and Synthesis

實(shí)際的標(biāo)題:Why is the winner the best?

預(yù)測(cè)的標(biāo)題:Analyzing Winning Strategies in International Benchmarking Competitions for Image Analysis: Insights from a Multi-Center Study of IEEE ISBI and MICCAI 2021

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3751

    瀏覽量

    52093
  • 計(jì)算機(jī)視覺(jué)

    關(guān)注

    9

    文章

    1715

    瀏覽量

    47622
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26187

原文標(biāo)題:CVPR 2023論文總結(jié)!CV最熱領(lǐng)域頒給多模態(tài)、擴(kuò)散模型

文章出處:【微信號(hào):CVSCHOOL,微信公眾號(hào):OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    模態(tài)感知大模型驅(qū)動(dòng)的密閉空間自主勘探系統(tǒng)的應(yīng)用與未來(lái)發(fā)展

    ? ? 模態(tài)感知大模型驅(qū)動(dòng)的密閉空間自主勘探系統(tǒng) ? ?北京華盛恒輝模態(tài)感知大模型驅(qū)動(dòng)的密閉
    的頭像 發(fā)表于 12-29 11:27 ?292次閱讀

    模態(tài)模型驅(qū)動(dòng)的復(fù)雜環(huán)境精準(zhǔn)導(dǎo)航避障系統(tǒng)平臺(tái)的應(yīng)用

    模態(tài)模型驅(qū)動(dòng)的復(fù)雜環(huán)境精準(zhǔn)導(dǎo)航避障系統(tǒng)平臺(tái)的應(yīng)用
    的頭像 發(fā)表于 12-22 13:15 ?275次閱讀
    <b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大<b class='flag-5'>模型</b>驅(qū)動(dòng)的復(fù)雜環(huán)境精準(zhǔn)導(dǎo)航避障系統(tǒng)平臺(tái)的應(yīng)用

    商湯科技正式發(fā)布并開(kāi)源全新模態(tài)模型架構(gòu)NEO

    商湯科技正式發(fā)布并開(kāi)源了與南洋理工大學(xué)S-Lab合作研發(fā)的全新模態(tài)模型架構(gòu) —— NEO,為日日新SenseNova 模態(tài)
    的頭像 發(fā)表于 12-08 11:19 ?1010次閱讀
    商湯科技正式發(fā)布并開(kāi)源全新<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>模型</b>架構(gòu)NEO

    格靈深瞳模態(tài)模型Glint-ME讓圖文互搜更精準(zhǔn)

    在電商、安防等場(chǎng)景下,圖文互搜應(yīng)用廣泛。隨著以CLIP為代表的模態(tài)表征方法相繼提出,過(guò)去單一模態(tài)搜索(文搜文、圖搜圖)被突破,模型可以同時(shí)理解文本、圖像、音頻乃至視頻,實(shí)現(xiàn)跨
    的頭像 發(fā)表于 11-02 15:56 ?1708次閱讀
    格靈深瞳<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大<b class='flag-5'>模型</b>Glint-ME讓圖文互搜更精準(zhǔn)

    亞馬遜云科技上線(xiàn)Amazon Nova模態(tài)嵌入模型

    Embeddings模態(tài)嵌入模型現(xiàn)已在Amazon Bedrock上線(xiàn),這是一款專(zhuān)為Agentic RAG與語(yǔ)義搜索應(yīng)用打造的頂尖模態(tài)
    的頭像 發(fā)表于 10-29 17:15 ?256次閱讀
    亞馬遜云科技上線(xiàn)Amazon Nova<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>嵌入<b class='flag-5'>模型</b>

    商湯日日新V6.5模態(tài)模型登頂全球權(quán)威榜單

    根據(jù)權(quán)威評(píng)測(cè)平臺(tái)OpenCompass模態(tài)模型學(xué)術(shù)榜單(Multi-modal Academic Leaderboard)最新數(shù)據(jù)顯示,商湯「日日新 V6.5」(SenseNova-V6.5
    的頭像 發(fā)表于 09-10 09:55 ?783次閱讀

    淺析模態(tài)標(biāo)注對(duì)大模型應(yīng)用落地的重要性與標(biāo)注實(shí)例

    ?在人工智能邁向AGI通用智能的關(guān)鍵道路上,大模型正從單一的文本理解者,演進(jìn)為能同時(shí)看、聽(tīng)、讀、想的“多面手”。驅(qū)動(dòng)這一進(jìn)化的核心燃料,正是高質(zhì)量的模態(tài)數(shù)據(jù),而將原始數(shù)據(jù)轉(zhuǎn)化為“機(jī)器可讀教材
    的頭像 發(fā)表于 09-05 13:49 ?2213次閱讀

    商湯科技模態(tài)通用智能戰(zhàn)略思考

    時(shí)間是最好的試金石,AI領(lǐng)域尤其如此。當(dāng)行業(yè)熱議大模型走向時(shí),商湯早已錨定“模態(tài)通用智能”——這是我們以深厚研究積累和實(shí)踐反復(fù)驗(yàn)證的可行路徑。
    的頭像 發(fā)表于 08-14 09:33 ?1178次閱讀

    NVIDIA助力圖靈新訊美推出企業(yè)級(jí)模態(tài)視覺(jué)大模型融合解決方案

    中國(guó)推出企業(yè)級(jí)模態(tài)視覺(jué)大模型融合解決方案,推動(dòng)先進(jìn) AI 模型在交通治理、工業(yè)質(zhì)檢、金融風(fēng)控等領(lǐng)域實(shí)現(xiàn)高效識(shí)別、精準(zhǔn)預(yù)警和穩(wěn)定交付。
    的頭像 發(fā)表于 06-26 09:17 ?1330次閱讀

    模態(tài)感知+豆包大模型!家居端側(cè)智能升級(jí)

    的關(guān)鍵力量。星宸科技與豆包大模型的合作,將這一技術(shù)趨勢(shì)落實(shí)到實(shí)際應(yīng)用場(chǎng)景中,在智能家居、可穿戴設(shè)備以及連鎖店等領(lǐng)域引發(fā)了深刻變革。 ? 智能家居升級(jí) ? 陳立敬指出:“智能家居2.0需要大模型大腦”。在智能家居
    的頭像 發(fā)表于 06-21 00:06 ?7106次閱讀
    <b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>感知+豆包大<b class='flag-5'>模型</b>!家居端側(cè)智能升級(jí)

    商湯日日新SenseNova融合模態(tài)模型 國(guó)內(nèi)首家獲得最高評(píng)級(jí)的大模型

    近日,中國(guó)信息通信研究院(以下簡(jiǎn)稱(chēng)“中國(guó)信通院”)完成可信AI模態(tài)模型首輪評(píng)估。 商湯日日新SenseNova融合模態(tài)模型在所有
    的頭像 發(fā)表于 06-11 11:57 ?1411次閱讀

    愛(ài)芯通元NPU適配Qwen2.5-VL-3B視覺(jué)模態(tài)模型

    熟悉愛(ài)芯通元NPU的網(wǎng)友很清楚,從去年開(kāi)始我們?cè)诙藗?cè)模態(tài)模型適配上一直處于主動(dòng)緊跟的節(jié)奏。先后適配了國(guó)內(nèi)最早開(kāi)源的模態(tài)大模MiniCP
    的頭像 發(fā)表于 04-21 10:56 ?3125次閱讀
    愛(ài)芯通元NPU適配Qwen2.5-VL-3B視覺(jué)<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大<b class='flag-5'>模型</b>

    ??低暟l(fā)布模態(tài)模型AI融合巡檢超腦

    基于??涤^瀾大模型技術(shù)體系,??低曂瞥鲂乱淮?b class='flag-5'>多模態(tài)模型AI融合巡檢超腦,全面升級(jí)人、車(chē)、行為、事件等算法,為行業(yè)帶來(lái)全新的
    的頭像 發(fā)表于 04-17 17:12 ?1609次閱讀

    移遠(yuǎn)通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗(yàn)

    隨著千行百業(yè)數(shù)智化進(jìn)程的不斷加速,模態(tài)AI大模型的應(yīng)用需求不斷攀升,圖像、語(yǔ)音、視頻等多樣化的交互方式正逐漸成為推動(dòng)行業(yè)變革的新動(dòng)力。 ? 3月20日,全球物聯(lián)網(wǎng)整體解決方案供應(yīng)商移遠(yuǎn)通信宣布,其
    發(fā)表于 03-21 14:12 ?532次閱讀
    移遠(yuǎn)通信智能模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>AI大<b class='flag-5'>模型</b>,重塑智能交互新體驗(yàn)

    移遠(yuǎn)通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗(yàn)

    隨著千行百業(yè)數(shù)智化進(jìn)程的不斷加速,模態(tài)AI大模型的應(yīng)用需求不斷攀升,圖像、語(yǔ)音、視頻等多樣化的交互方式正逐漸成為推動(dòng)行業(yè)變革的新動(dòng)力。3月20日,全球物聯(lián)網(wǎng)整體解決方案供應(yīng)商移遠(yuǎn)通信宣布,其全系
    的頭像 發(fā)表于 03-20 19:03 ?816次閱讀
    移遠(yuǎn)通信智能模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>AI大<b class='flag-5'>模型</b>,重塑智能交互新體驗(yàn)