chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

視頻P圖新SOTA:推理速度快近15倍

OpenCV學(xué)堂 ? 來(lái)源:量子位 ? 作者:量子位 ? 2022-05-24 09:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

眾所周知:視頻是可以P的。

這不,在CVPR 2022收錄的論文中,就出現(xiàn)了這么一個(gè)P圖神器,它可以分分鐘給你上演各種人像消失大法,不留任何痕跡。

去水印、填補(bǔ)缺失更是不在話下,并且各種分辨率的視頻都能hold住。

正如你所見,這個(gè)模型如此絲滑的表現(xiàn)讓它在兩個(gè)基準(zhǔn)數(shù)據(jù)集上都實(shí)現(xiàn)了SOTA性能。

812b2f9a-daac-11ec-ba43-dac502259ad0.png

△與SOTA方法的對(duì)比

同時(shí)它的推理時(shí)間和計(jì)算復(fù)雜表現(xiàn)也很搶眼:

前者比此前的方法快了近15倍,可以在Titan XP GPU上以每幀0.12秒的速度處理432 × 240的視頻;后者則是在所有比較的SOTA方法中實(shí)現(xiàn)了最低的FLOPs分?jǐn)?shù)。

如此神器,什么來(lái)頭?

改善光流法

目前很多視頻修復(fù)算法利用的都是光流法(Optical flow)。

也就是利用圖像序列中像素在時(shí)間域上的變化以及相鄰幀之間的相關(guān)性,找到上一幀跟當(dāng)前幀之間存在的對(duì)應(yīng)關(guān)系,從而計(jì)算出相鄰幀之間物體的運(yùn)動(dòng)信息。

這個(gè)方法的缺點(diǎn)很明顯:計(jì)算量大、耗時(shí)長(zhǎng),也就是效率低。

為此,研究人員設(shè)計(jì)了三個(gè)可訓(xùn)練模塊,分別為流完成(flow completion)、特征傳播(feature propagation)和內(nèi)容幻想(content hallucination),提出了一個(gè)流引導(dǎo)(flow-guided)的端到端視頻修復(fù)框架:

E2FGVI。

這三個(gè)模塊與之前基于光流的方法的三個(gè)階段相對(duì)應(yīng),不過可以進(jìn)行聯(lián)合優(yōu)化,從而實(shí)現(xiàn)更高效的修復(fù)過程。

8179012a-daac-11ec-ba43-dac502259ad0.png

具體來(lái)說,對(duì)于流完成模塊,該方法直接在mask viedo中一步完成操作,而不是像此前方法采用多個(gè)復(fù)雜的步驟。

對(duì)于特征傳播模塊,與此前的像素級(jí)傳播相比,該方法中的流引導(dǎo)傳播過程在特征空間中借助可變形卷積進(jìn)行。

通過更多可學(xué)習(xí)的采樣偏移和特征級(jí)操作,傳播模塊釋放了此前不能準(zhǔn)確進(jìn)行流估計(jì)的壓力。

對(duì)于內(nèi)容幻想模塊,研究人員則提出了一種時(shí)間焦點(diǎn)Transformer來(lái)有效地建??臻g和時(shí)間維度上的長(zhǎng)程依賴關(guān)系。

同時(shí)該模塊還考慮了局部和非局部時(shí)間鄰域,從而獲得更具時(shí)間相關(guān)性的修復(fù)結(jié)果。

81a552fc-daac-11ec-ba43-dac502259ad0.png

作者:希望成為新基線

定量實(shí)驗(yàn):

研究人員在數(shù)據(jù)集YouTube VOS和DAVIS上進(jìn)行了定量實(shí)驗(yàn),將他們的方法與之前的視頻修復(fù)方法進(jìn)行了比較。

如下表所示,E2FGVI在全部四個(gè)量化指標(biāo)上都遠(yuǎn)遠(yuǎn)超過了這些SOTA算法,能夠生成變形更少(PSNR和SSIM)、視覺上更合理(VFID)和時(shí)空一致性更佳(Ewarp)的修復(fù)視頻,驗(yàn)證了該方法的優(yōu)越性。

81ddb930-daac-11ec-ba43-dac502259ad0.png

此外,E2FGVI也具有最低的FLOPs值(計(jì)算復(fù)雜度),盡管訓(xùn)練是在432 × 240分辨率的視頻上進(jìn)行,它的HQ版本做到了支持任意分辨率。

82209444-daac-11ec-ba43-dac502259ad0.png

定性實(shí)驗(yàn):

研究人員首先選擇了三種最有代表性的方法,包括CAP、FGVC(基于光流法)和Fuseformer(入選ICCV 2021),進(jìn)行對(duì)象移除(下圖前三行)和缺失補(bǔ)全(下圖后兩行)的效果比較。

可以發(fā)現(xiàn),前三種方法很難在遮擋區(qū)域恢復(fù)出合理的細(xì)節(jié)、擦除人物也會(huì)造成模糊,但E2FGVI可以生成相對(duì)真實(shí)的紋理和結(jié)構(gòu)信息。

824b6d22-daac-11ec-ba43-dac502259ad0.png

此外,它們還選用了5種方法進(jìn)行了用戶研究,結(jié)果大部分人都對(duì)E2FGVI修復(fù)后的效果更滿意。

綜上,研究人員也表示,希望他們提出的方法可以成為視頻修復(fù)領(lǐng)域新的強(qiáng)大基線。

作者介紹

82ac4304-daac-11ec-ba43-dac502259ad0.png

E2FGVI由南開大學(xué)和海思合作完成。

一作Li Zhen為南開大學(xué)博士生,共同一作Lu ChengZe也來(lái)自南開。

通訊作者為南開大學(xué)計(jì)算機(jī)學(xué)院教授程明明,主要研究方向是計(jì)算機(jī)視覺和圖形學(xué)。

目前,E2FGVI的代碼已經(jīng)開源,作者也提供了Colab實(shí)現(xiàn),未來(lái)還將在Hugging Face給出demo。

論文地址: https://arxiv.org/abs/2204.02663

GitHub主頁(yè): https://github.com/MCG-NKU/E2FGVI

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:CVPR 2022 | 視頻P圖新SOTA:推理速度快近15倍,任意分辨率均可上演人像消失大法

文章出處:【微信號(hào):CVSCHOOL,微信公眾號(hào):OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    樣板!揭秘嘉立創(chuàng)64層 PCB板 與HDI工藝

    、成本低50%”的顯著優(yōu)勢(shì),成為高端板領(lǐng)域的代表企業(yè)。 一、64層超高層PCB制造服務(wù) 嘉立創(chuàng)超高層PCB服務(wù)打破了行業(yè)壟斷,可以滿足復(fù)雜電路集成化設(shè)計(jì),提供更大的布線層次和空間。 在交付周期方面,嘉立創(chuàng)樣板交期僅為10-15天,比傳統(tǒng)同行交期1
    的頭像 發(fā)表于 02-03 14:38 ?211次閱讀

    使用NORDIC AI的好處

    CPU 15× 能效最高可比最近的競(jìng)品 NPU 好 8×,推理速度快 7×。[Axon NPU 技術(shù)頁(yè)] 開發(fā)門檻低、工具鏈完整 Nordic Edge AI Lab :只
    發(fā)表于 01-31 23:16

    商湯開源SenseNova-MARS:突破多模態(tài)搜索推理天花板

    今日,商湯正式開源多模態(tài)自主推理模型 SenseNova-MARS(8B/32B 雙版本),其在多模態(tài)搜索與推理的核心基準(zhǔn)測(cè)試中以 69.74 分超越Gemini-3-Pro(69.06 分
    的頭像 發(fā)表于 01-29 23:53 ?149次閱讀
    商湯開源SenseNova-MARS:突破多模態(tài)搜索<b class='flag-5'>推理</b>天花板

    曦望發(fā)布新一代推理GPU芯片,單位Token推理成本降低90%

    電子發(fā)燒友網(wǎng)報(bào)道 1月27日,國(guó)產(chǎn)GPU廠商曦望(Sunrise)重磅發(fā)布新一代推理GPU芯片——啟望S3。這是曦望在一年累計(jì)完成約30億元戰(zhàn)略融資后的首次集中公開亮相。2025年,曦望芯片交付量
    的頭像 發(fā)表于 01-28 17:38 ?8648次閱讀

    LPDDR5X在AI數(shù)據(jù)中心多能打?10.7Gbps速率、互連7推理吞吐高5、延遲低80%!

    廠商們包括三星、美光、SK海力士以及長(zhǎng)鑫存儲(chǔ)等也不斷拉高LPDDR5X的規(guī)格,有望拓展繼智能終端之后AI數(shù)據(jù)中心這類新應(yīng)用。 ? 三星電子 ? 三星發(fā)布的比前代1.25、功耗效率提升25%的高端低功耗DRAM LPDDR5X,不僅應(yīng)用于移動(dòng)設(shè)備,還廣泛用于PC、服務(wù)器
    的頭像 發(fā)表于 01-27 09:35 ?1589次閱讀
    LPDDR5X在AI數(shù)據(jù)中心多能打?10.7Gbps速率、互連<b class='flag-5'>快</b>7<b class='flag-5'>倍</b>、<b class='flag-5'>推理</b>吞吐高5<b class='flag-5'>倍</b>、延遲低80%!

    探索Broadcom AFBR - S4P11P012R紅外雙通道硅光電倍增管

    探索Broadcom AFBR - S4P11P012R紅外雙通道硅光電倍增管 在光探測(cè)領(lǐng)域,硅光電倍增管(SiPM)憑借其高靈敏度和快速響應(yīng)等特性,成為了眾多應(yīng)用的理想選擇。今天我們就來(lái)深入
    的頭像 發(fā)表于 12-30 14:40 ?425次閱讀

    Termux手機(jī)攝像頭采集圖像/視頻流 部署 YOLO 模型推理

    Termux手機(jī)攝像頭采集圖像/視頻流 部署 YOLO 模型推理
    的頭像 發(fā)表于 12-14 07:26 ?2830次閱讀

    基于米爾MYC-LR3576開發(fā)板的實(shí)時(shí)視頻識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

    1080P3245% 12路視頻流處理1080P×121592% 人臉疲勞檢測(cè)720P4838%注:12路視頻流端到端延遲約140ms2.
    發(fā)表于 12-01 21:23

    今日看點(diǎn):谷歌芯片實(shí)現(xiàn)量子計(jì)算比經(jīng)典超算13000;NFC 技術(shù)突破:讀取距離從 5 毫米提升至 20 毫米

    性能甚至超越了最快的經(jīng)典超級(jí)計(jì)算機(jī),速度快 13000 。 ? Willow是谷歌于去年12月宣布推出的量子芯片。當(dāng)時(shí),Willow量子芯片在5分鐘內(nèi)完成了一項(xiàng)傳統(tǒng)超級(jí)計(jì)算機(jī)需要“10的25次方”年的時(shí)間才能完成的標(biāo)準(zhǔn)基準(zhǔn)計(jì)算任務(wù)。而此次谷歌披露量子可驗(yàn)證性
    發(fā)表于 10-23 10:20 ?1542次閱讀

    AURIX tc367通過 MCU SOTA 更新邏輯 IC 閃存是否可行?

    你好專家:我的用例是 MCU 通過 SPI 連接到邏輯 IC,邏輯 IC 連接到 8MB 閃存,但 MCU PFLASH 大小為 2MB,通過 MCU SOTA 更新邏輯 IC 閃存是否可行?
    發(fā)表于 08-11 06:36

    求助,關(guān)于TC387使能以及配置SOTA 中一些問題求解

    你好, 之前我拿到貴司給一個(gè)demo,里面有一些使能以及配置SWAP的代碼, 這里有些疑問 問題1. 判斷SOTA功能是否生效,demo中使用的是 SCU_STMEM1中的bit位, 代碼如下
    發(fā)表于 08-08 07:31

    大模型推理顯存和計(jì)算量估計(jì)方法研究

    過程中需要占用大量顯存,導(dǎo)致推理速度變慢,甚至無(wú)法進(jìn)行。 計(jì)算量過大:大模型的計(jì)算量較大,導(dǎo)致推理速度慢,難以滿足實(shí)時(shí)性要求。 為了解決這些問題,本文將針對(duì)大模型
    發(fā)表于 07-03 19:43

    RK3588核心板在邊緣AI計(jì)算中的顛覆性優(yōu)勢(shì)與場(chǎng)景落地

    、ResNet50等模型,推理速度較純CPU方案(如i.MX8)5-10,無(wú)需外接加速卡。 全接口覆蓋: 原生支持PCIe 3.0、雙千兆網(wǎng)口、USB 3.1 Gen2、SATA
    發(fā)表于 04-15 10:48

    YOLOv5類中rgb888p_size這個(gè)參數(shù)要與模型推理和訓(xùn)練的尺寸一致嗎?一致會(huì)達(dá)到更好的效果?

    YOLOv5類中rgb888p_size這個(gè)參數(shù)要與模型推理和訓(xùn)練的尺寸一致嗎,一致會(huì)達(dá)到更好的效果
    發(fā)表于 03-11 08:12

    使用修改后的基準(zhǔn)C++工具推斷灰度圖像時(shí)的推理速度慢怎么解決?

    修改了 基準(zhǔn)測(cè)試 C++ 工具 ,以加載灰度圖像。 獲得的推理速度非常低。
    發(fā)表于 03-06 07:11