我們研究視頻到視頻的合成問題,其目的是學(xué)習(xí)從輸入源視頻(例如,一系列語(yǔ)義分割掩碼)到精確描述源視頻內(nèi)容的輸出真實(shí)感視頻的映射功能。
雖然它的圖像對(duì)應(yīng)物(圖像到圖像合成問題)是一個(gè)受歡迎的話題,但是視頻到視頻合成問題在文獻(xiàn)中很少探討。在不了解時(shí)間動(dòng)態(tài)的情況下,將現(xiàn)有的圖像合成方法直接應(yīng)用于輸入視頻通常會(huì)導(dǎo)致視覺質(zhì)量低下的時(shí)間不連貫視頻。
在本文中,我們提出了一種在生成對(duì)抗性學(xué)習(xí)框架下的新穎的視頻合成方法。通過(guò)精心設(shè)計(jì)的生成器和鑒別器架構(gòu)以及時(shí)空對(duì)抗目標(biāo),我們可以通過(guò)多種輸入格式(包括分割蒙版,草圖和姿勢(shì))獲得高分辨率,逼真的,時(shí)間上連貫的視頻結(jié)果。在多個(gè)基準(zhǔn)上進(jìn)行的實(shí)驗(yàn)表明,與強(qiáng)基準(zhǔn)相比,我們的方法具有優(yōu)勢(shì)。
尤其是,我們的模型能夠合成長(zhǎng)達(dá)30秒的街道場(chǎng)景的2K分辨率視頻,從而大大提高了視頻合成的最新水平。最后,我們將我們的方法應(yīng)用于未來(lái)的視頻預(yù)測(cè),其性能超過(guò)了幾個(gè)最先進(jìn)的競(jìng)爭(zhēng)系統(tǒng)。
我們的模型能夠合成長(zhǎng)達(dá)30秒的街道場(chǎng)景的2K分辨率視頻,從而大大提高了視頻合成的最新水平。最后,我們將我們的方法應(yīng)用于未來(lái)的視頻預(yù)測(cè),其性能超過(guò)了幾個(gè)最先進(jìn)的競(jìng)爭(zhēng)系統(tǒng)。
我們的模型能夠合成長(zhǎng)達(dá)30秒的街道場(chǎng)景的2K分辨率視頻,從而大大提高了視頻合成的最新水平。最后,我們將我們的方法應(yīng)用于未來(lái)的視頻預(yù)測(cè),其性能超過(guò)了幾個(gè)最先進(jìn)的競(jìng)爭(zhēng)系統(tǒng)。
-
視頻
+關(guān)注
關(guān)注
6文章
1993瀏覽量
74457 -
圖像
+關(guān)注
關(guān)注
2文章
1094瀏覽量
42005 -
鑒別器
+關(guān)注
關(guān)注
0文章
8瀏覽量
8851
發(fā)布評(píng)論請(qǐng)先 登錄
一種適用于動(dòng)態(tài)環(huán)境的自適應(yīng)先驗(yàn)場(chǎng)景-對(duì)象SLAM框架

一種基于擴(kuò)散模型的視頻生成框架RoboTransfer

NVIDIA recsys-examples在生成式推薦系統(tǒng)中的高效實(shí)踐

一種實(shí)時(shí)多線程VSLAM框架vS-Graphs介紹

一種多模態(tài)駕駛場(chǎng)景生成框架UMGen介紹

《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用
敏捷合成器的技術(shù)原理和應(yīng)用場(chǎng)景
白光LED熒光粉合成途徑與光學(xué)性能研究

自動(dòng)駕駛測(cè)試場(chǎng)景庫(kù)的構(gòu)建及評(píng)價(jià)方法之場(chǎng)景生成方法研究

高純碳化硅粉體合成方法
PWM信號(hào)生成方法 PWM調(diào)制原理講解
一種面向飛行試驗(yàn)的數(shù)據(jù)融合框架

鑒源實(shí)驗(yàn)室·如何通過(guò)雷達(dá)攻擊自動(dòng)駕駛汽車-針對(duì)點(diǎn)云識(shí)別模型的對(duì)抗性攻擊的科普

一種創(chuàng)新的動(dòng)態(tài)軌跡預(yù)測(cè)方法

一種簡(jiǎn)單高效配置FPGA的方法

評(píng)論