chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Nirkin提出單編碼器 - 多解碼器網(wǎng)絡(luò)架構(gòu)和算法對(duì)換臉質(zhì)量的影響

lhl545545 ? 來源:EDA365 ? 作者:EDA365 ? 2020-09-14 10:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

迪士尼新研究實(shí)現(xiàn)百萬像素圖像和視頻換臉,說不定未來大熒幕電影也會(huì)使用換臉技術(shù)了。

deepfakes 技術(shù)可以用于圖像和視頻換臉,但它能否用于大制作電影和電視節(jié)目中呢?迪士尼最新放出的一則視頻 demo 展示了這種可能性。

近日迪士尼在歐洲圖形學(xué)會(huì)透視研討會(huì)(EGSR)上發(fā)表研究,展示了首個(gè)百萬像素逼真換臉技術(shù)。

效果是不是還不錯(cuò)。這樣的效果雖然并不足以用于漫威電影,但它是換臉技術(shù)邁出的新一步。

來自迪士尼的研究者表示,這項(xiàng)技術(shù)的創(chuàng)新點(diǎn)在于能夠達(dá)到百萬像素質(zhì)量。百萬像素或許不再是高質(zhì)量圖像的代名詞,畢竟手機(jī)自帶攝像頭就能達(dá)到千萬像素。但是截至目前,換臉技術(shù)一直注重平滑的面部轉(zhuǎn)換,不注重提高像素。

你可能在手機(jī)上看到過效果好到爆炸的換臉視頻,但是如果把它們放在更大的屏幕上呈現(xiàn),就會(huì)出現(xiàn)很多瑕疵。研究者表示,他們用開源 deepfake 模型 DeepFakeLab 創(chuàng)建的視頻分辨率最高也只有 256*256 像素。相比之下,迪士尼新模型能夠讓視頻的分辨率提升到 1024*1024 像素。

那么,百萬像素?fù)Q臉是如何實(shí)現(xiàn)的呢?

首個(gè)百萬像素?fù)Q臉方法

迪士尼的這項(xiàng)研究發(fā)表在歐洲圖形學(xué)會(huì)透視研討會(huì)(EGSR)上,提出了一種在圖像和視頻中實(shí)現(xiàn)全自動(dòng)換臉的算法。據(jù)研究者稱,這是首個(gè)渲染百萬像素逼真結(jié)果的方法,且輸出結(jié)果具備時(shí)序一致性。

具體來說,該研究提出了一個(gè)漸進(jìn)式訓(xùn)練的多路 comb 網(wǎng)絡(luò),以及一種保持亮度和對(duì)比度的混合方法。

具體而言,雖然漸進(jìn)式訓(xùn)練能夠生成高分辨率圖像,但將架構(gòu)和訓(xùn)練數(shù)據(jù)擴(kuò)展至兩人以上可以使生成的表情具備更高的保真度。

此外,在將生成的表情合成到目標(biāo)人臉時(shí),研究者調(diào)整混合策略,以保持對(duì)比度和低頻光照。

最后,研究者在人臉關(guān)鍵點(diǎn)穩(wěn)定算法中融入了一種細(xì)化策略,以實(shí)現(xiàn)時(shí)序穩(wěn)定性,這對(duì)于處理高分辨率視頻來說至關(guān)重要。

在實(shí)驗(yàn)部分,研究者通過控制變量研究來驗(yàn)證該方法對(duì)換臉質(zhì)量的影響,并與流行的 SOTA 方法進(jìn)行了比較。

百萬像素分辨率下執(zhí)行逼真換臉的整體流程:

該流程包括如下四個(gè)步驟:

對(duì)于圖像 x_t,檢測(cè)人臉并定位人臉關(guān)鍵點(diǎn);

將人臉分辨率歸一化為 1024×1024,保存歸一化參數(shù);

將歸一化人臉饋入網(wǎng)絡(luò),并保存第 s 個(gè)解碼器的輸出 x?_s;

使用步驟 2 保存的歸一化參數(shù),在圖像 x?_s 上反轉(zhuǎn)圖像歸一化結(jié)果。最后,借助該研究提出的合成方法,將生成的圖像與圖像 x_t 混合。

而該流程中,最核心的組件無疑是模型本身了。該研究使用的單編碼器 - 多解碼器網(wǎng)絡(luò)架構(gòu):

此外,研究者還介紹了實(shí)現(xiàn)人臉關(guān)鍵點(diǎn)對(duì)齊和穩(wěn)定的方法,以確保換臉圖像的時(shí)序一致性,以及保持光照和對(duì)比度的圖像合成流程。此處不再贅述,詳情參見原論文。

與當(dāng)前 SOTA 方法的對(duì)比

該方法與 DeepFakes、DeepFaceLab 和 Nirkin 等人提出方法的換臉效果對(duì)比。從左到右依次為:目標(biāo)圖像、源圖像、該方法在 1024×1024 和 256×256 分辨率下的成像效果,以及其他三種方法的成像效果。

控制變量研究

研究者執(zhí)行以下四種實(shí)驗(yàn),來查看該研究提出的單編碼器 - 多解碼器網(wǎng)絡(luò)架構(gòu)和算法對(duì)換臉質(zhì)量的影響:

漸進(jìn)式訓(xùn)練 VS 一次性訓(xùn)練整個(gè)網(wǎng)絡(luò);

使用多路 comb 模型 VS 單獨(dú)的雙路模型;

該研究提出的保持對(duì)比度的多頻段合成方法 VS 泊松融合方法;

該研究中人臉關(guān)鍵點(diǎn)穩(wěn)定方法的影響。

為漸進(jìn)式訓(xùn)練與非漸進(jìn)式訓(xùn)練的成像效果對(duì)比,可以看出,漸進(jìn)式訓(xùn)練的成像效果優(yōu)于非漸進(jìn)式訓(xùn)練。

為使用多路 comb 模型與雙路模型的成像效果對(duì)比:

方法與泊松融合方法的成像效果對(duì)比。從圖中可以看出,該方法可以更好地保留目標(biāo)人臉的全局光照特征,而泊松融合方法導(dǎo)致人臉出現(xiàn)了某種「漂白」效果。

人臉關(guān)鍵點(diǎn)穩(wěn)定結(jié)果:

缺陷

盡管能夠以高分辨率進(jìn)行逼真的人臉轉(zhuǎn)換,但是迪士尼提出的這一方法仍然存在缺陷。例如,無法基于數(shù)據(jù)恰當(dāng)捕獲的表情和姿勢(shì),可能會(huì)導(dǎo)致不完善的生成結(jié)果,比如模糊和其它偽影。
責(zé)任編輯:pj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1202

    瀏覽量

    42845
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3900

    瀏覽量

    141354
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7314

    瀏覽量

    93920
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    增強(qiáng)T-BOX設(shè)計(jì),新唐編解碼器的重要作用

    、遠(yuǎn)程異常維護(hù)和更新。 數(shù)據(jù)收集和傳輸:安全保護(hù)和隱私加密。 多接口擴(kuò)展:可定制的功能和軟件應(yīng)用程序。 在T-BOX中,編解碼器編碼器-解碼器)起著至關(guān)重要的作用,充當(dāng)主要的通信橋梁。其基本功能包括
    發(fā)表于 09-05 06:26

    絕對(duì)值編碼器與增量式編碼器相比有哪些優(yōu)勢(shì)?

    絕對(duì)值編碼器與增量式編碼器相比有哪些優(yōu)勢(shì)?核心功能:斷電后位置信息不丟失,絕對(duì)值編碼器:通過機(jī)械結(jié)構(gòu)或電子存儲(chǔ)(如電池備份),能實(shí)時(shí)輸出當(dāng)前位置的唯一絕對(duì)值編碼(如二進(jìn)制、格雷碼)。無
    的頭像 發(fā)表于 08-11 13:57 ?1144次閱讀
    絕對(duì)值<b class='flag-5'>編碼器</b>與增量式<b class='flag-5'>編碼器</b>相比有哪些優(yōu)勢(shì)?

    Transformer架構(gòu)解碼器的工作流程

    解碼器的作用主要是制作文本序列。與編碼器類似,解碼器也配備了一組類似的子層。它具有兩個(gè)Multi-Head attention層,一個(gè)點(diǎn)前饋層,并且在每個(gè)子層之后都包含剩余連接和層歸一化。
    的頭像 發(fā)表于 06-10 14:32 ?882次閱讀
    Transformer<b class='flag-5'>架構(gòu)</b>中<b class='flag-5'>解碼器</b>的工作流程

    Transformer架構(gòu)編碼器的工作流程

    編碼器是Transformer體系結(jié)構(gòu)的基本組件。編碼器的主要功能是將輸入標(biāo)記轉(zhuǎn)換為上下文表示。與早期獨(dú)立處理token的模型不同,Transformer編碼器根據(jù)整個(gè)序列捕獲每個(gè)token的上下文。
    的頭像 發(fā)表于 06-10 14:27 ?810次閱讀
    Transformer<b class='flag-5'>架構(gòu)</b>中<b class='flag-5'>編碼器</b>的工作流程

    TWL6040 用于便攜式應(yīng)用的 8 通道高質(zhì)量低功耗音頻編解碼器數(shù)據(jù)手冊(cè)

    TWL6040 設(shè)備是具有高集成度的音頻編碼器/解碼器(編解碼器),可為便攜式應(yīng)用程序提供模擬音頻編解碼器功能,如 所示。該設(shè)備包含多個(gè)音頻模擬輸入和輸出,以及麥克風(fēng)偏置和附件檢測(cè)。該
    的頭像 發(fā)表于 04-27 17:52 ?742次閱讀
    TWL6040 用于便攜式應(yīng)用的 8 通道高<b class='flag-5'>質(zhì)量</b>低功耗音頻編<b class='flag-5'>解碼器</b>數(shù)據(jù)手冊(cè)

    解碼未來:數(shù)字編碼器如何重塑智能世界

    標(biāo)題:《解碼未來:數(shù)字編碼器如何重塑智能世界》 在數(shù)字化浪潮席卷全球的今天,每一個(gè)微小的信號(hào)轉(zhuǎn)換都可能成為推動(dòng)技術(shù)革命的關(guān)鍵。而在這場(chǎng)無聲的變革中,數(shù)字編碼器——這個(gè)看似不起眼的技術(shù)組件,正以
    的頭像 發(fā)表于 04-07 08:44 ?580次閱讀
    <b class='flag-5'>解碼</b>未來:數(shù)字<b class='flag-5'>編碼器</b>如何重塑智能世界

    編碼器與無軸承編碼器,到底如何選擇?

    在選擇軸編碼器與無軸承編碼器時(shí),需要根據(jù)具體的應(yīng)用場(chǎng)景、性能需求、環(huán)境條件和成本預(yù)算等因素進(jìn)行綜合考慮。以下是對(duì)兩者的詳細(xì)對(duì)比,以幫助做出合適的選擇: 一、工作原理與結(jié)構(gòu) 1. 軸編碼器
    的頭像 發(fā)表于 03-11 15:33 ?977次閱讀
    軸<b class='flag-5'>編碼器</b>與無軸承<b class='flag-5'>編碼器</b>,到底如何選擇?

    伺服電機(jī)編碼器怎么選型

    伺服電機(jī)編碼器的選型是一個(gè)綜合性的過程,需要考慮多個(gè)因素以確保所選編碼器能夠滿足系統(tǒng)的性能要求。以下是一些關(guān)鍵的選型步驟和考慮因素: 一、明確應(yīng)用需求 首先,需要明確伺服電機(jī)編碼器的應(yīng)用需求,包括
    的頭像 發(fā)表于 03-11 12:01 ?1442次閱讀
    伺服電機(jī)<b class='flag-5'>編碼器</b>怎么選型

    監(jiān)控網(wǎng)絡(luò)高清視頻解碼器,開啟安防監(jiān)控新時(shí)代

    監(jiān)控網(wǎng)絡(luò)高清視頻解碼器,開啟安防監(jiān)控新時(shí)代 在安防監(jiān)控領(lǐng)域,您是否還在為設(shè)備兼容性差、操作復(fù)雜、畫面顯示效果不佳而煩惱?現(xiàn)在,一款全新的監(jiān)控網(wǎng)絡(luò)高清視頻解碼器震撼登場(chǎng),為您徹底解決這些
    的頭像 發(fā)表于 02-20 14:59 ?1460次閱讀
    監(jiān)控<b class='flag-5'>網(wǎng)絡(luò)</b>高清視頻<b class='flag-5'>解碼器</b>,開啟安防監(jiān)控新時(shí)代

    DISCOAA編碼器性質(zhì)特點(diǎn)

    DISCOAA編碼器的具體詳細(xì)資料或參數(shù) ?。不過,我們可以根據(jù)編碼器的通用知識(shí)和一些相關(guān)信息來概述編碼器的一般特點(diǎn)和類型。 編碼器通常用于將機(jī)械運(yùn)動(dòng)或位置轉(zhuǎn)換為電信號(hào),以便進(jìn)行監(jiān)測(cè)、
    的頭像 發(fā)表于 02-20 13:50 ?613次閱讀

    DISCOAA編碼器類型功能

    DISCOAA編碼器可能包括絕對(duì)編碼器和增量編碼器兩種類型,其主要功能是將輸入信號(hào)進(jìn)行分析和處理,并將其轉(zhuǎn)換為數(shù)字信號(hào) ?。 關(guān)于類型,雖然搜索結(jié)果中并未直接提及DISCOAA編碼器
    的頭像 發(fā)表于 02-20 13:47 ?664次閱讀

    絕對(duì)值編碼器圈與多圈有哪些區(qū)別?

    絕對(duì)值編碼器圈與多圈有哪些區(qū)別?港口起重機(jī)械更是多圈絕對(duì)值編碼器的 “用武之地”。門式起重機(jī)在吊運(yùn)集裝箱時(shí),大車、小車的長(zhǎng)距離移動(dòng)以及吊具的升降旋轉(zhuǎn),涉及大量復(fù)雜的多圈轉(zhuǎn)動(dòng)操作。多圈絕對(duì)值
    的頭像 發(fā)表于 01-23 16:18 ?1501次閱讀
    絕對(duì)值<b class='flag-5'>編碼器</b><b class='flag-5'>單</b>圈與多圈有哪些區(qū)別?

    伺服電機(jī)編碼器故障及維修

    伺服電機(jī)編碼器故障及維修,伺服電機(jī)編碼器4大常見故障,編碼器信號(hào)丟失或不穩(wěn)定,編碼器零點(diǎn)偏移,編碼器過熱,
    的頭像 發(fā)表于 01-21 14:49 ?3818次閱讀
    伺服電機(jī)<b class='flag-5'>編碼器</b>故障及維修

    增量式編碼器圈和多圈怎么知道,如何分辯?

    在工業(yè)自動(dòng)化領(lǐng)域,增量式編碼器是一種常用的測(cè)量設(shè)備。殊不知,不少人在面對(duì)增量式編碼器時(shí),經(jīng)常會(huì)對(duì)圈和多圈的類型困惑不已,不知道該如何準(zhǔn)確區(qū)分和判斷。今天,我們就來深入探討一下這個(gè)問題,幫助您清晰
    的頭像 發(fā)表于 01-09 16:40 ?1187次閱讀

    拉線編碼器關(guān)鍵參數(shù)詳解

    在工業(yè)自動(dòng)化和精密測(cè)量領(lǐng)域,拉線編碼器以其高精度、長(zhǎng)壽命和靈活的安裝方式,成為了眾多應(yīng)用場(chǎng)合的首選。然而,面對(duì)市場(chǎng)上琳瑯滿目的拉線編碼器產(chǎn)品,如何挑選一款符合自己需求的編碼器,成為了許多工程師和采購(gòu)人員面臨的挑戰(zhàn)。本文將詳細(xì)介紹
    的頭像 發(fā)表于 01-07 15:53 ?1196次閱讀