chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

蒙娜麗莎一鍵復(fù)活 三星AI一張圖片就能合成動(dòng)畫(huà)

電子工程師 ? 來(lái)源:fqj ? 2019-05-27 17:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

還記得哈利?波特第一次來(lái)到霍格沃茨看到墻上那些既會(huì)動(dòng)又會(huì)說(shuō)話的掛畫(huà)是多么驚訝嗎?如果我們可以將掛畫(huà) “復(fù)活”,和 500 多年前的蒙娜麗莎來(lái)場(chǎng)穿越時(shí)空的對(duì)話會(huì)怎樣呢?感謝 AI 技術(shù),把畫(huà) “復(fù)活” 不再是夢(mèng)!

名畫(huà)《蒙娜麗莎的微笑》,會(huì)動(dòng)了!

夢(mèng)娜麗莎轉(zhuǎn)過(guò)頭,嘴里說(shuō)著話,微微眨了眨眼,臉上帶著溫婉的微笑。

是的,《哈利·波特》世界中”會(huì)動(dòng)的畫(huà)“魔法實(shí)現(xiàn)了!來(lái)自三星AI中心(Samsung AI Center)和莫斯科斯的Skolkovo 科學(xué)技術(shù)研究所的一組研究人員,開(kāi)發(fā)了一個(gè)能將讓JPEG變GIF的AI系統(tǒng)。

《哈利·波特》中守衛(wèi)格蘭芬多學(xué)院休息室的胖夫人畫(huà)像

更牛逼的是,該技術(shù)完全無(wú)需3D建模,僅需一張圖片就能訓(xùn)練出惟妙惟肖的動(dòng)畫(huà)。研究人員稱這種學(xué)習(xí)方式為“few-shot learning"。當(dāng)然,如果有多幾張照片——8張或32張——?jiǎng)?chuàng)造出來(lái)動(dòng)圖效果就更逼真了。比如:

愛(ài)因斯坦給你講物理:

瑪麗蓮夢(mèng)露和你 flirt:

本周,三星AI實(shí)驗(yàn)室的研究人員發(fā)表了一篇題為 “Few-Shot Adversarial Learning of Realistic Neural Talking Head Models” 的論文,概述了這種技術(shù)。該技術(shù)基于卷積神經(jīng)網(wǎng)絡(luò),其目標(biāo)是獲得一個(gè)輸入源圖像,模擬目標(biāo)輸出視頻中某個(gè)人的運(yùn)動(dòng),從而將初始圖像轉(zhuǎn)換為人物正在說(shuō)話的短視頻。

論文一發(fā)表馬上引起轟動(dòng),畢竟這項(xiàng)技術(shù)創(chuàng)造了巨大的想象空間!

類似這樣的項(xiàng)目有很多,所以這個(gè)想法并不特別新穎。但在這篇論文中,最有趣的是,該系統(tǒng)不需要大量的訓(xùn)練示例,而且系統(tǒng)只需要看一次圖片就可以運(yùn)行。這就是為什么它讓《蒙娜麗莎》活起來(lái)。

3個(gè)神經(jīng)網(wǎng)絡(luò),讓蒙娜麗莎活起來(lái)

這項(xiàng)技術(shù)采用“元學(xué)習(xí)”架構(gòu),如下圖所示:

圖2:“讓照片動(dòng)起來(lái)”元學(xué)習(xí)架構(gòu)

具體來(lái)說(shuō),涉及三個(gè)神經(jīng)網(wǎng)絡(luò):

首先,嵌入式網(wǎng)絡(luò)映射輸入圖像中的眼睛、鼻子、嘴巴大小等信息,并將其轉(zhuǎn)換為向量;

其次,生成式網(wǎng)絡(luò)通過(guò)繪制人像的面部地標(biāo)(face landmarks)來(lái)復(fù)制人在視頻中的面部表情;

第三,鑒別器網(wǎng)絡(luò)將來(lái)自輸入圖像的嵌入向量粘貼到目標(biāo)視頻的landmark上,使輸入圖像能夠模擬視頻中的運(yùn)動(dòng)。

最后,計(jì)算“真實(shí)性得分”。該分?jǐn)?shù)用于檢查源圖像與目標(biāo)視頻中的姿態(tài)的匹配程度。

元學(xué)習(xí)過(guò)程:只需1張輸入圖像

研究人員使用VoxCeleb2數(shù)據(jù)集對(duì)這個(gè)模型進(jìn)行了預(yù)訓(xùn)練,這是一個(gè)包含許多名人頭像的數(shù)據(jù)庫(kù)。在這個(gè)過(guò)程中,前面描述的過(guò)程是一樣的,但是這里的源圖像和目標(biāo)圖像只是同一視頻的不同幀。

因此,這個(gè)系統(tǒng)不是讓一幅畫(huà)去模仿視頻中的另一個(gè)人,而是有一個(gè)可以與之比較的ground truth。通過(guò)持續(xù)訓(xùn)練,直到生成的幀與訓(xùn)練視頻中的真實(shí)幀十分相似為止。

預(yù)訓(xùn)練階段允許模型在只有很少示例的輸入上工作。哪怕只有一張圖片可用時(shí),結(jié)果也不會(huì)太糟,但當(dāng)有更多圖片可用時(shí),結(jié)果會(huì)更加真實(shí)。

實(shí)驗(yàn)和結(jié)果

研究人員使用2個(gè)數(shù)據(jù)集分別進(jìn)行定量和定性評(píng)估:VoxCeleb1數(shù)據(jù)集用于與基準(zhǔn)模型進(jìn)行比較,VoxCeleb2用于展示他們所提出方法的效果。

研究人員在三種不同的設(shè)置中將他們的模型與基準(zhǔn)模型進(jìn)行了比較,使用fine-tuning集中的1幀、8幀和32幀。

蒙娜麗莎一鍵復(fù)活 三星AI一張圖片就能合成動(dòng)畫(huà)

表1:few-shot learning設(shè)置下不同方法的定量比較

結(jié)果如表1上半部分所示,基線模型在兩個(gè)相似性度量上始終優(yōu)于我們的方法。

不過(guò),這些指標(biāo)不能完全代表人類的感知,因?yàn)檫@兩種方法都會(huì)產(chǎn)生恐怖谷偽影,從圖3的定性比較和用戶研究結(jié)果可以看出。

另一方面,余弦相似度與視覺(jué)質(zhì)量有更好的相關(guān)性,但仍然傾向于模糊、不太真實(shí)的圖像,這也可以通過(guò)表1-Top與圖3中的比較結(jié)果看出。

圖3:使用1張、8張和32張訓(xùn)練圖像時(shí)的三個(gè)示例。系統(tǒng)采用一個(gè)源圖像(第1列),并嘗試將該圖像映射到ground truth幀中的相同位置(第2列)。研究人員將他們的結(jié)果與X2Face、PixtopixHD模型進(jìn)行了比較。

大規(guī)模的結(jié)果。

隨后,我們擴(kuò)展可用的數(shù)據(jù),并在更大的VoxCeleb2數(shù)據(jù)集中訓(xùn)練我們的方法。

下面是2個(gè)變體模型的結(jié)果:

圖4:在VoxCeleb2數(shù)據(jù)集中的最佳模型的結(jié)果。

同樣,訓(xùn)練幀的數(shù)量是T(左邊的數(shù)字),第1列是示例訓(xùn)練幀。第2列是ground truth圖像,后3列分別是我們的FF feed-forward 模型及微調(diào)前后的結(jié)果。雖然 feed-forward變體的學(xué)習(xí)更快速,但fine-tuning 最終提供了更好的真實(shí)感和保真度。

最后,我們展示了的照片和繪畫(huà)的結(jié)果。

圖5:讓靜態(tài)照片“活”起來(lái)

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 三星電子
    +關(guān)注

    關(guān)注

    34

    文章

    15891

    瀏覽量

    182883
  • AI
    AI
    +關(guān)注

    關(guān)注

    90

    文章

    38189

    瀏覽量

    297024

原文標(biāo)題:蒙娜麗莎一鍵“復(fù)活”!三星AI Lab:只需一張圖片就能合成動(dòng)畫(huà)

文章出處:【微信號(hào):aicapital,微信公眾號(hào):全球人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    分享---儲(chǔ)能UI界面能量流動(dòng)動(dòng)畫(huà)實(shí)現(xiàn)方法

    工程,工程分辨率選中1024*600 設(shè)備型號(hào)選擇 HMT070ETA-D 創(chuàng)建工程后,新建個(gè)頁(yè)面PG0000 導(dǎo)入一張背景圖,并此圖片設(shè)置為PG0000頁(yè)面的背景圖 第2步:建立動(dòng)畫(huà)
    發(fā)表于 09-02 18:22

    回收三星S21指紋排線 適用于三星系列指紋模組

    深圳帝歐電子回收三星S21指紋排線,收購(gòu)適用于三星S21指紋模組。回收三星指紋排線,收購(gòu)三星指紋排線,全國(guó)高價(jià)回收三星指紋排線,專業(yè)求購(gòu)指紋
    發(fā)表于 05-19 10:05

    全新上線IPC精彩時(shí)刻!配套On-App AI視頻剪輯模板+全天候一鍵抓拍

    次走路、日出日落等),并一鍵生成帶特效的專屬Vlog。能夠滿足嬰兒/寵物看護(hù)、生活?yuàn)蕵?lè)、風(fēng)景旅行等全場(chǎng)景需求,幫助用戶輕松記錄生活中的高光時(shí)刻!針對(duì)有視頻處理需
    的頭像 發(fā)表于 05-08 19:06 ?809次閱讀
    全新上線IPC精彩時(shí)刻!配套On-App <b class='flag-5'>AI</b>視頻剪輯模板+全天候<b class='flag-5'>一鍵</b>抓拍

    U盤(pán)一鍵制作

    在電腦維修中啟動(dòng)盤(pán)很重要,靠譜的u盤(pán)一鍵啟動(dòng)制作方法
    發(fā)表于 05-06 16:10 ?44次下載

    三星在4nm邏輯芯片上實(shí)現(xiàn)40%以上的測(cè)試良率

    三星電子在 HBM3 時(shí)期遭遇了重大挫折,將 70% 的 HBM 內(nèi)存市場(chǎng)份額拱手送給主要競(jìng)爭(zhēng)對(duì)手 SK 海力士,更是近年來(lái)首度讓出了第大 DRAM 原廠的寶座。這迫使三星在 HBM4 上采用
    發(fā)表于 04-18 10:52

    LoRa無(wú)線一鍵報(bào)警安防建設(shè)方案

    SOS緊急呼叫按鈕具有緊急情況下一鍵報(bào)警的功能,可與報(bào)警主機(jī)配合使用,支持標(biāo)準(zhǔn)LoRaWAN協(xié)議。lora緊急按鈕具有緊急情況下一鍵報(bào)警功能,可與報(bào)警主機(jī)配合使用,支持標(biāo)準(zhǔn)LoRaWAN協(xié)議。如遇
    的頭像 發(fā)表于 02-28 14:41 ?1028次閱讀
    LoRa無(wú)線<b class='flag-5'>一鍵</b>報(bào)警安防建設(shè)方案

    白光直接照到dmd上,透射一張白色圖片為什么會(huì)出現(xiàn)這么多顏色?

    白光直接照到dmd上 透射一張白色圖片 為什么會(huì)出現(xiàn)這么多顏色 理論上不是只有向右反射出白方塊嗎
    發(fā)表于 02-28 07:36

    開(kāi)關(guān)柜一鍵順控在一鍵停電、一鍵送電中的作用

    蜀瑞創(chuàng)新為大家科普,開(kāi)關(guān)柜一鍵順控技術(shù)在一鍵停電和一鍵送電中發(fā)揮了快速響應(yīng)、減少人為錯(cuò)誤、提高安全性、簡(jiǎn)化操作流程、降低操作風(fēng)險(xiǎn)、提高送電成功率等綜合優(yōu)勢(shì),對(duì)于提升電力系統(tǒng)的運(yùn)行效率、安全性以及自動(dòng)化水平具有重要意義。
    的頭像 發(fā)表于 02-27 09:13 ?1265次閱讀

    DLP4500能否上傳圖片,然后給正向觸發(fā),每次觸發(fā)就投影一張圖片?

    求教DLP 4500能否上傳組912*1140分辨率的bmp圖片,然后給正向觸發(fā),每次觸發(fā)投影一張圖片? 如果可以,如何操作,user‘s guide貌似沒(méi)看到這種操作。附件為其中
    發(fā)表于 02-27 07:28

    用DLP4500燒錄98bit位深度的相移圖,3合成一張24bit,結(jié)果每一張24bit都重復(fù)投射次,這是為什么?

    你好,吳工,用DLP4500燒錄98bit位深度的相移圖,3合成一張24bit,結(jié)果每一張24bit都重復(fù)投射
    發(fā)表于 02-24 08:00

    DLP4710一張張加載圖片顯示這個(gè)速度是否能夠更改?

    工程師您好,DMD一張張加載圖片顯示這個(gè)速度是否能夠更改?在DMD上加載圖片顯示目前只能6幀/s。如果需要提高速度應(yīng)該從哪里去考慮?謝謝回答。
    發(fā)表于 02-21 12:12

    DLP3010EVM-LC編輯固件時(shí),選擇上電投影的splash,實(shí)際上電時(shí)總會(huì)先投影一張棋盤(pán)格圖片再投影設(shè)置的圖片,為什么?

    在編輯dlp3010的固件時(shí),更改了splash的四圖片,并設(shè)置上電投影其中一張,實(shí)際燒錄之后,evm上電總是先顯示一張棋盤(pán)格圖片(并不
    發(fā)表于 02-20 07:29

    UOS AI:一鍵解鎖未來(lái)辦公新姿勢(shì)

    瀏覽新聞尋找素材,長(zhǎng)篇大論眼花繚亂? 選中內(nèi)容后 「AI隨航」 圖標(biāo)自動(dòng)顯現(xiàn) ,鼠標(biāo)懸停圖標(biāo)后點(diǎn)擊選擇相應(yīng)功能,幾秒幫你總結(jié)內(nèi)容,還能選中想要的內(nèi)容一鍵續(xù)寫(xiě)潤(rùn)色和花式擴(kuò)寫(xiě)! 老板夸你“效率堪比 AI
    的頭像 發(fā)表于 02-19 10:54 ?1145次閱讀
    UOS <b class='flag-5'>AI</b>:<b class='flag-5'>一鍵</b>解鎖未來(lái)辦公新姿勢(shì)

    三星發(fā)布Vision AI,打造個(gè)性化AI屏幕體驗(yàn)

    近日,在2025年國(guó)際消費(fèi)電子展(CES 2025)“First Look”活動(dòng)上,三星震撼發(fā)布了其最新的科技成果——三星Vision AI。這創(chuàng)新技術(shù)旨在通過(guò)個(gè)性化的
    的頭像 發(fā)表于 01-14 14:58 ?1142次閱讀

    三星推出AI家電訂閱俱樂(lè)部計(jì)劃

    三星電子近期在韓國(guó)市場(chǎng)推出了項(xiàng)創(chuàng)新的AI訂閱俱樂(lè)部計(jì)劃,該計(jì)劃旨在為消費(fèi)者提供個(gè)全新的方式來(lái)體驗(yàn)和享受三星的高端家電及
    的頭像 發(fā)表于 12-13 15:42 ?1068次閱讀