chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

杜克大學的研究團隊研發(fā)了一個AI圖像生成模型PULSE

倩倩 ? 來源:雷鋒網(wǎng) ? 2020-07-16 11:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,杜克大學的研究團隊研發(fā)了一個AI圖像生成模型PULSE。PULSE可以在5秒鐘內(nèi)將低分辨率的人像轉(zhuǎn)換成清晰、逼真的人像。要指出的是,PULSE所做的工作并不是把輸入的低分辨率人像變成一張高分辨率的人像,而是“一對多”地輸出許多張面部細節(jié)各不相同的高分辨率人像。比如,用戶輸入一張16*16分辨率的圖像,PULSE可輸出一組1024*1024分辨率的圖像。

這項研究于本月在計算機視覺與模式識別頂會CVPR 2020上發(fā)表,論文標題為《PULSE:通過對生成模型的潛在空間探索實現(xiàn)自監(jiān)督照片上采樣(PULSE:Self-Supervised Photo Upsampling via Latent Space Exploration of Generative Models)》。

論文鏈接:https://drive.google.com/file/d/1fV7FsmunjDuRrsn4KYf2Efwp0FNBtcR4/view

PULSE項目官網(wǎng):http://pulse.cs.duke.edu/

GitHub:https://github.com/adamian98/pulse

一、PULSE:能為天文學/醫(yī)學提供參考

在好萊塢間諜電影中,肩負拯救世界重任的特工常常采用高科技手段、把一張模糊的兇犯照片還原成清晰的人臉照片。現(xiàn)實中,許多研究人員致力于用AI技術(shù)使電影中的炫酷場景成真。但是,現(xiàn)有AI模型的性能普遍較差,生成的人臉圖像往往與照片主人公的真實長相并不相似。

杜克大學計算機科學專業(yè)教授Cynthia Rudin指出,這是因為低像素圖像中的信息較少,AI模型無法準確地“補足”缺失信息、進而還原出清晰人臉圖像。因此,用AI技術(shù)對模糊人像進行面部識別十分困難。

Rudin團隊認為,雖然不能用于模糊人像的面部識別,但是這類AI模型可以作為一種分類和探索工具,用于天文學、醫(yī)學等難以獲得清晰圖像的領(lǐng)域。也就是說,基于模糊圖像中缺失信息的各種可能性,AI模型可以生成許多清晰的圖像,生成的多種圖像可以為天文學、醫(yī)學等領(lǐng)域研究人員提供參考。

基于這種設(shè)想,杜克大學研究人員研發(fā)了基于生成式對抗網(wǎng)絡(luò)(GAN)的圖像超分辨率模型PULSE。PULSE模型基于NVIDIA的StyleGAN算法進行開發(fā)。

二、降尺度損失方法:用生成圖像“倒推”模糊圖,相似才能輸出

為了保證輸出圖像與輸入圖像的“對應(yīng)性”,研究人員在PULSE模型中應(yīng)用了一種“降尺度損失(downscaling loss)”方法。

當PULSE模型的生成網(wǎng)絡(luò)提議以一張清晰圖像作為輸出時,判別網(wǎng)絡(luò)會把這張清晰圖像的分辨率降低到與輸入圖像相等的水平。然后,判別網(wǎng)絡(luò)會對比降尺度損失圖像與輸入圖像之間的相似性。

只有在降尺度損失圖像與輸入圖像相似性較高時,判別網(wǎng)絡(luò)才會判定生成網(wǎng)絡(luò)提議的清晰圖片可以作為輸出。

▲基于同一張模糊的圖像,PULSE可以生成面部細節(jié)不同的清晰圖像

三、40位評估者參與打分,PULSE模型MOS得分最高

研究人員用高分辨人臉數(shù)據(jù)集CelebA HQ評估PULSE的性能。為了進行對比,研究人員利用CelebA HQ數(shù)據(jù)集訓練了監(jiān)督模型BICBIC、FSRNET和FSRGAN。

所有模型均以16*16分辨率的圖像作為輸入,BICBIC、FSRNET和FSRGAN模型以128*128分辨率圖像作為輸出,PULSE模型以128*128分辨率圖像和1024*1024分辨率圖像作為輸出。

評估結(jié)果顯示,圖像質(zhì)量方面,PULSE模型在生成眼睛、嘴唇等圖像細節(jié)方面的能力優(yōu)于其他模型。

▲PULSE生成圖像的嘴唇、眼睛更加清晰

接下來,研究人員用平均意見分數(shù)(MOS)測試來定量評估模型的分辨率。研究人員應(yīng)用6個模型生成128*128分辨率的圖像,邀請40位評估者對6個模型的輸出結(jié)果進行打分。

用于對比的模型分別是:HR、Nearest、Bicubic、FSRNet、FSRGAN。

結(jié)果顯示,PULSE的MOS分數(shù)最高,為3.60,即評估者認為PULSE模型生成的圖像分辨率最高。

結(jié)語:代碼已在GitHub開源,用戶擔憂種族偏見

本項研究中,杜克大學研發(fā)的PULSE模型能夠基于一張模糊的人像,生成多張面部細節(jié)不同的清晰人像,為使用者提供一個可能的參考范圍。目前,研究團隊已將模型代碼在GitHub開源,鼓勵其他開發(fā)者進行實驗。

研究人員稱,在未來,PULSE或可被用于天文學、醫(yī)學等領(lǐng)域。比如,一位天文學研究人員可以輸入一張模糊的黑洞圖像,并獲得許多可能的天體照片。

同時,也有人對PULSE的種族偏見問題表示擔憂。有Twitter用戶爆料稱,其在PULSE模型中輸入深膚色種族(比如奧巴馬的照片)的人臉照片后,PULSE輸出了白人的照片。研究人員稱,目前他們正嘗試通過引入更廣泛的數(shù)據(jù)集解決這一問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1094

    瀏覽量

    41256
  • 面部識別
    +關(guān)注

    關(guān)注

    1

    文章

    375

    瀏覽量

    27214
  • ai技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    1308

    瀏覽量

    25155
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    谷歌新生成AI媒體模型登陸Vertex AI平臺

    我們在 Vertex AI 上推出新生成AI 媒體模型: Imagen 4、Veo 3 和 Lyria 2。
    的頭像 發(fā)表于 06-18 09:56 ?375次閱讀

    利用NVIDIA 3D引導生成AI Blueprint控制圖像生成

    AI 賦能的圖像生成技術(shù)突飛猛進,從早期模型生成手指過多的人類圖像,到現(xiàn)在能創(chuàng)造出令人驚嘆的逼
    的頭像 發(fā)表于 06-05 09:24 ?387次閱讀

    文詳解視覺語言模型

    視覺語言模型(VLM)是種多模態(tài)、生成AI 模型,能夠理解和處理視頻、圖像和文本。
    的頭像 發(fā)表于 02-12 11:13 ?1760次閱讀
    <b class='flag-5'>一</b>文詳解視覺語言<b class='flag-5'>模型</b>

    字節(jié)豆包大模型團隊成立AGI長期研究團隊Seed Edge

     據(jù)1月24日的報道,字節(jié)跳動旗下的豆包大模型團隊已悄然組建了專注于通用人工智能(AGI)的長期研究
    的頭像 發(fā)表于 01-24 15:03 ?1605次閱讀

    兩大AI模型性能提升 登上國際榜單

    近日,由盛大AI團隊研發(fā)模型Watt-tool-70B和Newsbang/homer-72B,登上國際知名AI排行榜榜首。其中,Watt-
    的頭像 發(fā)表于 01-16 12:01 ?910次閱讀
    兩大<b class='flag-5'>AI</b><b class='flag-5'>模型</b>性能提升 登上國際榜單

    胡瀚接棒騰訊多模態(tài)大模型研發(fā)

    騰訊的杰出科學家和混元大模型技術(shù)團隊的核心成員,曾在推動騰訊在人工智能領(lǐng)域的發(fā)展中發(fā)揮了重要作用。然而,去年11月,有消息稱劉威已從騰訊離職,這消息引發(fā)了業(yè)界對于騰訊
    的頭像 發(fā)表于 01-09 15:49 ?731次閱讀

    借助谷歌Gemini和Imagen模型生成高質(zhì)量圖像

    在快速發(fā)展的生成AI 領(lǐng)域,結(jié)合不同模型的優(yōu)勢可以帶來顯著的成果。通過利用谷歌的 Gemini 模型來制作詳細且富有創(chuàng)意的提示,然后使用 Imagen 3
    的頭像 發(fā)表于 01-03 10:38 ?897次閱讀
    借助谷歌Gemini和Imagen<b class='flag-5'>模型</b><b class='flag-5'>生成</b>高質(zhì)量<b class='flag-5'>圖像</b>

    Google兩款先進生成AI模型登陸Vertex AI平臺

    新的 AI 模型,包括最先進的視頻生成模型Veo以及最高品質(zhì)的圖像生成
    的頭像 發(fā)表于 12-30 09:56 ?622次閱讀

    NVIDIA推出全新生成AI模型Fugatto

    NVIDIA 開發(fā)了全新的生成AI 模型。利用輸入的文本和音頻,該
    的頭像 發(fā)表于 11-27 11:29 ?819次閱讀

    AI模型的訓練數(shù)據(jù)來源分析

    學術(shù)機構(gòu)、政府組織或企業(yè)公開發(fā)布,涵蓋了各種類型的數(shù)據(jù),如圖像、文本、音頻、視頻等。例如: ImageNet :廣泛用于圖像識別任務(wù)的大規(guī)模圖像
    的頭像 發(fā)表于 10-23 15:32 ?3669次閱讀

    AI模型的最新研究進展

    AI模型的最新研究進展體現(xiàn)在多個方面,以下是對其最新進展的介紹: 、技術(shù)創(chuàng)新與突破 生成AI
    的頭像 發(fā)表于 10-23 15:19 ?1512次閱讀

    AI模型圖像識別中的優(yōu)勢

    AI模型圖像識別中展現(xiàn)出了顯著的優(yōu)勢,這些優(yōu)勢主要源于其強大的計算能力、深度學習算法以及大規(guī)模的數(shù)據(jù)處理能力。以下是對AI模型
    的頭像 發(fā)表于 10-23 15:01 ?2436次閱讀

    Freepik攜手Magnific AI推出AI圖像生成

    近日,設(shè)計資源巨頭Freepik攜手Magnific AI,共同推出了革命性的AI圖像生成器——Freepik Mystic,這里程碑式的
    的頭像 發(fā)表于 08-30 16:23 ?1582次閱讀

    Meta發(fā)布Imagine Yourself AI模型,重塑個性化圖像生成未來

    Meta公司近日在人工智能領(lǐng)域邁出了重要步,隆重推出了其創(chuàng)新之作——“Imagine Yourself”AI模型,這突破性技術(shù)為個性化圖像
    的頭像 發(fā)表于 08-26 10:59 ?1003次閱讀

    人手AI是如何誕生的?

    2023年是AI大語言模型爆發(fā)的年,以O(shè)penAI推出的GPT大模型為起始,整個行業(yè)開始從“推理式AI”向“
    的頭像 發(fā)表于 07-23 10:33 ?470次閱讀