chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

EditGAN圖像編輯框架將影響未來(lái)幾代GAN的發(fā)展

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:Nathan Horrocks ? 2022-04-06 16:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

編輯貓、汽車(chē)甚至古董畫(huà)照片的愿望,由于一種稱(chēng)為EditGAN的生成性對(duì)抗網(wǎng)絡(luò)(GAN)模型,從未像現(xiàn)在這樣容易實(shí)現(xiàn)。來(lái)自 NVIDIA,多倫多大學(xué)和 MIT 研究人員的工作建立了 DatasetGAN ,這是一種人工智能視覺(jué)模型,可以用最少16個(gè)人類(lèi)注釋的圖像來(lái)訓(xùn)練,并像其他需要100X更多圖像的方法一樣有效地執(zhí)行。EditGAN 利用了前一個(gè)模型的功能,允許用戶使用簡(jiǎn)單的命令(如繪圖)編輯或操作所需的圖像,而不會(huì)影響原始圖像質(zhì)量。

什么是 EditGAN ?

根據(jù) paper :“ EditGAN 是第一個(gè) GAN 驅(qū)動(dòng)的圖像編輯框架,它同時(shí)提供非常高精度的編輯,只需要很少的帶注釋的訓(xùn)練數(shù)據(jù)(并且不依賴外部分類(lèi)器),可以實(shí)時(shí)交互運(yùn)行,允許對(duì)多個(gè)編輯進(jìn)行簡(jiǎn)單的合成,并可處理真正的嵌入式、生成的圖像,甚至是域外圖像。”

該模型學(xué)習(xí)特定數(shù)量的編輯向量,這些編輯向量可以交互地應(yīng)用于圖像。本質(zhì)上,它形成了對(duì)圖像及其內(nèi)容的直觀理解,用戶可以利用這些信息進(jìn)行特定的修改和編輯。該模型從相似的圖像中學(xué)習(xí),并識(shí)別圖像中對(duì)象的不同組件和特定部分。用戶可以利用它對(duì)不同子部分進(jìn)行有針對(duì)性的修改,或在特定區(qū)域內(nèi)進(jìn)行編輯。由于模型的精確性,圖像在用戶設(shè)置的參數(shù)之外不會(huì)失真。

“該框架允許我們學(xué)習(xí)任意數(shù)量的編輯向量,然后可以以交互速率直接應(yīng)用于其他圖像。”研究人員在他們的研究中解釋道?!拔覀兊膶?shí)驗(yàn)表明, EditGAN 可以以前所未有的細(xì)節(jié)和自由度處理圖像,同時(shí)保持完整的圖像質(zhì)量。我們還可以輕松地組合多種編輯,并在 EditGAN 的訓(xùn)練數(shù)據(jù)之外執(zhí)行合理的編輯。我們?cè)诟鞣N圖像類(lèi)型上演示了 EditGAN ,并在數(shù)量上優(yōu)于幾種預(yù)處理的圖像標(biāo)準(zhǔn)編輯基準(zhǔn)任務(wù)的編輯方法?!?/p>

從增加微笑、改變別人看的方向、創(chuàng)造新的發(fā)型,或者給汽車(chē)一套更好的輪子,研究人員展示了模型的內(nèi)在性,只需要很少的數(shù)據(jù)注釋。用戶可以根據(jù)所需的編輯繪制簡(jiǎn)單的草圖或遮罩,并引導(dǎo) AI 模型實(shí)現(xiàn)修改,例如更大的貓耳或更酷的汽車(chē)前燈。人工智能然后渲染圖像,同時(shí)保持非常高的精度和原始圖像的質(zhì)量。之后,同樣的編輯可以實(shí)時(shí)應(yīng)用于其他圖像。

poYBAGJNT3iAFP43AAFEfxepoiI936.png

poYBAGJNT3iAFP43AAFEfxepoiI936.png

圖 2 分配給圖像不同部分的像素示例。人工智能可以識(shí)別不同的區(qū)域,并可以根據(jù)人工輸入進(jìn)行編輯。

這是怎么工作的?

Edigan 將圖像的每個(gè)像素指定給一個(gè)類(lèi)別,例如輪胎、擋風(fēng)玻璃或車(chē)架。這些像素在人工智能潛在空間內(nèi)控制,并基于用戶的輸入,用戶可以輕松靈活地編輯這些類(lèi)別。 Edigan 操縱 only 與所需更改相關(guān)的像素。人工智能根據(jù)訓(xùn)練模型時(shí)使用的其他圖像知道每個(gè)像素代表什么,因此你無(wú)法嘗試將貓耳朵添加到汽車(chē)中以獲得準(zhǔn)確的結(jié)果。但是,當(dāng)在正確的模型中使用時(shí), EditGAN 是一個(gè)非凡的工具,可以提供出色的圖像編輯效果。

pYYBAGJNT3qAAggwAANRBkD8Lts841.png

pYYBAGJNT3qAAggwAANRBkD8Lts841.png

圖 3 Edigan 可以訓(xùn)練各種各樣的圖像,從動(dòng)物到環(huán)境,形成對(duì)其內(nèi)容的詳細(xì)理解。

EditGAN 的潛能

人工智能驅(qū)動(dòng)的照片和圖像編輯有可能簡(jiǎn)化攝影師和內(nèi)容創(chuàng)作者的工作流程,并實(shí)現(xiàn)創(chuàng)新和數(shù)字藝術(shù)的新水平。 EditGAN 還使新手?jǐn)z影師和編輯能夠制作高質(zhì)量的內(nèi)容,以及偶爾的病毒性模因。

“這個(gè)人工智能可能會(huì)改變我們編輯照片的方式,也許最終會(huì)改變視頻。它允許人們通過(guò)簡(jiǎn)單的文本命令拍攝圖像并對(duì)其進(jìn)行修改。如果你有一張汽車(chē)照片,你想讓車(chē)輪更大,只需鍵入“ make wheels bigger ”,然后噗 – 這是一張完全真實(shí)的照片,上面是同一輛車(chē)輪更大的汽車(chē)。”—— Fortune magazine

EditGAN 將來(lái)也可能用于其他重要應(yīng)用。例如, EditGAN 的編輯功能可用于創(chuàng)建具有特定特征的大型圖像數(shù)據(jù)集。當(dāng)針對(duì)不同的計(jì)算機(jī)視覺(jué)任務(wù)訓(xùn)練下游機(jī)器學(xué)習(xí)模型時(shí),這種特定的數(shù)據(jù)集可能很有用。

此外, EditGAN 框架可能會(huì)影響未來(lái)幾代 GAN 的發(fā)展。雖然當(dāng)前版本的 EditGAN 側(cè)重于圖像編輯,但類(lèi)似的方法也可能用于編輯 3D 形狀和對(duì)象,這在為游戲、電影或 metaverse 創(chuàng)建虛擬 3D 內(nèi)容時(shí)非常有用。

關(guān)于作者

Nathan Horrocks 是 NVIDIA Research 的內(nèi)容營(yíng)銷(xiāo)經(jīng)理。他重點(diǎn)強(qiáng)調(diào)了 NVIDIA 實(shí)驗(yàn)室在世界各地進(jìn)行的驚人研究。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5696

    瀏覽量

    110142
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50366

    瀏覽量

    267058
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    21

    文章

    2386

    瀏覽量

    84647
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    北汽集團(tuán)與博世中國(guó)簽署戰(zhàn)略合作框架協(xié)議

    4月23日,北汽集團(tuán)與博世中國(guó)簽署戰(zhàn)略合作框架協(xié)議。基于長(zhǎng)期穩(wěn)固的合作基礎(chǔ),雙方進(jìn)一步深化全方位戰(zhàn)略協(xié)同,共同面向未來(lái)出行進(jìn)行前瞻布局,合力推動(dòng)汽車(chē)產(chǎn)業(yè)智能化、新能源化的高質(zhì)量發(fā)展。
    的頭像 發(fā)表于 04-24 15:24 ?354次閱讀

    2026年GaN行業(yè)八大預(yù)測(cè):市場(chǎng)規(guī)模暴增50%;襯底和封裝是投資熱點(diǎn)

    轉(zhuǎn)型,推動(dòng)AI數(shù)據(jù)中心、人形機(jī)器人、電動(dòng)汽車(chē)及可再生能源等領(lǐng)域的高效可持續(xù)發(fā)展。 ? 當(dāng)前,GaN市場(chǎng)正迎來(lái)爆發(fā)式增長(zhǎng):根據(jù)Yole Group和TrendForce最新數(shù)據(jù),2026年全球GaN功率器件市場(chǎng)規(guī)模預(yù)計(jì)達(dá)9.2億美
    的頭像 發(fā)表于 03-01 06:48 ?8648次閱讀

    LuatOS框架的使用(上)

    在資源受限的物聯(lián)網(wǎng)終端設(shè)備中,如何實(shí)現(xiàn)快速開(kāi)發(fā)與穩(wěn)定運(yùn)行是關(guān)鍵挑戰(zhàn)。LuatOS框架通過(guò)Lua語(yǔ)言與底層硬件抽象層深度融合,提供了一套簡(jiǎn)潔高效的開(kāi)發(fā)范式。本文圍繞LuatOS框架
    的頭像 發(fā)表于 01-27 19:38 ?394次閱讀
    LuatOS<b class='flag-5'>框架</b>的使用(上)

    【「芯片設(shè)計(jì)基石——EDA產(chǎn)業(yè)全景與未來(lái)展望」閱讀體驗(yàn)】跟著本書(shū)來(lái)看EDA的奧秘和EDA發(fā)展

    本書(shū)是一本介紹EDA產(chǎn)業(yè)全景與未來(lái)展望的書(shū)籍,主要內(nèi)容分為兩部分,一部分是介紹EDA相關(guān)基礎(chǔ)知識(shí)和全球EDA發(fā)展概況以及發(fā)展趨勢(shì) 另一部分則是介紹中國(guó)EDA事業(yè)萌芽,沉寂,轉(zhuǎn)機(jī),加速,以及未來(lái)
    發(fā)表于 01-21 22:26

    釘釘正式開(kāi)源HarmonyOS圖片編輯組件

    近日,由釘釘團(tuán)隊(duì)自主研發(fā)的“HarmonyOS圖片編輯組件”正式上線OpenHarmony三方庫(kù)中心倉(cāng)并開(kāi)源。作為一款填補(bǔ)鴻蒙社區(qū)圖像處理領(lǐng)域空白的重量級(jí)組件,該方案基于HarmonyOS
    的頭像 發(fā)表于 01-05 09:58 ?694次閱讀

    Neway第三代GaN系列模塊的生產(chǎn)成本

    IGBT良率超95%),低良率導(dǎo)致單片成本上升。Neway通過(guò)優(yōu)化刻蝕、鈍化等關(guān)鍵工藝,良率提升至85%以上。測(cè)試與篩選:GaN器件需額外測(cè)試(如高頻特性、可靠性驗(yàn)證),測(cè)試成本較硅基器件高30%-50
    發(fā)表于 12-25 09:12

    從模擬到AI集成:圖像采集卡的技術(shù)演進(jìn)與未來(lái)三大趨勢(shì)

    軌跡不僅折射出工業(yè)自動(dòng)化與智能感知技術(shù)的進(jìn)步,更預(yù)示著未來(lái)機(jī)器“看懂”世界的全新可能。本文梳理圖像采集卡從模擬時(shí)代到AI集成的技術(shù)演進(jìn)脈絡(luò),并深入剖析其未來(lái)三大
    的頭像 發(fā)表于 12-15 16:30 ?1155次閱讀
    從模擬到AI集成:<b class='flag-5'>圖像</b>采集卡的技術(shù)演進(jìn)與<b class='flag-5'>未來(lái)</b>三大趨勢(shì)

    安森美垂直GaN技術(shù)賦能功率器件應(yīng)用未來(lái)

    在傳統(tǒng)橫向結(jié)構(gòu)的GaN器件中,電流沿芯片表面流動(dòng)。而垂直 GaNGaN 層生長(zhǎng)在氮化鎵襯底上,其獨(dú)特結(jié)構(gòu)使電流能直接從芯片頂部流到底部,而不是僅在表面流動(dòng)。這種垂直電流路徑讓器件能夠承受更高的電壓和更大的電流,從而實(shí)現(xiàn)更高
    的頭像 發(fā)表于 12-04 09:28 ?2091次閱讀
    安森美垂直<b class='flag-5'>GaN</b>技術(shù)賦能功率器件應(yīng)用<b class='flag-5'>未來(lái)</b>

    使用Firebase AI Logic生成圖像模型的兩種新功能

    為您的應(yīng)用添加自定義圖像,能夠顯著改善和個(gè)性化用戶體驗(yàn),有效提高用戶參與度。本文探討使用 Firebase AI Logic 生成圖像的兩種新功能: 其一是 Imagen 專(zhuān)屬編輯
    的頭像 發(fā)表于 11-30 09:28 ?577次閱讀

    安森美入局垂直GaN,GaN進(jìn)入高壓時(shí)代

    電子發(fā)燒友網(wǎng)綜合報(bào)道 近日,安森美發(fā)布器垂直GaN功率半導(dǎo)體技術(shù),憑借 GaN-on-GaN 專(zhuān)屬架構(gòu)與多項(xiàng)性能突破,為全球高功率應(yīng)用領(lǐng)域帶來(lái)革命性解決方案,重新定義了行業(yè)在能效、緊湊性與耐用性上
    的頭像 發(fā)表于 11-10 03:12 ?7862次閱讀

    Leadway GaN系列模塊的功率密度

    Leadway GaN系列模塊以120W/in3的功率密度為核心,通過(guò)材料創(chuàng)新、電路優(yōu)化與封裝設(shè)計(jì),實(shí)現(xiàn)了體積縮減40%、效率提升92%+的突破。其價(jià)值在于為工業(yè)自動(dòng)化、機(jī)器人、電動(dòng)汽車(chē)等空間受限
    發(fā)表于 10-22 09:09

    創(chuàng)龍 瑞芯微 RK3588 國(guó)產(chǎn)2.4GHz八核 工業(yè)開(kāi)發(fā)板—視頻圖像處理框架

    創(chuàng)龍科技研發(fā)的 TL3588-EVM 評(píng)估板依托 RK3588/RK3588J SoC 強(qiáng)大的視頻圖像處理能力,可滿足多場(chǎng)景圖像應(yīng)用需求。為幫助開(kāi)發(fā)者全面了解其視頻圖像處理框架,本文系
    的頭像 發(fā)表于 10-16 11:45 ?1757次閱讀
    創(chuàng)龍 瑞芯微 RK3588 國(guó)產(chǎn)2.4GHz八核 工業(yè)開(kāi)發(fā)板—視頻<b class='flag-5'>圖像</b>處理<b class='flag-5'>框架</b>

    物聯(lián)網(wǎng)未來(lái)發(fā)展趨勢(shì)如何?

    ,人們才會(huì)更加信任和接受物聯(lián)網(wǎng)技術(shù)。 綜上所述,物聯(lián)網(wǎng)行業(yè)的未來(lái)發(fā)展趨勢(shì)非常廣闊。智能家居、工業(yè)互聯(lián)網(wǎng)、智慧城市、醫(yī)療保健以及數(shù)據(jù)安全和隱私保護(hù)都將成為物聯(lián)網(wǎng)行業(yè)的熱點(diǎn)領(lǐng)域。我們有理由相信,在不久的將來(lái),物聯(lián)網(wǎng)進(jìn)一步改變我們
    發(fā)表于 06-09 15:25

    工業(yè)相機(jī)圖像采集卡:技術(shù)剖析、應(yīng)用場(chǎng)景與未來(lái)發(fā)展

    CameraLink、CoaXPress、GigEVision等,高效、穩(wěn)定地數(shù)據(jù)傳輸?shù)接?jì)算機(jī)進(jìn)行后續(xù)的圖像處理、分析和應(yīng)用。本文深入剖析工業(yè)相機(jī)圖像采集卡的技術(shù)細(xì)
    的頭像 發(fā)表于 05-28 13:49 ?932次閱讀
    工業(yè)相機(jī)<b class='flag-5'>圖像</b>采集卡:技術(shù)剖析、應(yīng)用場(chǎng)景與<b class='flag-5'>未來(lái)</b><b class='flag-5'>發(fā)展</b>

    從清華大學(xué)到鎵未來(lái)科技,張大江先生在半導(dǎo)體功率器件十八年的堅(jiān)守!

    從清華大學(xué)到鎵未來(lái)科技,張大江先生在半導(dǎo)體功率器件十八年的堅(jiān)守!近年來(lái),珠海市鎵未來(lái)科技有限公司(以下簡(jiǎn)稱(chēng)“鎵未來(lái)”)在第三代半導(dǎo)體行業(yè)異軍突起,憑借領(lǐng)先的氮化鎵(GaN)技術(shù)儲(chǔ)備和不
    發(fā)表于 05-19 10:16