最近來自馬克斯?普朗克計(jì)算機(jī)科學(xué)研究所、MIT CSAIL和谷歌的研究者們研究了一種控制GAN的新方法DragGAN,這項(xiàng)技術(shù)的特點(diǎn)是,用戶只要點(diǎn)擊拖拽,就可以“改變汽車的尺寸或者將人物的笑容變成皺眉”。
其中演示的案例包括增加山峰的高度、改變模特的姿勢(shì)和衣服的長度以及形狀、張開或閉合獅子的嘴巴、將一個(gè)人的表情從平淡變成微笑等。
DragGAN是一個(gè)直觀的圖像編輯工具PM系統(tǒng),用戶只需要控制圖像中的像素點(diǎn)和方向,就可以快速調(diào)整照片主體的位置、姿態(tài)、表情、大小和角度等。
而根據(jù)他們的說法,他們的方法是基于GAN的操作中優(yōu)于SOTA,并為圖像編輯開辟了新方向。
這種工具的潛力主要表現(xiàn)在,從文本生成圖像的人工智能并不總是能輸出你想要的結(jié)果,同時(shí)用戶還可以在生成圖像之后再進(jìn)行重新編輯,而且不用重新生成新的圖像。
以上源自互聯(lián)網(wǎng),版權(quán)歸原作所有
審核編輯黃宇
-
AI
+關(guān)注
關(guān)注
89文章
38124瀏覽量
296718
發(fā)布評(píng)論請(qǐng)先 登錄
使用Firebase AI Logic生成圖像模型的兩種新功能
華為發(fā)布并開源創(chuàng)新AI容器技術(shù)Flex:ai
NVIDIA推出面向語言、機(jī)器人和生物學(xué)的全新開源AI技術(shù)
基于開源鴻蒙的圖片編輯開發(fā)樣例(1)

AI圖像編輯技術(shù)DragGAN開源,拖動(dòng)鼠標(biāo)即可改變?nèi)宋镄θ?/h1>
評(píng)論