圖像到圖像的翻譯是一類視覺和圖形問題,其目標(biāo)是學(xué)習(xí)輸入圖像和輸出圖像之間的映射。 它可以應(yīng)用到廣泛的應(yīng)用程序中,例如收集樣式轉(zhuǎn)移,對象變形,季節(jié)轉(zhuǎn)移和照片增強(qiáng)。
CycleGAN
使用周期一致的對抗網(wǎng)絡(luò)進(jìn)行不成對的圖像到圖像翻譯(ICCV 2017)
論文/項(xiàng)目/語義學(xué)者
作者提出了一種在沒有配對示例的情況下學(xué)習(xí)將圖像從源域X轉(zhuǎn)換為目標(biāo)域Y的方法。 目的是學(xué)習(xí)映射G:X→Y,從而利用對抗損失將來自G(X)的圖像分布與分布Y區(qū)分開。 由于此映射的約束嚴(yán)重不足,因此我們將其與反映射F:Y→X耦合,并引入循環(huán)一致性損失以強(qiáng)制執(zhí)行F(G(X))≈X(反之亦然)。
成對的訓(xùn)練數(shù)據(jù)(左)由訓(xùn)練示例構(gòu)成,它們具有一對一的對應(yīng)關(guān)系。 未配對的訓(xùn)練集沒有這種對應(yīng)關(guān)系(摘自本文)
圖取自本文。
該模型包含兩個映射函數(shù)G:X→Y和F:Y→X,以及相關(guān)的對抗標(biāo)識符DY和DX。 DY鼓勵G將X轉(zhuǎn)換為與域Y不可區(qū)分的輸出,反之亦然,對于DX,F(xiàn)和X則相反。 為了進(jìn)一步規(guī)范化映射,他們引入了兩個"周期一致性損失",這些損失捕捉了直覺,即如果我們從一個域轉(zhuǎn)換到另一個域然后再次返回,我們應(yīng)該到達(dá)起點(diǎn)。
StarGAN
用于多域圖像到圖像轉(zhuǎn)換的統(tǒng)一生成對抗網(wǎng)絡(luò)(CVPR 2018)
論文/代碼/語義學(xué)者
現(xiàn)有的圖像到圖像轉(zhuǎn)換方法在處理兩個以上的域時具有有限的可擴(kuò)展性和魯棒性,因?yàn)閼?yīng)該為每對圖像域分別構(gòu)建不同的模型。 StarGAN是一種新穎且可擴(kuò)展的方法,可以僅使用一個模型就可以對多個域執(zhí)行圖像到圖像的轉(zhuǎn)換。
跨域模型與我們提出的模型StarGAN之間的比較。 (a)要處理多個域,應(yīng)為每對圖像域建立跨域模型。 (b)StarGAN能夠使用一個生成器來學(xué)習(xí)多個域之間的映射。 該圖表示連接多個域的星形拓?fù)?。(摘自本文?/p>
StarGAN概述,由兩個模塊(鑒別器D和生成器G)組成。(a)D學(xué)會區(qū)分真實(shí)圖像和偽圖像,并將真實(shí)圖像分類到其對應(yīng)的域。 (b)G接受圖像和目標(biāo)域標(biāo)簽作為輸入,并生成偽圖像。 目標(biāo)域標(biāo)簽在空間上復(fù)制并與輸入圖像連接在一起。 給定原始域標(biāo)簽,?G嘗試從偽造圖像中重建原始圖像。 (d)G試圖生成與真實(shí)圖像沒有區(qū)別的圖像,并被D分類為目標(biāo)域。
-
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5586瀏覽量
123641
發(fā)布評論請先 登錄

如何實(shí)現(xiàn)"可用匿名數(shù)據(jù)"# AI# 人工智能# 隱私保護(hù)# 圖像處理# 黑科技# 安全 #深度學(xué)習(xí) #數(shù)據(jù)
【Sipeed MaixCAM Pro開發(fā)板試用體驗(yàn)】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)
圖像采集卡:機(jī)器視覺與專業(yè)成像的關(guān)鍵橋梁

HarmonyOS應(yīng)用圖像stride處理方案

基于RV1126開發(fā)板實(shí)現(xiàn)自學(xué)習(xí)圖像分類方案

圖像采集卡:現(xiàn)代圖像處理技術(shù)的關(guān)鍵組件

SLAMTEC Aurora:把深度學(xué)習(xí)“卷”進(jìn)機(jī)器人日常
FPGA圖像處理基礎(chǔ)----實(shí)現(xiàn)緩存卷積窗口

基于FPGA實(shí)現(xiàn)圖像直方圖設(shè)計(jì)

傅立葉變換在圖像處理中的作用
深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)模型
主動學(xué)習(xí)在圖像分類技術(shù)中的應(yīng)用:當(dāng)前狀態(tài)與未來展望

AI圖像識別攝像機(jī)

評論