CVAE-GAN論文翻譯(摘要與介紹)

深度神經網路生成模型:從 GAN VAE 到 CVAE-GAN。

論文地址:CVAE—GAN

上面這篇文章的介紹已經很不錯了!

我的工作是翻譯更加涉及細節的內容!

標題

CVAE-GAN: Fine-Grained Image Generation through Asymmetric Trainingn

CVAE-GAN:通過非對稱訓練生成高逼真的圖像

摘要

First, we adopt a cross entropy loss for the discriminative and classifier network, nbut a mean discrepancy objective for the generative network.nThis kind of asymmetric loss function makes the GAN training more stable. nSecond, we adopt an encoder network to learn the relationship between then latent space and the real image space, and use pairwise feature matching to nkeep the structure of generated images. n

首先,我們對判別分類器網路採用交叉熵損失,而是生成網路的平均差異目標。這種非對稱損失函數使得GAN訓練更加穩定。其次,我們採用編碼器網路來學習潛在空間與實際圖像空間之間的關係,並使用成對特徵匹配保持生成圖像的結構。

介紹

在本文中,我們提出了生成模型的新目標。與一般的鑒別器網路使用的交叉熵損失不同,新的目標要求生成器生成數據是L2距離最小化。對於多分類的圖像生成,還需要生成一個類別的樣本以匹配該類別的實際數據的平均特徵,因為特徵距離和可分離性是正相關的。它在一定程度上解決了梯度消失問題。這種非對稱損失函數可以部分地幫助防止所有輸出移向單點的模式崩潰問題,使GAN的訓練更加穩定。

We use an encoder network to map the real image to the latent vector. nThen the generator is required to reconstruct the raw pixelsnand match the feature of original images with a given latent vector. nIn this way, we explicitly set up the relationship between the latent space and real image space. nBecause of the existence of these anchor points, the generator is enforced to emit diverse samples. nMoreover, the pixel reconstruction loss is also helpful for maintaining the structure, such as a straight line or a facial structure in an image.n

我們使用編碼器網路將真實圖像映射到潛在向量。然後生成器需要重建原始像素並將原始圖像的特徵與給定的潛在向量相匹配。這樣,我們明確地建立了潛在空間與實際圖像空間之間的關係。由於這些錨點的存在,生成器被強制產生不同的樣本。而且,像素重構損失對於保持圖像中的直線或面部結構等結構也是有幫助的。

As shown in Figure 2 (g), our framework consists ofnfour parts: 1) The encoder network E, which maps the datansample x to a latent representation z. 2) The generativennetwork G, which generates image x0 given a latent vector.n3) The discriminative network D, which distinguishesnreal/fake images. 4) The classifier network C, which measuresnthe class probability of the data. These four partsnare seamlessly cascaded together, and the whole pipelinenis trained end-to-end. We call our approach CVAE-GAN.n

如圖2(g)所示,我們的框架包括四部分:1)編碼器網路E,映射數據樣本x到一個潛在的表示z。 2)生成的網路G,其產生給定潛在向量的圖像x。3)區別網路D.真實/假的圖像。 4)分類器網路C,測量數據的類概率。 這四個部分被無縫地串聯在一起,並且整個管道是端對端的訓練。 我們稱之為CVAE-GAN。

歡迎關注公眾號:huangxiaobai880

https://www.zhihu.com/video/937342662974607360
推薦閱讀:

機器學習實戰 | 數據探索(缺失值處理)

TAG:深度学习DeepLearning | 机器学习 | 论文翻译 |