[CVPR2018]StarGAN:Unified Generative Adversarial Networks for Multi-Domain ImagetoImage Translation

CVPR 2018 ORAL

首先要解釋一下domain的定義:這裡的domain是指針對數據集中的attribute,根據attribute來劃分的,比如就性別這個attri而言,男是一個domain,女是一個,相對於發色而言,金髮是一個domain,黑髮是一個domain。

隨後作者提出,如果要cross domain來訓練gan,太麻煩了,n 個domain需要n(n-1)個translator,作者在這裡提出的就是一個可以解決multiple domain translation 的translator。

整個網路結構,下面文字講的很清楚了

Objective:

Adversarial Loss:這部分設計無太多新意。

Domain Classification Loss:

簡言之,分成了兩個部分,第一個部分負責在D講real img classify到正確domain label,第二個部分,則是負責激勵G將fake img向target domain label靠近。

Reconstruction Loss:簡言之,就是cycleGAN採用的那種loss,具體請參見cycleGAN,是為了保證cross-domain過程中只更改我們想要更改的部分。

A novel training trick:

作者


推薦閱讀:

NVIDIA | 一種重建照片的 AI 圖像技術
【2D Single-person Pose Estimatiom】
採用HALCON機器視覺軟體及C#語言檢測工件位置的方法 (之一)
計算機視覺部分演算法最佳解釋
淺談深度學習的技術原理及其在計算機視覺的應用

TAG:CVPR | 三一重工SH:600031 | 生成對抗網路GAN | 計算機視覺 |