本文声明,转载自
一文读懂GAN, pix2pix, CycleGAN和pix2pixHD
仅做备份和总结使用
本文对上述文章做一个简单的总结和梳理,详细内容还请阅读原文。
GAN(Generative Adversarial Network)生成对抗学习网络:
- 一般来说GAN由两种网络构成G(Generator)和D(Discriminator),分别用于生成图片和判断真假。
在两个网络互相博弈过程中,两个网络不断学习和升级,G生成的图片越来越像真的,D判断真假的能力越来越高。此时抛弃D,只留下G,用于图片的生成,此时我们便得到一个优质的图片生成器。
- GAN的局限性:
- 没有用户控制能力:
在传统的GAN里,随机输入一个噪声,随机输出一幅图像。
无法根据用户的要求,输出用户所需要的图像。 - 低分辨率和低质量的图
- 改善GAN:
提高GAN的用户控制能力
提高GAN生成图片的分辨率和质量
为了达到这一目的,进而产生了下述三种优化后的网络:
- pix2pix:有条件的使用户输入,使用成对的数据进行训练
- CycleGAN:使用不成对的数据进行训练
- pix2pixHD:生成分辨率更高,质量更高的图像。
以上便是GAN与pix2pix等网络的关系,具体详细的对比介绍请参考原作者博客。