本文聲明,轉載自
一文讀懂GAN, pix2pix, CycleGAN和pix2pixHD
僅做備份和總結使用
本文對上述文章做一個簡單的總結和梳理,詳細內容還請閱讀原文。
GAN(Generative Adversarial Network)生成對抗學習網絡:
- 一般來說GAN由兩種網絡構成G(Generator)和D(Discriminator),分別用於生成圖片和判斷真假。
在兩個網絡互相博弈過程中,兩個網絡不斷學習和升級,G生成的圖片越來越像真的,D判斷真假的能力越來越高。此時拋棄D,只留下G,用於圖片的生成,此時我們便得到一個優質的圖片生成器。
- GAN的局限性:
- 沒有用戶控制能力:
在傳統的GAN里,隨機輸入一個噪聲,隨機輸出一幅圖像。
無法根據用戶的要求,輸出用戶所需要的圖像。 - 低分辨率和低質量的圖
- 改善GAN:
提高GAN的用戶控制能力
提高GAN生成圖片的分辨率和質量
為了達到這一目的,進而產生了下述三種優化后的網絡:
- pix2pix:有條件的使用戶輸入,使用成對的數據進行訓練
- CycleGAN:使用不成對的數據進行訓練
- pix2pixHD:生成分辨率更高,質量更高的圖像。
以上便是GAN與pix2pix等網絡的關系,具體詳細的對比介紹請參考原作者博客。