《Image Generation with PixelCNN Decoders》論文筆記


論文背景:Google Deepmind團隊於2016發表在NIPS上的文章

motivation:提出新的image generation model based on pixelCNN[1]架構。可以為任意輸入vector結合標簽生成圖片,在先驗信息的前提下加入條件分布信息

模型關鍵:根據鏈式條件概率,逐行生成,逐像素點生成

相對於GAN的優勢:

  • GAN只善於處理連續數據,pixelCNN對連續數據和非連續數據都能很好perform
  • 鏈式likelihood表達可以比GAN更好的提供生成目標的評價系統,雖然也不盡完美

 

相對於GAN的劣勢:

1. 訓練速度慢得嚇死人,openAI基於CIFR dataset 收斂需要8塊Titan上train 5天,直接打消本窮人的訓練欲望
2. sample quality明顯不如GAN。

1.Aaron van den Oord, Nal Kalchbrenner, and Koray Kavukcuoglu. Pixel recurrent neural networks. arXiv

preprint arXiv:1601.06759, 2016.


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM