論文背景:Google Deepmind團隊於2016發表在NIPS上的文章
motivation:提出新的image generation model based on pixelCNN[1]架構。可以為任意輸入vector結合標簽生成圖片,在先驗信息的前提下加入條件分布信息
模型關鍵:根據鏈式條件概率,逐行生成,逐像素點生成
相對於GAN的優勢:
- GAN只善於處理連續數據,pixelCNN對連續數據和非連續數據都能很好perform
- 鏈式likelihood表達
可以比GAN更好的提供生成目標的評價系統,雖然也不盡完美
相對於GAN的劣勢:
1. 訓練速度慢得嚇死人,openAI基於CIFR dataset 收斂需要8塊Titan上train 5天,直接打消本窮人的訓練欲望
2. sample quality明顯不如GAN。
2. sample quality明顯不如GAN。
1.Aaron van den Oord, Nal Kalchbrenner, and Koray Kavukcuoglu. Pixel recurrent neural networks. arXiv
preprint arXiv:1601.06759, 2016.
