GAN作用——在我做安全的看來,就是做數據擬合、數據增強


from:https://www.zhihu.com/question/56171002/answer/155777359


GAN的作用,也就是為什么GAN會火了(有部分原因可能是因為Lecun的贊賞)。如果GAN只是用來生成一些像真是數據一樣的數據的話,那不會有像現在這么火。更多的,或者對於機器學習研究員來說,看待的最關鍵一點應該是GAN可以用來 擬合數據分布 。什么叫擬合數據分布,就是給你一個訓練數據,你能通過GAN這個工具,產生和這個數據分布相似的一些數據。有了擬合數據分布的思想,並在這上面做文章,才是一個真正的機器學習研究人員的素質。比如WGAN,也就是考慮到了GAN是一種擬合數據分布的工具,那么它可能和一些擬合數據分布的函數比如KL散度等是等價的,那么作者朝這個方向進行探索,自然能得出相應的結論,並且提出改進辦法,使其成為風靡一時的工作。其實,可以做的工作還有很多,比如,既然你有一個產生類似數據的工具,那么其實你就有了一個做數據增強的工具,也就是對於你的神經網絡來說,你有更多的訓練數據了。很多人可能會覺得這個想法很簡單,其實並不然。因為GAN本身用神經網絡訓練,如果你能把它融入你的一個任務當中,只用加一些損失函數,其實就能提高你任務上的性能,而且很多人還會覺得你性能好是因為加了神奇的損失函數,其實不過是用GAN做了一些隱式的數據增強吧了。但是你可以隨便吹自己的模型是多么厲害,損失函數設計得多么有意義,多繞幾下,別人也就忘了不就是GAN增強了數據嘛。因為GAN給各個任務開了一條提高性能的大門,那每把GAN用在一個任務上,就得引用GAN這篇論文,引用量上去了自然就火了。而且原始GAN是難訓練或者效果差的,那么這些嗷嗷待哺的任務和相關研究人員自然也會更多關注GAN的發展,以期望在自己的任務上用到最新,最好的技術。所以,最近做提高和改進GAN的工作也取得了極大的關注度。那么再解釋一下這個工作變火的本質:以前的神經網絡存在生成困難的問題,GAN提供了解決辦法,該方法簡單、強大、適用性廣。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM