轉自:https://blog.csdn.net/qq_34218078/article/details/109591000
1.先D后G
1.1 不detach,但需要retain_graph=True
1.2 detach
2.先G后D
有些奇怪的方法,但可用。 因為 generator 的更新需要 discriminator 提供准確的 loss 和 gradient,先更新G,那它的依據又是什么?
鏈接中講的很清楚。
轉自:https://blog.csdn.net/qq_34218078/article/details/109591000
1.1 不detach,但需要retain_graph=True
1.2 detach
有些奇怪的方法,但可用。 因為 generator 的更新需要 discriminator 提供准確的 loss 和 gradient,先更新G,那它的依據又是什么?
鏈接中講的很清楚。
本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。