转自:https://blog.csdn.net/qq_34218078/article/details/109591000
1.先D后G
1.1 不detach,但需要retain_graph=True
1.2 detach
2.先G后D
有些奇怪的方法,但可用。 因为 generator 的更新需要 discriminator 提供准确的 loss 和 gradient,先更新G,那它的依据又是什么?
链接中讲的很清楚。
转自:https://blog.csdn.net/qq_34218078/article/details/109591000
1.1 不detach,但需要retain_graph=True
1.2 detach
有些奇怪的方法,但可用。 因为 generator 的更新需要 discriminator 提供准确的 loss 和 gradient,先更新G,那它的依据又是什么?
链接中讲的很清楚。
本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。