花费 106 ms
Gumbel-Softmax Trick和Gumbel分布

  之前看MADDPG论文的时候,作者提到在离散的信息交流环境中,使用了Gumbel-Softmax estimator。于是去搜了一下,发现该技巧应用甚广,如深度学习中的各种GAN、强化学习中的A2 ...

Tue Aug 14 01:03:00 CST 2018 7 20602

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM