花費 14 ms
Gumbel-Softmax Trick和Gumbel分布

  之前看MADDPG論文的時候,作者提到在離散的信息交流環境中,使用了Gumbel-Softmax estimator。於是去搜了一下,發現該技巧應用甚廣,如深度學習中的各種GAN、強化學習中的A2 ...

Tue Aug 14 01:03:00 CST 2018 7 20602

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM