花费 5 ms
[Reinforcement Learning] Cross-entropy Method

Cross-entropy Method(简称CEM)虽然是一种基于交叉熵的算法,但并不是我们熟知的监督学习中的交叉熵方法,与其说它是一种基于交叉熵的算法,倒不如说是一种基于蒙特卡洛和进化策略的算法。 ...

Sun Sep 02 03:31:00 CST 2018 0 2626

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM