[Reinforcement Learning] Cross-entropy Method
Cross-entropy Method(簡稱CEM)雖然是一種基於交叉熵的算法,但並不是我們熟知的監督學習中的交叉熵方法,與其說它是一種基於交叉熵的算法,倒不如說是一種基於蒙特卡洛和進化策略的算法。 ...
Cross-entropy Method(簡稱CEM)雖然是一種基於交叉熵的算法,但並不是我們熟知的監督學習中的交叉熵方法,與其說它是一種基於交叉熵的算法,倒不如說是一種基於蒙特卡洛和進化策略的算法。 ...