Pytorch中的強化學習


torch.distributions.Categorical()

功能:根據概率分布來產生sample,產生的sample是輸入tensor的index
如:
  >>> m = Categorical(torch.tensor([ 0.25, 0.25, 0.25, 0.25 ]))
  >>> m.sample()   # equal probability of 0, 1, 2, 3
  tensor(3)
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM