本文轉載自查看原文 2020-02-29 10:19 2417 python/ NLP/ 深度學習

NLLLoss 損失：負對數似然損失，negative log likelihood loss，若 $f (x_{i}, y_{i}) = - q_{y_{i}}$

$c r o s s_e n t r o p y = - \sum_{k = 1}^{N} (p_{k} * \log q_{k})$

其中p表示真實值，在這個公式中是one-hot形式；q是經過softmax計算后的結果，

仔細觀察可以知道，因為p的元素不是0就是1，而且又是乘法，所以很自然地我們如果知道1所對應的index，那么就不用做其他無意義的運算了。所以在pytorch代碼中target不是以one-hot形式表示的，而是直接用scalar表示。若該樣本的真實標簽為

𝑐 𝑟 𝑜 𝑠 𝑠_𝑒 𝑛 𝑡 𝑟 𝑜 𝑝 𝑦 = - \sum 𝑘 = 1 𝑁 (𝑝 𝑘 * log 𝑞 𝑘) = - 𝑙 𝑜 𝑔

softmax 和帶有溫度t的softmax性質分析, 帶有溫度的softmax使得輸出的概率分布更加平滑

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 softmax交叉熵損失函數求導 softmax+交叉熵損失函數代碼實現 MSE損失函數和交叉熵損失函數的對比總結: NLLLoss, CrossEntropyLoss, BCELoss, BCEWithLogitsLoss比較，以及交叉熵損失函數推導交叉熵損失函數損失函數：交叉熵關於softmax回歸和交叉熵損失函數很好的一篇文章 LR為什么用極大似然估計，損失函數為什么是log損失函數（交叉熵）損失函數——均方誤差和交叉熵交叉熵和對數損失函數之間的關系

在分類問題中，CrossEntropy等價於log_softmax 結合 nll_loss