[pytorch]pytorch loss function 總結

本文轉載自查看原文 2019-01-09 19:11 6271 pytorch

原文： http://www.voidcn.com/article/p-rtzqgqkz-bpg.html

最近看了下 PyTorch 的損失函數文檔，整理了下自己的理解，重新格式化了公式如下，以便以后查閱。

注意下面的損失函數都是在單個樣本上計算的，粗體表示向量，否則是標量。向量的維度用 N 表示。

nn.L1Loss

loss (x, y) = 1 N \sum i = 1 N | x - y |

nn.SmoothL1Loss

也叫作 Huber Loss，誤差在 (-1,1) 上是平方損失，其他情況是 L1 損失。

loss (x, y) = 1 N ⎧ ⎩ ⎨ ⎪ ⎪ ⎪ ⎪ 1 2 (x i - y i) 2 | x i - y i | - 1 2, if | x i - y i | < 1 otherwise

nn.MSELoss

平方損失函數

loss (x, y) = 1 N \sum i = 1 N | x - y | 2

nn.BCELoss

二分類用的交叉熵，TODO

loss (o, t) = - 1 N \sum i = 1 N [t i * log (o i) + (1 - t i) * log (1 - o i)]

nn.CrossEntropyLoss

交叉熵損失函數

loss (x, label) = - log e x label \sum N j = 1 e x j = - x label + log \sum j = 1 N e x j

而 x 是沒有經過 Softmax 的激活值。參考 cs231n 作業里對 Softmax Loss 的推導。

nn.NLLLoss

負對數似然損失函數（Negative Log Likelihood）

loss (x, label) = - x label

在前面接上一個 LogSoftMax 層就等價於交叉熵損失了。注意這里的 xlabel 和上個交叉熵損失里的不一樣（雖然符號我給寫一樣了），這里是經過 log 運算后的數值，

nn.NLLLoss2d

和上面類似，但是多了幾個維度，一般用在圖片上。

input, (N, C, H, W)
target, (N, H, W)

比如用全卷積網絡做 Semantic Segmentation 時，最后圖片的每個點都會預測一個類別標簽。

nn.KLDivLoss

KL 散度，又叫做相對熵，算的是兩個分布之間的距離，越相似則越接近零。

loss (x, y) = 1 N \sum i = 1 N [y i * (log y i - x i)]

注意這里的 xi 是 log 概率，剛開始還以為 API 弄錯了。

nn.MarginRankingLoss

評價相似度的損失

loss (x 1, x 2, y) = max (0, - y * (x 1 - x 2) + margin)

這里的三個都是標量，y 只能取 1 或者 -1，取 1 時表示 x1 比 x2 要大；反之 x2 要大。參數 margin 表示兩個向量至少要相聚 margin 的大小，否則 loss 非負。默認 margin 取零。

nn.MultiMarginLoss

多分類（multi-class）的 Hinge 損失，

loss (x, y) = 1 N \sum i = 1, i \neq y N max (0, (margin - x y + x i) p)

其中 1≤y≤N 表示標簽， p 默認取 1， margin 默認取 1，也可以取別的值。參考 cs231n 作業里對 SVM Loss 的推導。

nn.MultiLabelMarginLoss

多類別（multi-class）多分類（multi-classification）的 Hinge 損失，是上面 MultiMarginLoss 在多類別上的拓展。同時限定 p = 1，margin = 1.

loss (x, y) = 1 N \sum i = 1, i \neq y j n \sum j = 1 y j \neq 0 [max (0, 1 - (x y j - x i))]

這個接口有點坑，是直接從 Torch 那里抄過來的，見 MultiLabelMarginCriterion 的描述。而 Lua 的下標和 Python 不一樣，前者的數組下標是從 1 開始的，所以用 0 表示占位符。有幾個坑需要注意，

這里的 x,y 都是大小為 N 的向量，如果 y 不是向量而是標量，后面的 ∑j 就沒有了，因此就退化成上面的 MultiMarginLoss.
限制 y 的大小為 N ，是為了處理多標簽中標簽個數不同的情況，用 0 表示占位，該位置和后面的數字都會被認為不是正確的類。如 y=[5,3,0,0,4] 那么就會被認為是屬於類別 5 和 3，而 4 因為在零后面，因此會被忽略。
上面的公式和說明只是為了和文檔保持一致，其實在調用接口的時候，用的是 -1 做占位符，而 0 是第一個類別。

舉個梨子，

import torch
loss = torch.nn.MultiLabelMarginLoss()
x = torch.autograd.Variable(torch.FloatTensor([[0.1, 0.2, 0.4, 0.8]]))
y = torch.autograd.Variable(torch.LongTensor([[3, 0, -1, 1]]))
print loss(x, y) # will give 0.8500

按照上面的理解，第 3, 0 個是正確的類，1, 2 不是，那么，

loss = 1 4 \sum i = 1, 2 \sum j = 3, 0 [max (0, 1 - (x j - x i))] = 1 4 [(1 - (0.8 - 0.2)) + (1 - (0.1 - 0.2)) + (1 - (0.8 - 0.4)) + (1 - (0.1 - 0.4))] = 1 4 [0.4 + 1.1 + 0.6 + 1.3] = 0.85

*注意這里推導的第二行，我為了簡短，都省略了 max(0, x) 符號。

nn.SoftMarginLoss

多標簽二分類問題，這 N 項都是二分類問題，其實就是把 N 個二分類的 loss 加起來，化簡一下。其中 y 只能取 1,−1 兩種，代表正類和負類。和下面的其實是等價的，只是 y 的形式不同。

loss (x, y) = \sum i = 1 N log (1 + e - y i x i)

nn.MultiLabelSoftMarginLoss

上面的多分類版本，根據最大熵的多標簽 one-versue-all 損失，其中 y 只能取 1,−1 兩種，代表正類和負類。

loss (x, y) = - \sum i = 1 N [y i log e x i 1 + e x i + (1 - y i) log 1 1 + e x i]

nn.CosineEmbeddingLoss

余弦相似度的損失，目的是讓兩個向量盡量相近。注意這兩個向量都是有梯度的。

loss (x, y) = {1 - cos (x, y) max (0, cos (x, y) + margin) if if y = = 1 y = = - 1

margin 可以取 [−1,1] ，但是比較建議取 0-0.5 較好。

nn.HingeEmbeddingLoss

不知道做啥用的。另外文檔里寫錯了， x,y 的維度應該是一樣的。

loss (x, y) = 1 N {x i max (0, margin - x i) if if y i = = 1 y i = = - 1

nn.TripleMarginLoss

L (a, p, n) = 1 N (\sum i = 1 N max (0, d (a i, p i) - d (a i, n i) + margin))

其中

d(xi,yi)=∥xi−yi∥22

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 pytorch loss總結與測試關於Pytorch中accuracy和loss的計算 Focal Loss 的Pytorch 實現以及實驗 pytorch用tensorboard實時生成loss圖像什么是pytorch? 什么是 PyTorch ? Pytorch(一) [pytorch] API總結、速查 Pytorch 報錯總結 pytorch常用函數總結