幾種常見的損失函數


  python金融風控評分卡模型和數據分析微專業(博主親自錄制視頻):http://dwz.date/b9vv

1. 損失函數、代價函數與目標函數

  損失函數(Loss Function):是定義在單個樣本上的,是指一個樣本的誤差。
  代價函數(Cost Function):是定義在整個訓練集上的,是所有樣本誤差的平均,也就是所有損失函數值的平均。
  目標函數(Object Function):是指最終需要優化的函數,一般來說是經驗風險+結構風險,也就是(代價函數+正則化項)。

--

2. 常用的損失函數

  這一節轉載自博客

(1)0-1損失函數(0-1 loss function)

 

L(y,f(x))={1,0,yf(x)y=f(x)L(y,f(x))={1,y≠f(x)0,y=f(x)


  也就是說,當預測錯誤時,損失函數為1,當預測正確時,損失函數值為0。該損失函數不考慮預測值和真實值的誤差程度。只要錯誤,就是1。

 

(2)平方損失函數(quadratic loss function)

 

L(y,f(x))=(yf(x))2L(y,f(x))=(y−f(x))2


  是指預測值與實際值差的平方。

 

(3)絕對值損失函數(absolute loss function)

 

L(y,f(x))=|yf(x)|L(y,f(x))=|y−f(x)|


  該損失函數的意義和上面差不多,只不過是取了絕對值而不是求絕對值,差距不會被平方放大。

 

(4)對數損失函數(logarithmic loss function)

 

L(y,p(y|x))=logp(y|x)L(y,p(y|x))=−log⁡p(y|x)


  這個損失函數就比較難理解了。事實上,該損失函數用到了極大似然估計的思想。P(Y|X)通俗的解釋就是:在當前模型的基礎上,對於樣本X,其預測值為Y,也就是預測正確的概率。由於概率之間的同時滿足需要使用乘法,為了將其轉化為加法,我們將其取對數。最后由於是損失函數,所以預測正確的概率越高,其損失值應該是越小,因此再加個負號取個反。

 

(5)Hinge loss

  Hinge loss一般分類算法中的損失函數,尤其是SVM,其定義為:

L(w,b)=max{0,1yf(x)}L(w,b)=max{0,1−yf(x)}


  其中 y=+1y=1y=+1或y=−1 ,f(x)=wx+bf(x)=wx+b ,當為SVM的線性核時。

 


3. 常用的代價函數

(1)均方誤差(Mean Squared Error)

 

MSE=1Ni=1N(y(i)f(x(i)))MSE=1N∑i=1N(y(i)−f(x(i)))


  均方誤差是指參數估計值與參數真值之差平方的期望值; MSE可以評價數據的變化程度,MSE的值越小,說明預測模型描述實驗數據具有更好的精確度。( ii 表示第 ii 個樣本,NN 表示樣本總數)
  通常用來做回歸問題的代價函數

 

(2)均方根誤差

 

RMSE=1Ni=1N(y(i)f(x(i)))−−−−−−−−−−−−−−−−−⎷RMSE=1N∑i=1N(y(i)−f(x(i)))


  均方根誤差是均方誤差的算術平方根,能夠直觀觀測預測值與實際值的離散程度。
  通常用來作為回歸算法的性能指標

 

(3)平均絕對誤差(Mean Absolute Error)

 

MAE=1Ni=1N|y(i)f(x(i))|MAE=1N∑i=1N|y(i)−f(x(i))|


  平均絕對誤差是絕對誤差的平均值 ,平均絕對誤差能更好地反映預測值誤差的實際情況。
  通常用來作為回歸算法的性能指標

 

(4)交叉熵代價函數(Cross Entry)

 

H(p,q)=i=1Np(x(i))logq(x(i))H(p,q)=−∑i=1Np(x(i))log⁡q(x(−i))


  交叉熵是用來評估當前訓練得到的概率分布與真實分布的差異情況,減少交叉熵損失就是在提高模型的預測准確率。其中 p(x)p(x) 是指真實分布的概率, q(x) 是模型通過數據計算出來的概率估計。
  比如對於二分類模型的交叉熵代價函數(可參考邏輯回歸一節):

L(w,b)=1Ni=1N(y(i)logf(x(i))+(1y(i))log(1f(x(i))))L(w,b)=−1N∑i=1N(y(i)log⁡f(x(i))+(1−y(i))log⁡(1−f(x(i))))


  其中 f(x)f(x) 可以是sigmoid函數。或深度學習中的其它激活函數。而 y(i)0,1y(i)∈0,1 。
  通常用做分類問題的代價函數。

 原文鏈接:https://www.cnblogs.com/lliuye/p/9549881.html

 

 python機器學習生物信息學系列課(博主錄制)http://dwz.date/b9vw

歡迎關注博主主頁,學習python視頻資源

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM