對數損失函數logloss詳解和python代碼

本文轉載自查看原文 2019-09-04 10:54 1169 對數損失函數/ python/ 機器學習/ sklearn機器學習/ sklearn/ logloss

python金融風控評分卡模型和數據分析微專業課（博主親自錄制視頻）：http://dwz.date/b9vv

python代碼

sklearn.metrics.log_loss(y_true, y_pred, eps=1e-15, normalize=True, sample_weight=None, labels=None)[source]

https://scikit-learn.org/stable/modules/generated/sklearn.metrics.log_loss.html

import numpy as np
from sklearn.metrics import log_loss
value=log_loss(["spam", "ham", "ham", "spam"],[[.1, .9], [.9, .1], [.8, .2], [.35, .65]])
print("value:",value)


def logloss(true_label, predicted_prob):
  if true_label == 1:
    return -np.log(predicted_prob)
  else:
    return -np.log(1 - predicted_prob)

https://blog.csdn.net/laolu1573/article/details/82925747（轉載）

定義:
−(ylog(p)+(1−y)log(1−p)) -{(y\log(p) + (1 - y)\log(1 - p))}−(ylog(p)+(1−y)log(1−p))

y yy表示樣本的真實標簽(1或-1)，p pp表示模型預測為正樣本的概率。

可視化：
下圖展示了lable=1時對數損失值的范圍。當預測概率接近1時，對數損失緩慢下降。但隨着預測概率的降低，對數損失迅速增加。對數損失對兩種類型的錯誤都會進行處罰，尤其是那些置信度很高的錯誤預測！

Code:
def logloss(true_label, predicted_prob):
if true_label == 1:
return -log(predicted_prob)
else:
return -log(1 - predicted_prob)
1
2
3
4
5
一個樣本集里正樣本出現的概率為p，如果我們把每個樣本的預測值都置為p，那么logloss是多少呢？

很顯然
若p=0.1，logloss=0.325

若p=0.2，logloss=0.500

若p=0.3，logloss=0.611

若p=0.4，logloss=0.673

若p=0.5，logloss=0.693

若p=0.6，logloss=0.673

若p=0.7，logloss=0.611

若p=0.8，logloss=0.500

若p=0.9，logloss=0.325

所以最差的情況就是，正好是一半正樣本一半負樣本，此時你亂猜出的logloss是0.693。

所以只要loglss是在0.693以上，就說明模型是失敗的。

python機器學習生物信息學系列課（博主錄制）：http://dwz.date/b9vw

歡迎關注博主主頁，學習python視頻資源

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 對數損失函數(Logarithmic Loss Function)的原理和 Python 實現交叉熵和對數損失函數之間的關系損失函數詳解感知損失函數詳解 keras損失函數詳解為什么邏輯回歸損失函數不用均方損失/二元邏輯回歸的損失函數適合采用對數損失函數 GAN: 原始損失函數詳解 python 對數函數 Gradient Boost Decision Tree（GBDT）中損失函數為什么是對數形式損失函數Center Loss 代碼解析