由於最近要經常用到XGBOOST的包,不免對相關的GBDT的原理又重新學習了一遍,
發現其中在考慮損失函數的時候,是以對數log進行度量的,囿於誤差平方和函數的印象
那么為什么是對數呢?可能是下面的原因:
【通俗的解釋】
對數損失是用於最大似然估計的。
一組參數在一堆數據下的似然值,等於每一條數據的概率之積。
而損失函數一般是每條數據的損失之和,為了把積變為和,就取了對數。
再加個負號是為了讓最大似然值和最小損失對應起來。
【專業的解釋】
鏈接:http://www.zhihu.com/question/27126057
注:似乎很有道理,大家如果覺得不對,歡迎留言討論。
