在回歸任務(對連續值的預測)中,常見的評估指標(Metric)有:平均絕對誤差(Mean Absolute Error,MAE)、均方誤差(Mean Square Error,MSE)、均方根誤差(Root Mean Square Error,RMSE)和平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE),其中用得最為廣泛的就是MAE和MSE。下面依次來進行一個大致的介紹,同時對於下面所有的計算公式:均表示樣本數量、
均表示第
個樣本的真實值、
均表示第
個樣本的預測值。
一,評價回歸模型的指標
1,均方誤差
均方誤差(MSE)的定義如下,
2,均方根誤差
均方根誤差(RMSE)是回歸模型的典型指標,用於指示模型在預測中會產生多大的誤差,對於較大的誤差,權重較高。
y是實際值,而y~ 是預測值, RMSE越小越好。
3,平均絕對誤差
平均絕對誤差(MAE)用來衡量預測值與真實值之間的平均絕對誤差,MAE越小表示模型越好,其定義如下:
4,R2分數
sklearn在實現線性回歸時默認采用了[公式]指標,[公式]越大表示模型越好,其定義如下:
其中表示真實值的平均值。可能
的好處在於其結果進行了歸一化,更容易看出模型間的差距。
二,偏差和方差
偏差:描述的是預測值(估計值)的期望與真實值之間的差距。偏差越大,越偏離真實數據。
方差:描述的是預測值的變化范圍,離散程度,也就是離其期望值的距離。方差越大,數據的分布越分散。
參考文檔: