回歸模型的評價指標有以下幾種:
SSE(誤差平方和):The sum of squares due to error
R-square(決定系數):Coefficient of determination
Adjusted R-square:Degree-of-freedom adjusted coefficient of determination
一、SSE(誤差平方和)
計算公式如下:
同樣的數據集的情況下,SSE越小,誤差越小,模型效果越好
缺點:
SSE數值大小本身沒有意義,隨着樣本增加,SSE必然增加,也就是說,不同的數據集的情況下,SSE比較沒有意義
二、R-square(決定系數)
數學理解: 分母理解為原始數據的離散程度,分子為預測數據和原始數據的誤差,二者相除可以消除原始數據離散程度的影響
其實“決定系數”是通過數據的變化來表征一個擬合的好壞。
理論上取值范圍(-∞,1], 正常取值范圍為[0 1] ------實際操作中通常會選擇擬合較好的曲線計算R²,因此很少出現-∞
越接近1,表明方程的變量對y的解釋能力越強,這個模型對數據擬合的也較好
越接近0,表明模型擬合的越差
經驗值:>0.4, 擬合效果好
缺點:
數據集的樣本越大,R²越大,因此,不同數據集的模型結果比較會有一定的誤差
三、Adjusted R-Square (校正決定系數)
n為樣本數量,p為特征數量
消除了樣本數量和特征數量的影響