SSE,MSE,RMSE,R-square指標講解


SSE(和方差、誤差平方和):The sum of squares due to error
MSE(均方差、方差):Mean squared error
RMSE(均方根、標准差):Root mean squared error
R-square(確定系數):Coefficient of determination
Adjusted R-square:Degree-of-freedom adjusted coefficient of determination


下面我對以上幾個名詞進行詳細的解釋下,相信能給大家帶來一定的幫助!!


一、SSE(和方差)

該統計參數計算的是擬合數據和原始數據對應點的誤差的平方和,計算公式如下

SSE越接近於0,說明模型選擇和擬合更好,數據預測也越成功。接下來的MSE和RMSE因為和SSE是同出一宗,所以效果一樣


二、MSE(均方差)
該統計參數是預測數據和原始數據對應點誤差的平方和的均值,也就是SSE/n,和SSE沒有太大的區別,計算公式如下

三、RMSE(均方根)
該統計參數,也叫回歸系統的擬合標准差,是MSE的平方根,就算公式如下

在這之前,我們所有的誤差參數都是基於預測值(y_hat)和原始值(y)之間的誤差(即點對點)。從下面開始是所有的誤差都是相對原始數據平均值(y_ba)而展開的(即點對全)!!!


四、R-square(確定系數)
在講確定系數之前,我們需要介紹另外兩個參數SSR和SST,因為確定系數就是由它們兩個決定的
(1)SSR:Sum of squares of the regression,即預測數據與原始數據均值之差的平方和,公式如下

(2)SST:Total sum of squares,即原始數據和均值之差的平方和,公式如下

細心的網友會發現,SST=SSE+SSR,呵呵只是一個有趣的問題。而我們的“確定系數”是定義為SSR和SST的比值,故

其實“確定系數”是通過數據的變化來表征一個擬合的好壞。由上面的表達式可以知道“確定系數”的正常取值范圍為[0 1],越接近1,表明方程的變量對y的解釋能力越強,這個模型對數據擬合的也較好


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM