深度學習:MAE 和 RMSE 詳解


https://blog.csdn.net/nanhuaibeian/article/details/102746602

 

平均絕對誤差MAE(mean absolute error) 和均方根誤差 RMSE(root mean squared error)是衡量變量精度的兩個最常用的指標,同時也是機器學習中評價模型的兩把重要標尺。
那兩者之間的差異在哪里?它對我們的生活有什么啟示?

 

一、定義

平均絕對誤差MAE(mean absolute error)是絕對誤差的平均值,它其實是更一般形式的誤差平均值。
因為如果誤差是[-1,0,1],平均值就是0,但這並不意味之系統不存在誤差,只是正負相互抵消了,因此我們要加上絕對值。它的定義表達式為:
在這里插入圖片描述
換成更直接的表達式:
在這里插入圖片描述
而均方根誤差 RMSE(root mean squared error),也有資料稱為RMSD,也可以測量誤差的平均大小,它是預測值和實際觀測之間平方差異平均值的平方根。

它的定義為:
在這里插入圖片描述
換成更直接的表達式為:
在這里插入圖片描述

二、比較

只是看這些抽象的公式,很難幫我們理解它們之間的差異,讓我們來用一個實際的例子說明:

假設你想了解量女朋友在准時方面的特點,你統計了近兩個月女朋友約會的遲到時間(即是實際到達時間和約定時間的差距,或誤差,單位可以是分鍾,時間有誇大,我們只想你更好理解概念),如下:
第一個月遲到時間1 = ([5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 1000])
第二個月遲到時間2= ([5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10, 5, 10])

那么我們來計算兩個序列的平均絕對誤差MAE和均方根誤差RMSE。

我們計算得出:
對於第一個月:平均絕對誤差 MAE1 = 62.5分鍾,均方根誤差 RMSE1:235.82 分鍾
對於第二個月:平均絕對誤差 MAE2 = 7.5分鍾,均方根誤差RMSE2 = 7.91分鍾

第一個月的平均絕對誤差 MAE(62.5) 與均方根誤差 RMSE(235.82) 之比接近1:4,
第二個月遲到時間的平均絕對誤差 MAE (7.5) 與均方根誤差 RMSE(7.91)之比約為1:1。

我們應該用哪個量衡量女朋友守時呢?
我們看到均方根誤差 RMSE 受異常值的影響更大。
如果我們去評判女朋友守時方面的進步,用RMSE標准,我們更可以看到她的進步之大,也許更要獎勵她一頓饕餮盛宴。

一般來說,我們應該期望 MAE 值比 RMSE 值小得多。
因為對於均方根誤差RMSE,每個誤差都是平方的。
這意味着單個誤差呈二次增長,並且對最終RMSE值有不同的影響。

這兩組誤差序列之間的惟一區別是序列1中的極值是1000,而不是10。
因此,我們看到較大的異常值對均方根誤差RMSE的影響更大。

三、應用

當我們處理較大的數據集時,我們不能檢查每個值以了解是否有一個或一些異常值,或者是否所有的錯誤都系統性地更高。

查看 MAE 和 RMSE 的比值可以幫助我們理解是否存在較大但不常見的錯誤。

另外,在生活中,如果想准確的衡量一個人的進步有多大,以便造就和堅固TA的進步,你知道應該選擇哪一副眼鏡去看待了么?


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM