ground truth就是參考標准,一般用來做誤差量化。比方說要根據歷史數據預測某一時間的溫度,ground truth就是那個時間的真實溫度。error就是(predicted temperature - real temprature)。在監督學習中,數據是有標簽(label)的的,以(x, t)的形式出現,其中x是輸入數據,t是label。正確的t標簽是ground truth, 錯誤的標簽則不是。由模型函數的數據則是由(x, y)的形式出現的。其中x為之前的輸入數據,y為模型預測的值。標注會和模型預測的結果作比較。在損耗函數中會將y 和 t 作比較,從而計算損耗(量化預測值與真實值的差別)。 比如在最小方差中:
因此如果預測標簽不是ground truth,那么loss的計算將會產生誤差,從而影響到模型質量。