線性回歸-誤差項分析
當我們用線性回歸模型去做回歸問題時,會接觸到誤差項這個概念
對於一個線性回歸模型
其實往往不能准確預測數據的真實值,這是很正常的,各種各樣的因素會使真實值很難符合線性分布,但對於有些數據分布總體會符合線性分布,但不能完全接近,這是很合理的。對於那些很接近線性分布的數據,可以訓練模型去盡量的擬合數據。
對於每一個樣本其實會有這樣一個公式:
其中
就叫做誤差項,如果這個誤差項分布符合均值為0的正太分布,那么我們就可以認為我們得到的模型是正常的,也就是說得到了一個線性回歸合理的模型。但要做到這一步,跟數據的真實分布是有很大關系的。