Y1 X1 Y2 X2 Y3 X3 Y4 X4 8.04 10 9.14 10 7.46 10 6.58 8 6.95 8 8.14 8 6.77 8 5.76 8 7.58 13 8.74 13 12.74 13 7.71 8 8.81 9 8.77 9 7.11 9 8.84 8 8.33 11 9.26 11 7.81 11 8.47 8 9.96 14 8.1 14 8.84 14 7.04 8 7.24 6 6.13 6 6.08 6 5.25 8 4.26 4 3.1 4 5.39 4 12.5 19 10.84 12 9.13 12 8.15 12 5.56 8 4.82 7 7.26 7 6.42 7 7.91 8 5.68 5 4.74 5 5.73 5 6.89 8
數據集如上,用sas讀入后再做簡單線性回歸,四個回歸的模型都一樣,殘差平方和,負相關系數也一樣
那么,是不是可以說這四組數據擬合的模型都正確呢?
我們畫出其各自的散點圖,如下
很明顯,只有左上方的圖才有用線性模型描述的可能性,其他的模型都不適合。
OK~,這里是簡單線性模型,只有一個自變量,如果上升到多個自變量時,無法用肉眼從圖形判別的我們該做什么呢?
這就是殘差圖大展身手的地方了(這里只選取殘差和因變量進行作圖)
proc reg data=regbook.anscombefour; model y1= x1; plot r.*p.; model y2= x2; plot r.*p.; model y3= x3; plot r.*p.; model y1= x1; plot r.*p.; run; quit;
因為在這里不清楚如何用sas組合四幅圖,所以就沒貼出來,如果是線性模型,那么殘差應該符合正態分布的假設,所以殘差應該圍繞0上下無規律波動,如下(y1*x1的殘差圖)
如果不是這種形狀,就表明擬合的模型有問題,同理,殘差和自變量在線性假設中也是獨立的,也可以拿來進行檢驗。