原文鏈接:http://tecdat.cn/?p=9508
本文將使用三種方法使模型適合曲線數據:1)多項式回歸;2)用多項式樣條進行B樣條回歸;3) 進行非線性回歸。在此示例中,這三個中的每一個都將找到基本相同的最佳擬合曲線。
多項式回歸
多項式回歸實際上只是多元回歸的一種特殊情況。
對於線性模型(lm),調整后的R平方包含在summary(model)語句的輸出中。AIC是通過其自己的函數調用AIC(model)生成的。使用將方差分析函數應用於兩個模型進行額外的平方和檢驗。
對於AIC,越小越好。對於調整后的R平方,越大越好。將模型a與模型b進行比較的額外平方和檢驗的非顯着p值表明,帶有額外項的模型與縮小模型相比,並未顯着減少平方誤差和。也就是說,p值不顯着表明帶有附加項的模型並不比簡化模型好。
定義要比較的模型
生成這些模型的模型選擇標准統計信息
其余模型繼續此過程
四個多項式模型的模型選擇標准。模型2的AIC最低,表明對於這些數據,它是此列表中的最佳模型。同樣,模型2顯示了最大的調整后R平方。最后,額外的SS測試顯示模型2優於模型1,但模型3並不優於模型2。所有這些證據表明選擇了模型2。 |
||||||
模型 |
|
AIC |
|
調整后的R平方 |
|
p值 |
1 |
|
99.1 |
|
-0.047 |
|
|
2 |
|
91.2 |
|
0.36 |
|
0.0045 |
3 |
|
92.7 |
|
0.33 |
|
0.55 |
4 |
|
94.4 |
|
0.29 |
|
0.64 |
對比與方差分析
AIC,AICc或BIC中的任何一個都可以最小化以選擇最佳模型。
研究最終模型
模型的簡單圖解
檢查模型的假設
線性模型中殘差的直方圖。這些殘差的分布應近似正態。
殘差與預測值的關系圖。殘差應無偏且均等。
###通過以下方式檢查其他模型:
具有多項式樣條的B樣條回歸
B樣條回歸使用線性或多項式回歸的較小部分。它不假設變量之間存在線性關系,但是殘差仍應是獨立的。該模型可能會受到異常值的影響。
模型的簡單圖解
檢查模型的假設
線性模型中殘差的直方圖。這些殘差的分布應近似正態。
殘差與預測值的關系圖。殘差應無偏且均等。
非線性回歸
非線性回歸可以將各種非線性模型擬合到數據集。這些模型可能包括指數模型,對數模型,衰減曲線或增長曲線。通過迭代過程,直到一定的收斂條件得到滿足先后找到更好的參數估計。
在此示例中,我們假設要對數據擬合拋物線。
數據中包含變量(Clutch和Length),以及我們要估計的參數(Lcenter,Cmax和a)。
沒有選擇參數的初始估計的固定過程。通常,參數是有意義的。這里Lcenter 是頂點的x坐標,Cmax是頂點的y坐標。因此我們可以猜測出這些合理的值。 盡管我們知道參數a應該是負的,因為拋物線向下打開。
因為nls使用基於參數初始估計的迭代過程,所以如果估計值相差太遠,它將無法找到解決方案,它可能會返回一組不太適合數據的參數估計。繪制解決方案並確保其合理很重要。
如果您希望模型具有整體p值,並且模型具有偽R平方,則需要將模型與null模型進行比較。從技術上講,要使其有效,必須將null模型嵌套在擬合模型中。這意味着null模型是擬合模型的特例。
對於沒有定義r平方的模型,已經開發了各種偽R平方值。
確定總體p值和偽R平方
確定參數的置信區間
模型的簡單圖解
檢查模型的假設
線性模型中殘差的直方圖。這些殘差的分布應近似正態。
殘差與預測值的關系圖。殘差無偏且均等。
如果您有任何疑問,請在下面發表評論。