R-squared是什么意思


在回歸分析中,R-squared值應該為多大?
就像經常被問到,在回歸分析中,R平方應該為多大才表示回歸模型是好的?我經常能夠聽到這類問題,在沒回答這個問題之前,我會解釋如

何來解釋R平方值,我也會闡述為何這個數值可能是一個誤導性的統計量,因為小的R平方值不代表模型就擬合的很差,相反,R平方值很大

也不代表模型就擬合的很好。

很明顯,“R平方應該為多少”這個問題的答案取決於以下內容

在這個問題點上,我將幫助大家來更精確的解釋這個問題,然而,恕我直言,因為我將告訴大家如果你問了這個問題,就相當於你問了一個錯

誤的問題,我將告訴你你應該如何來問這個問題,且如何來回答這個問題。

為何這是一個錯誤的問題

R平方的值應該為多少?對這個問題只有一個可能的答案,R平方必須等於基於線性模型能夠解釋的響應變量變異源的百分比大小,不多也不

少 當你問這個問題的時候,其實你最想知道的是回歸模型能否滿足你的期望目標,模型能否滿足你的需求?接下來我將幫助你詢問和回答正

確的問題,問題取決於對於線性回歸模型你主要的目標是:

描述預測變量和響應變量之間的關系或者預測響應變量的數值

R平方和自變量及響應變量之間的關系

這個問題比較簡單,如果你的主要目標是判斷哪些預測變量是顯著的並且預測變量在變化的時候響應變量將如何變化,那么R平方就是完全不

切題的指標了。

如果你正確的指定了回歸模型,R平方並不會影響你如何判斷自變量和因變量之間的關系。

假設你擬合出了自變量和因變量的關系,通過P值判斷自變量是顯著的,系數為2,其它所有的假設都滿足要求。

這個結果說明自變量變化一個單位,與之相關的因變量就會變化2個單位,不管R平方是25%還是95%,這個解釋都是正確的。

詢問“R平方應該為多大”從這點上來說就是講不通的,因為它沒有起到什么作用。一個小的R平方並不會否定預測變量的顯著性或者改變系數

的均值。R平方可以簡單到任何一個值,它並不需要任何專門的數值用來做有效的解釋。

為了相信你的解釋,將改用問哪個問題呢?

R平方和預測的響應變量

如果你的主要目標是分析預測的精度,R平方就是一個要關心的參數了,預測並不是像只預測值那樣簡單,因為其包含了實驗誤差,精度越高

,誤差就會越小。

因為較小的R平方表明模型中就有較大的誤差,因此,R平方如果越小,就說明模型的精度越差,你不能使用R平方來決定你的預測值是否足

夠精確里滿足你的需求。

這就是為什么“R平方應該為多少”這個問題是不正確的。

那么該怎么來問呢?基於上面的解釋,你應該這樣詢問:

預測區間是否足夠的精確來滿足我的需求?

預測區間和精度

預測區間代表在指定了設置的預測變量的設置后,一個新的觀察的范圍。這些區間就是平均預測誤差。窄預測區間顯示更精確的預測。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM