統計學基礎之回歸分析


目錄:(來源:百度百科等)

一、一元線性回歸

二、多元線性回歸


 

一、一元線性回歸

  一元線性回歸是分析只有一個自變量(自變量x和因變量y)線性相關關系的方法。一個經濟指標的數值往往受許多因素影響,若其中只有一個因素是主要的,起決定性作用,則可用一元線性回歸進行預測分析。回歸分析是研究某一變量(因變量)與另一個或多個變量(解釋變量、自變量)之間的依存關系,用解釋變量的已知值或固定值來估計或預測因變量的總體平均值。

  一元線性回歸分析預測法,是根據自變量x和因變量Y的相關關系,建立x與Y的線性回歸方程進行預測的方法。由於市場現象一般是受多種因素的影響,而並不是僅僅受一個因素的影響。所以應用一元線性回歸分析預測法,必須對影響市場現象的多種因素做全面分析。只有當諸多的影響因素中,確實存在一個對因變量影響作用明顯高於其他因素的變量,才能將它作為自變量,應用一元相關回歸分析市場預測法進行預測。

預測模型為: 式中, x t代表t期自變量的值;  代表t期因變量的值;a、b代表一元線性回歸方程的參數。a、b參數由下列公式求得(用代表): 建立模型
1、選取一元線性回歸模型的變量 ;
2、繪制計算表和擬合散點圖 ;
3、計算變量間的回歸系數及其相關的顯著性 ;
4、回歸分析結果的應用
模型的檢驗:
1、經濟意義檢驗:就是根據模型中各個參數的經濟含義,分析各參數的值是否與分析對象的經濟含義相符;
2、回歸標准差檢驗;
3、擬合優度檢驗;
4、回歸系數的顯著性檢驗。
(待完善)

1、相關關系

2、最小二乘法

3、擬合優度檢驗

4、顯著性檢驗(與假設檢驗聯系起來並python實現)

5、回歸預測

6、殘差分析


二、多元線性回歸

  在回歸分析中,如果有兩個或兩個以上的自變量,就稱為多元回歸。事實上,一種現象常常是與多個因素相聯系的,由多個自變量的最優組合共同來預測或估計因變量,比只用一個自變量進行預測或估計更有效,更符合實際。因此多元線性回歸比一元線性回歸的實用意義更大。

  將所有變量包括因變量都先轉化為標准分,再進行線性回歸,此時得到的回歸系數就能反映對應自變量的重要程度。這時的回歸方程稱為標准回歸方程,回歸系數稱為標准回歸系數,表示如下:
由於都化成了標准分,所以就不再有常數項 a 了,因為各自變量都取平均水平時,因變量也應該取平均水平,而平均水平正好對應標准分 0 ,當等式兩端的變量都取 0 時,常數項也就為 0 了。多元線性回歸與一元線性回歸類似,可以用 最小二乘法估計模型參數,也需對模型及模型參數進行統計檢驗  。
選擇合適的自變量是正確進行多元回歸預測的前提之一,多元回歸模型自變量的選擇可以利用變量之間的 相關矩陣來解決。
 
1.建立模型
以二元線性回歸模型為例 ,二元線性回歸模型如下:
類似的使用最小二乘法進行參數估計  
2.擬合優度指標
標准誤差:對y值與模型估計值之間的離差的一種度量。其計算公式為:
3.置信范圍
置信區間的公式為:置信區間= 其中,
 是自由度為
 的
 統計量數值表中的數值,
 是觀察值的個數,
 是包括因變量在內的變量的個數。
 
 
1.普通最小二乘法
普通最小二乘法(Ordinary Least Square, OLS)通過最小化誤差的平方和尋找最佳函數。通過矩陣運算求解系數矩陣:
2.廣義最小二乘法
廣義最小二乘法是普通最小二乘法的拓展,它允許在誤差項存在異方差或自相關,或二者皆有時獲得有效的系數估計值。公式如,
圖1..廣義最小二乘法公式
其中,Ω是殘差項的協方差矩陣。
(待完善)

1、多重共線性

2、變量選擇與逐步回歸

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM