轉載:https://blog.csdn.net/SecondLieutenant/article/details/79625694
面板數據(Panel Data)是將“截面數據”和“時間序列數據”綜合起來的一種數據類型。具有“橫截面”和“時間序列”兩個維度,當這類數據按兩個維度進行排列時,數據都排在一個平面上,與排在一條線上的一維數據有着明顯的不同,整個表格像是一個面板,所以稱為面板數據(Panel Data)。
實際上如果從數據結構內在含義上,應該把Panel Data稱為“時間序列-截面數據”,更能體現數據結構本質上的特點。該數據為也被稱為“縱向數據(Longitudinal Data)”,“平行數據”,“TS-CS數據(Time Series-Cross Section)”。它是截面上個體在不同時間點的重復測量數據。面板數據從橫截面(cross section)看,是由若干個體(entity,unit,individual)在某一時點構成的截面觀測值,從縱剖面(longitudinal section)看每個個體都是一個時間序列。
從時空維度來看,可將計量經濟學中應用的數據分三類:
1、橫截面數據(Cross-sectional data)
橫截面數據是指在某一時點收集的不同對象的數據。它對應同一時點上不同空間(對象)所組成的一維數據集合,研究的是某一時點上的某種經濟現象,突出空間(對象)的差異。橫截面數據的突出特點就是離散性高。橫截面數據體現的是個體的個性,突出個體的差異,通常橫截面數據表現的是無規律的而非真正的隨機變化。即計量經濟學中所謂的“無法觀測的異質性”。在分析橫截面數據時,應主要注意兩個問題:一是異方差問題,由於數據是在某一時期對個體或地域的樣本的采集,不同個體或地域本身就存在差異;二是數據的一致性,主要包括變量的樣本容量是否一致、樣本的取樣時期是否一致、數據的統計標准是否一致。
2、時間序列數據(Time-series data)
時間序列數據是指對同一對象在不同時間連續觀察所取得的數據。它着眼於研究對象在時間順序上的變化,尋找空間(對象)歷時發展的規律。利用時間序列作樣本時,要注意幾個問題:一是所選擇的樣本區間內經濟行為的一致性問題;二是樣本數據在不同樣本點之間不可比,需要對原始數據進行調整,消除其不可比因素;三是樣本觀測值過於集中,因而時間序列數據不適宜於對模型中反映長期變化關系的結構參數的估計;四是模型隨機誤差的序列相關問題。
3、縱向數據(Longitudinal data)或面板數據(Panel data)
面板數據,即Panel Data,是截面數據與時間序列綜合起來的一種數據資源。 在分析時,多用PanelData模型,故也被稱為面板數據模型. 它可以用於分析各樣本在時間序列上組成的數據的特征,它能夠綜合利用樣本信息,通過模型中的參數,既可以分析個體之間的差異情況,又可以描述個體的動態變化特征。
舉栗一個,栗子來源於網絡!
時間序列數據:北京一年來每天的平均溫度。
截面數據:北京,上海,深圳,廣州某一天的平均溫度。
面板數據:北京,上海,深圳,廣州這一年來每天的平均溫度。
適用范圍:
時間序列數據:某一個個體隨時間變化產生的數據。
截面數據:許多個個體在同一個時間下由於個體不同而產生的數據。
面板數據:前兩個的綜合——許多個個體由於個體不同以及時間變化產生的數據。
分析方法:
時間序列數據:主要圍繞時間變化,可看總體趨勢,季節性,周期性,ARIMA(自回歸,滑動平均,差分)等。
截面數據:主要圍繞統計個體區別,可用線性回歸,主元分析等。 面板數據:前兩個的綜合。
舉栗二個,栗子來源於網絡!
如:城市名:北京、上海、重慶、天津的GDP分別為10、11、9、8(單位億元)。這就是截面數據,在一個時間點處切開,看各個城市的不同就是截面數據。
如:2000、2001、2002、2003、2004各年的北京市GDP分別為8、9、10、11、12(單位億元)。這就是時間序列,選一個城市,看各個樣本時間點的不同就是時間序列。
如:2000、2001、2002、2003、2004各年中國所有直轄市的GDP分別為:
北京市分別為8、9、10、11、12;
上海市分別為9、10、11、12、13;
天津市分別為5、6、7、8、9;
重慶市分別為7、8、9、10、11(單位億元)。
這就是面板數據。
————————————————
版權聲明:本文為CSDN博主「CWS_chen」的原創文章,遵循 CC 4.0 BY-SA 版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/secondlieutenant/article/details/79625694