單位根檢驗是指檢驗序列中是否存在單位根,因為存在單位根就是非平穩時間序列了。單位根就是指單位根過程,可以證明,序列中存在單位根過程就不平穩,會使回歸分析中存在偽回歸。
from statsmodels.tsa.stattools import adfuller import pandas as pd import numpy as np #湖北省1978年至2010年GDP data = pd.Series([151.0, 188.46, 199.38, 219.75, 241.55, 262.58, 328.22, 396.26, 442.04, 517.77, 626.52, 717.08, 824.38, 913.38, 1088.39, 1325.83, 1700.92, 2109.38, 2499.77, 2856.47, 3114.02, 3229.29, 3545.39, 3880.53, 4212.82, 4757.45, 5633.24, 6590.19, 7617.47, 9333.4, 11328.92, 12961.1, 15967.61],index=np.arange(1978,2011)) print(adfuller(data))
結果:
(-0.04391111656553232, 0.9547464774274733, 10, 22, {'1%': -3.769732625845229, '5%': -3.005425537190083, '10%': -2.6425009917355373}, 291.54354258641223)
第一個是adt檢驗的結果,簡稱為T值,表示t統計量。
第二個簡稱為p值,表示t統計量對應的概率值。
第三個表示延遲。
第四個表示測試的次數。
第五個是配合第一個一起看的,是在99%,95%,90%置信區間下的臨界的ADF檢驗的值。
第一點,1%、%5、%10不同程度拒絕原假設的統計值和ADF Test result的比較,ADF Test result同時小於1%、5%、10%即說明非常好地拒絕該假設。本數據中,adf結果為-0.04391111656553232,大於三個level的統計值,接收假設,即存在單位根。
第二點,p值要求小於給定的顯著水平,p值要小於0.05,等於0是最好的。本數據中,P-value 為 0.9547464774274733,大於三個level,接受假設,即存在單位根。
ADF檢驗的原假設是存在單位根,只要這個統計值是小於1%水平下的數字就可以極顯著的拒絕原假設,認為數據平穩。注意,ADF值一般是負的,也有正的,但是它只有小於1%水平下的才能認為是及其顯著的拒絕原假設。
對於ADF結果在1% 以上 5%以下的結果,也不能說不平穩,關鍵看檢驗要求是什么樣子的。