一、時間序列定義
時間序列也成動態序列,是指將某種現象的指標數值按照時間順序排列而成的數值序列。時間序列有兩個組成要素構成:1、第一個要素是時間要素;2、第二個是數值要素。時間序列根據時間和數值性質的不同 ,可以分為時期時間序列和時點時間序列。
二、時間序列分解
時間序列數值變化背后必然蘊含着數值變換的規律性,一般情況下 ,時間序列的數值變化規律有以下四中:長期變動趨勢、季節變動規律、周期變動規律和不規則變動。根據影響因素對時間序列數值變化趨勢的不同影響情況,可以分為四中影響因素:長期趨勢影響因素、季節變動影響因素、循環變動影響因素和不規則變動影響因素。
1、長期趨勢
長期趨勢指的是統計指標在相當長的一段時間內,受到長期趨勢影響因素的影響,變現出持續上升或持續下降的趨勢,通常用字母T表示。
2、季節變動
季節變動是指由於季節的轉變使得指標數值發生周期性變動。指標數值的季節變動是以年為周期的,一般以月、季、周為時間單位,不能以年做單位,通常用S表示。有自然因素也有人為因素。
3、循環變動
循環變動與季節變動的周期不同,循環變動通常以若干年為周期,在曲線圖上變現為波浪式的周期變動。這種周期變動的特征表現為增加和減少交替出現。最典型的周期案例就是市場經濟的商業周期。
4、不規則變動
不規則變動是由某些隨機因素導致的數值變化,這些因素的作用是不可預知和沒有規律的,因此對數值的變化影響變形為不規則變動。
以上四種變動就是時間序列數值變化的分解結果。有時這些變動會同時出現在一個時間序列里面 ,有時也可能只出現一種或幾種,這是由引起各種變動的影響因素決定的。四種變動與指標數值最終變動的關系可能是疊加關系,也可能是乘積關系。
疊加模型:如果四種變動之間是相互獨立的關系,那么疊加模型可以表示為:
Y=T+S+C+I
Y表示指標數值的最終變動;
T表示長期趨勢變動;
S表示季節變動;
C表示循環變動;
I表示不規則變動;
乘積模型:如果四種變動之間存在相互影響關系,那么應該使用乘積模型:
Y=T*S*C*I
反映在具體的時間序列圖上,如果隨着時間的推移,序列的季節波動邊的越來越大,則反映各種變動之間的關系發生變化,建議使用乘積模型;反之,如果時間序列圖的波動保持恆定,則可以之間使用疊加模型。
三、時間序列分析及分類
時間序列分析分為兩種形式:1、傳統的時間序列分析方法,研究時間序列是否能被分解成上面介紹的四種變動 ,並解析引起每種變動的影響因素。2、時間序列的模型解析法,常用時間序列模型有自回歸(AR)模型、滑動平均(MA)模型、自回歸滑動平均(ARMA)模型等。
根據平穩性的不同沒時間序列可以分為平穩性時間序列和非平穩性時間序列
四、時間序列分析法
因為傳統時間序列分析技術(時間序列分解法)的缺陷,所以統計學家開發出更為通用的時間序列分析方法,其中AR/MR/ARMR/ARIMA在這個發展過程中扮演課非常重要的角色,知道現在,他們都在實際工作生活發揮重要作用。這四種分析方法的共同特點都是跳出變動成分的分析角度,從時間序列本身出發,力求得出前期數據與后期數據的量化關系,從而建立前期數據為自變量,后期數據為因變量的模型,達到預測的目的。
AR/MR/ARMR/ARIMR是四種可以獨立使用的分析方法,是互補的關系,適用於包含不同變動成分的時間序列。AR/MR/ARMA用於分析平穩時間序列,ARIMA通過差分可以用於處理非平穩時間序列。一般具有長期趨勢的時間序列都是非平穩時間序列。根據趨勢的不同,可以使用差分將具有長期趨勢的時間序列轉換成平穩時間序列。例如,線性增長的長期趨勢,可以通過一階差分形成新的平穩的時間序列。例如時間序列的數值為線性增長的(1,2,3,4,5,6,7,8),經過一階差分以后,新的時間序列的數值為(1,1,1,1,1,1,1),就成為穩定的時間序列了。
根據長期趨勢的發展趨勢不同,可以進行差分的次數和方法也不相同,一般的規律如下:
1、一次差分的時間序列數值大體相同,配合直線趨勢
2、二次差分的時間序列數值大體相同,配合二次曲線
3、對數的一次差分的時間序列數值大體相同,配合指數曲線
4、一次差分的環比值大體相同 ,配合修正指數曲線
5、對數一次差分的環比值大體相同,配合Gompertz曲線
6、倒數一次差分的環比值大體相同,配合Logistic曲線
五、AR/MA/ARMA模型
1、AR模型(auto regressive model)
如果某個時間序列的任意數值可以表示為下面的回歸方程,那么該時間序列服從p階的自回歸過程,可以表示為AR(p):
可以發現,AR模型利用前期數值與后期數值的相關關系(自相關),建立包含前期數值和后期數值的回歸方程,達到預測的目的,因此成為自回歸過程。這里需要解釋白噪聲,大家可以將白噪聲理解成時間序列數值的隨機波動,這些隨機波動的總和會等於0,例如前面統計基礎文章中介紹的,某條餅干的自動化生產線,要求每包餅干為500克,但是生產出來的餅干產品由於隨機因素的影響,不可能精確的等於500克,而是會在500克上下波動,這些波動的總和將會等於互相抵消等於0。
2、MA模型(moving average model)
如果某個時間序列的任意數值可以表示成下面的回歸方程,那么該時間序列服從q階的移動平均過程,可以表示為MA(q):
可以發現,某個時間點的指標數值等於白噪聲序列的加權和,如果回歸方程中,白噪聲只有兩項,那么該移動平均過程為2階移動平均過程MA(2)。比較自回歸過程和移動平均過程可知,移動平均過程其實可以作為自回歸過程的補充,解決自回歸方差中白噪聲的求解問題,兩者的組合就成為自回歸移動平均過程,稱為ARMA模型。
3、ARMA模型(auto regressive and moving average model)
自回歸移動平均模型由兩部分組成:自回歸部分和移動平均部分,因此包含兩個階數,可以表示為ARMA(p,q),p是自回歸階數,q為移動平均階數,回歸方程表示為:
從回歸方程可知,自回歸移動平均模型綜合了AR和MA兩個模型的優勢,在ARMA模型中,自回歸過程負責量化當前數據與前期數據之間的關系,移動平均過程負責解決隨機變動項的求解問題,因此,該模型更為有效和常用。
4、ARIMA 差分自回歸移動平均模型
ARIMA模型能夠用於齊次非平穩時間序列的分析,這里的齊次指的是原本不平穩的時間序列經過d次差分后成為平穩時間序列。差分自回歸移動平均模型寫成ARIMA(p,d,q)。p代表自回歸階數;d代表差分次數;q代表移動平均階數。在spss軟件中,有時輸出的ARIMA模型包括6個參數:ARIMA(p,d,q)(P,D,Q),這是因為如果時間序列中包含季節變動成分的話,需要首先將季節變動分解出來,然后再分別分析移除季節變動后的時間序列和季節變動本身。這里小寫的p,d,q描述的是移除季節變動成分后的時間序列;大寫的P,D,Q描述的是季節變動成分。兩個部分是相乘的關系。因此,ARIMA(p,d,q)(P,D,Q)也被稱為復合季節模型。
總結
以上介紹了兩個時間序列分析的體系:時間序列分解模型體系和AR/MA/ARMA/ARIMA模型體系。兩者的分析原理是不同的,時間序列分解是力求將時間序列分解成不同的變動成分,分析每種變動成分的規律,然后在綜合各種成分的規律用於預測;AR/MA/ARMA/ARIMA模型體系是從時間序列數值本身的相關關系出發,將移動平均技術、相關分析技術和平穩技術(差分)等納入模型,力求建立時間序列數值之間的回歸方程,從而達到預測的目的。