在做很多與時間序列有關的預測時,比如股票預測,餐廳菜品銷量預測時常常會用到時間序列算法,之前在學習這方面的知識時發現這方面的知識講解不多,所以自己對時間序列算法中的常用概念和模型進行梳理總結(但是為了內容的正確性有些內容我通過截圖來記錄吧),希望能有所幫助^.^
一、時間序列的預處理
在拿到基於時間的觀測值序列后,需要首先進行兩步預處理,一個是純隨機性檢驗,另一個是平穩性檢驗,然后根據這兩步的檢驗結果再采取相應的時間序列模型進行分析。
簡單來講平穩序列就是指均值和方差不發生明顯變化
注:時序圖檢驗和自相關檢驗實際是通過繪制相應的圖進行觀察,在下面的內容會結合具體的圖進行分析
二、平穩時間序列模型
在學習具體模型之前,我們需要了解兩種相關系數
1.自相關系數
2.偏相關系數
不要小看這兩個系數,它們對於模型的選擇起着至關重要的作用,如果現在對這兩個系數還不是很理解,請繼續往下看吧~。~
(一)、自回歸模型AR(p)
(二)、移動平均模型MA(q)
(三)、自回歸移動平均模型ARMA(p,q)
三、非平穩時間序列模型
在實際環境中大多數序列都是非平穩的,這里主要學習ARIMA模型
從它的名字我們就可以看到在使用它時需要首先對數據進行差分運算將非平穩時間序列變為平穩時間序列,然后再運用ARIMA模型。
四、確定參數p,q的取值
現在還剩最后一個問題要解決了,我們已經知道時間序列都有哪些模型了,那么我們怎么確定使用哪個模型呢,確定了使用哪個模型后,就要特別注意我用綠色圈圈畫出的p,q,怎么確定相應模型的參數取值呢?
讓我們看一下下面的這張圖吧,它就是上面兩個問題的key,現在直接看肯定是看不明白的,讓我們先看列ACF,PACF,它們其實就是自相關系數和偏自相關系數(在上面已經提到了)的圖,先知道一下什么是截尾的概念,截尾就是指ACF圖,PACF圖何時落入置信區間(這個是我自己理解的,大家可以自行查閱)
確定參數p,q的取值主要有兩種方法:
1.肉眼觀察ACF圖和PACF圖法
現在我們結合上面的原則觀察下面的自相關圖和偏自相關圖,發現自相關圖1階截尾,偏自相關圖具有拖尾性,所以可以確定為MA模型,並且取q為1,但是有時觀察圖並不是很准確,我們就可以使用下面的方法啦
2.計算AIC,BIC,原則是使AIC和BIC越小越好(大家可以自己查閱具體詳細的知識^.^)
終於寫完這篇梳理筆記了,開心。