時間序列分析的主要目的是根據已有的歷史數據對未來進行預測。如餐飲銷售預測可以看做是基於時間序列的短期數據預測, 預測的對象時具體菜品的銷售量。
1.時間序列算法:
常見的時間序列模型;
2.時序模型的預處理
1. 對於純隨機序列,也稱為白噪聲序列,序列的各項之間沒有任何的關系, 序列在進行完全無序的隨機波動, 可以終止對該序列的分析。
2. 對於平穩非白噪聲序列, 它的均值和方差是常數。ARMA 模型是最常用的平穩序列擬合模型。
3. 對於非平穩序列, 由於它的方差和均值不穩定, 處理方法一般是將其轉化成平穩序列。 可以使用ARIMA 模型進行分析。
對平穩性的檢驗:
1.時序圖檢驗:根據平穩時間序列的均值和方差都是常數的特性,平穩序列的時序圖顯示該序列值時鍾在一個參數附近隨機波動,而且波動的范圍是有界的。如果有明顯的趨勢或者周期性, 那它通常不是平穩序列。
2.自相關圖檢驗:平穩序列具有短期相關性, 這個性質表明對平穩序列而言, 通常 只有近期的序列值得影響比較明顯, 間隔越遠的過去值對現在的值得影響越小。 而非平穩序列的自相關系數衰減的速度比較慢。
3.單位根檢驗:單位根檢驗是指檢驗序列中是否存在單位根, 如果存在單位根, 那就是非平穩時間序列。 目前最常用的方法就是單位根檢驗。
原假設是 非平穩序列過程, 備擇假設是 平穩序列, 趨勢平穩過程
3.時間序列分析:
•平穩性:
•平穩性要求經由樣本時間序列所得到的擬合曲線,在未來一段時間內仍然沿着現有的形態‘慣性’地延續下去。
•平穩性要求序列的均值和方差不發生明顯的變化。
•弱平穩:期望和相關系數(依賴性)不變,未來某個時刻t 的值,Xt 要依賴於它過去的信息。
•差分法:時間序列在 T 與 T-1 時刻的差值(使用差分使其滿足平穩性),一般差分1,2 階就可以了。
•AR(自回歸模型):
•描述當前值與歷史值之間的關系, 用變量自身的歷史時間數據對自身進行預測。自回歸模型必須滿足平穩性的要求。
公式定義:
自回歸模型的限制:
1.自回歸模型是使用自身的數據進行預測的
2.必須具有平穩性
3.必須具有相關性,如果相關性小於 0.5 , 則不宜使用
4.自回歸模型只適用於預測與自身前期相關的預測。
•MA(移動平均模型):
•移動平均模型關注的是自回歸模型中的誤差項的累加
•移動平均法能有效地消除預測中的隨機波動。
•ARMA(自回歸平均模型):
•自回歸和移動平均的結合。
•ARIMA(p,d,q)差分自回歸移動平均模型(Autoregressive Integrated Moving Average Model ,簡稱ARIMA)
•AR 是自回歸, p 是自回歸項, MA 是移動平均, q 為移動平均項, d 為時間序列稱為平穩時 所做的差分次數。
•原理: 將非平穩時間序列轉換成平穩時間序列, 然后將因變量僅對它的滯后值(p階)以及隨機誤差項的現值和滯后值進行回顧所建立的模型。
•ARIMA 建模流程:
•1.將序列平穩化(差分法確定 d)
•2.p 和 q 階數的確定(ACF 和 PACF 確定)
•3.建立模型 ARIMA (p , d , q )
使用ARIMA 模型對某餐廳的銷售數據進行預測
#使用ARIMA 模型對非平穩時間序列進行建模操作
#差分運算具有強大的確定性的信息提取能力, 許多非平穩的序列差分后顯示出平穩序列的性質, 這是稱這個非平穩序列為差分平穩序列。
#對差分平穩序列可以還是要ARMA 模型進行擬合, ARIMA 模型的實質就是差分預算與 ARMA 模型的結合。
利用模型向前預測的時期越長, 預測的誤差就會越大,這是時間預測的典型特點。