原文鏈接:http://tecdat.cn/?p=12174
介紹
本文比較了幾個時間序列模型,以預測SP 500指數的每日實際波動率。基准是SPX日收益系列的ARMA-EGARCH模型。將其與GARCH模型進行比較 。最后,提出了集合預測算法。
假設條件
實際波動率是看不見的,因此我們只能對其進行估算。這也是波動率建模的難點。如果真實值未知,則很難判斷預測質量。盡管如此,研究人員為實際波動率開發了估算器。Andersen,Bollerslev Diebold(2008) 和 Barndorff-Nielsen and Shephard(2007) 以及 Shephard and Sheppard(2009) 提出了一類基於高頻的波動率(HEAVY)模型,作者認為HEAVY模型給出了 很好的 估計。
假設:HEAVY實現的波動率估算器無偏且有效。
在下文中,將HEAVY估計量作為 觀察到的已實現波動率 來確定預測性能。
數據來源
- SPX每日數據(平倉收益)
- SPX盤中高頻數據(HEAVY模型估計)
- VIX
- VIX衍生品(VIX期貨)
在本文中,我主要關注前兩個。
數據采集
實際波動率估計和每日收益
我實現了Shephard和Sheppard的模型,並估計了SPX的實現量。
SPXdata$SPX2.rv
是估計的實際方差。 SPXdata$SPX2.r
是每日收益(平倉/平倉)。 SPXdata$SPX2.rvol
是估計的實際波動率
基准模型:SPX每日收益率建模
ARMA-EGARCH
考慮到在條件方差中具有異方差性的每日收益,GARCH模型可以作為擬合和預測的基准。
首先,收益序列是平穩的。
分布顯示出尖峰和厚尾。可以通過縮放的t分布回歸分布密度圖來近似 。黑線是內核平滑的密度,綠線是縮放的t分布密度。
自相關圖顯示了一些星期相關性。Ljung-Box測試確認了序列存在相關性。
auro.arima
表示ARIMA(2,0,0)可以對收益序列中的自相關進行建模,而eGARCH(1,1)在波動率建模中很受歡迎。因此,我選擇具有t分布誤差的ARMA(2,0)-eGARCH(1,1)作為基准模型。
我用4189個觀測值進行了回測(從2000-01-03到2016-10-06),使用前1000個觀測值訓練模型,然后每次向前滾動預測一個,然后每5個觀測值重新估計模型一次 。下圖顯示 了樣本外 預測和相應的實際波動率。
預測顯示與實現波動率高度相關,超過72%。
誤差摘要和繪圖
平均誤差平方(MSE):
改進:實現的GARCH模型和LRD建模
已實現GARCH
realGARCH
該模型由 Hansen,Huang和Shek(2012) (HHS2012)提出,該模型 使用非對稱動力學表示將實現的波動率測度與潛在 真實波動率聯系起來。與標准GARCH模型不同,它是收益和已實現波動率度量的聯合建模(本文中的HEAVY估計器)。
模型:
滾動預測過程與上述ARMA-EGARCH模型相同。下圖顯示 了樣本外 預測和相應的實現。
預測與實現的相關性超過77%
誤差摘要和圖:
均方誤差(MSE):
備注:
-
用於每日收益序列的ARMA-eGARCH模型和用於實現波動率的ARFIMA-eGARCH模型利用不同的信息源。ARMA-eGARCH模型僅涉及每日收益,而ARFIMA-eGARCH模型基於HEAVY估算器,該估算器是根據日內數據計算得出的。RealGARCH模型將它們結合在一起。
-
以均方誤差衡量,ARFIMA-eGARCH模型的性能略優於realGARCH模型。這可能是由於ARFIMA-eGARCH模型的LRD特性所致。
集成模型
隨機森林
現在已經建立了三個預測
- ARMA
egarch_model
- realGARCH
rgarch model
- ARFIMA-eGARCH
arfima_egarch_model
盡管這三個預測顯示出很高的相關性,但預計模型平均值會減少預測方差,從而提高准確性。使用了隨機森林集成。
隨機森林由500棵樹組成,每棵樹隨機選擇2個預測以適合實際值。下圖是擬合和實現。
預測與實現的相關性:
誤差圖:
均方誤差:
MSE與已實現波動率方差的比率
備注
涉及已實現量度信息的realGARCH模型和ARFIMA-eGARCH模型優於標准的收益系列ARMA-eGARCH模型。與基准相比,隨機森林集成的MSE減少了17%以上。
從信息源的角度來看,realGARCH模型和ARFIMA-eGARCH模型捕獲了日內高頻數據中的增量信息(通過模型,HEAVY實現的波動率估算器)
進一步研究:隱含波動率
以上方法不包含隱含波動率數據。隱含波動率是根據SPX歐洲期權計算得出的。自然的看法是將隱含波動率作為預測已實現波動率的預測因子。但是,大量研究表明,無模型的隱含波動率VIX是有偏估計量,不如基於過去實現的波動率的預測有效。 Torben G. Andersen,Per Frederiksen和Arne D. Staal(2007) 同意這種觀點。他們的工作表明,將隱含波動率引入時間序列分析框架不會帶來任何明顯的好處。但是,作者指出了隱含波動率中增量信息的可能性,並提出了組合模型。
因此,進一步的發展可能是將時間序列預測和隱含波動率(如果存在)的預測信息相結合的集成模型。