原文鏈接:http://tecdat.cn/?p=23882
原文出處:拓端數據部落公眾號
摘要
隨機波動率(SV)模型是常用於股票價格建模的一系列模型。在所有的SV模型中,波動率都被看作是一個隨機的時間序列。然而,從基本原理和參數布局的角度來看,SV模型之間仍有很大的不同。因此,為一組給定的股票價格數據選擇最合適的SV模型對於對股票市場的未來預測非常重要。為了實現這一目標,可以使用留一交叉驗證(LOOCV)方法。然而,LOOCV方法的計算成本很高,因此它在實踐中的應用非常有限。在對SV模型的研究中,我們提出了兩種新的模型選擇方法,即綜合廣泛適用信息准則(iWAIC)和綜合重要性抽樣信息准則(iIS-IC),作為近似LOOCV結果的替代品。在iWAIC和iIS-IC方法中,我們首先計算每個觀測值的期望似然,作為相對於相應的潛變量(當前的對數波動參數)的積分。由於觀測值與相應的潛變量高度相關,每個第 t 個觀測值(y obs t)的綜合似然值期望接近於以 y obs t 為保持數據的模型所計算的 y obs t 的期望似然值。其次,在計算信息標准時,綜合期望似然被用作期望似然的替代。由於相對於潛變量的整合在很大程度上減少了模型對相應觀測值的偏差,因此整合后的信息標准有望接近LOOCV結果。為了評估iWAIC和iIS-IC的性能,我們首先使用模擬數據集進行了實證研究。該研究結果表明,iIS-IC方法比傳統的IS-IC有更好的性能,但iWAIC的性能並不優於非綜合WAIC方法。隨后,利用股票市場收益數據進行了進一步的實證研究。根據模型的選擇結果,對於給定的數據,最好的模型是具有兩個獨立自回歸過程的SV模型,或者是具有非零預期收益的SV模型。
緒論
1.1 隨機波動率模型
隨機波動率(SV)模型被廣泛用於股票價格的建模,Taylor(1982)和 Hull 和 White(1987)在期刊上發表的論文中對此進行了描述。在基本的隨機波動率模型中,均值修正后的每日連續復利收益yt可以被建模為具有隨機波動率的正態分布。與指數加權移動平均數(EWMA)模型和廣義自回歸條件異方差(GARCH)模型不同,對數波動率在 SV 模型中被視為馬爾可夫過程。
作為馬爾可夫過程的結果,對數波動率本身成為一個隨機過程。因此,SV 模型不需要像其他一些模型(即 Black 和 Scholes (1973)提出的著名的 Black-Scholes 模型)那樣假設恆定波動率或固定波動率過程。由於波動率確實會隨着時間的推移而變化,因此假設波動率不變是許多非 SV 模型的主要缺陷,特別是當時間跨度較長時。因此,在對股票價格和其他一些具有變化的波動率的衍生品進行建模時,SV 模型往往是一個很好的選擇。
除了基本模型外,許多擴展的SV模型也被用於股票價格建模的目的,如Harvey等人(1994);Shephard(1996);Gallant和Tauchen(1996);Chernov等人(2003)發表的論文中所述。
在這篇論文中,對八個不同的模型進行了測試和比較,用於股票價格的建模。每個測試的模型都是基本的SV模型或其變體。
為了使用馬爾科夫鏈蒙特卡洛方法從SV模型參數的后驗分布中取樣,我們需要知道一個與后驗分布成正比的函數。為了實現這一目標,研究中使用了貝葉斯推斷法。根據貝葉斯規則,給定模型參數π(θ)的先驗分布和一組觀測數據D,模型參數的后驗分布與模型參數的后驗似然函數f(D|θ)π(θ)和模型參數先驗分布的乘積成正比。

隨機波動率模型和模型擬合過程
2.1 隨機波動率模型
公司股票的價格是由實體產生未來現金流的能力決定的,同時也受到股票供求關系的影響。如果我們對某只股票進行投資,那么在一段時間內對該股票的投資利潤就稱為該股票的收益率。在實踐中,股票的收益率與股票的波動性密切相關。如果yt是連續復利的收益率,那么二者之間的關系可以用以下公式來模擬。

股價波動率是衡量標的資產價格變化(上升或下降)的預期幅度,這是股票的一個非常重要的特征。某只股票的波動率對於預測股票本身的價格以及許多其他與股票有關的衍生品是至關重要的。例如,根據著名的布萊克-斯科爾斯模型,當標的股票的隱含波動率較高時,某只股票的歐洲看漲期權(具有相同的執行價格和到期日)需要更多的權利金(更有價值)(Black and Scholes, 1973)。此外,從風險管理的角度來看,股票的波動率需要用來確定投資組合的風險值(VaR)(Giot 和 Laurent,2004)。
諸如歷史模擬的傳統方法可能無法識別波動率的變化,廣義自回歸條件異方差(GARCH)模型因此經常被用來預測未來的波動率(Engle, 1982; Bollerslev, 1986)。例如,在 GARCH(1,1)模型中,波動率 σ 2 t 按照以下公式計算。

隨機波動率(SV)模型是GARCH模型在股票價格波動率建模中的替代品(Taylor,1982;Hull和White,1987)。在 SV 模型中,波動率被認為是一個隨機過程。通過允許過程中的隨機性,SV模型在理論上有更多的好處。在這項研究中,我們測試了幾個自回歸隨機波動率(AR-SV)模型,這是一個流行的SV模型的子類別。在基本的AR-SV模型中,波動率的對數,ht=log(σt),被建模為一個隨機的自回歸過程。

這也可以寫成

鑒於對數波動率,每日股票收益率yt可以被建模為

模型1
這個模型是我們之前提到的基本 AR-SV 模型。調整對數波動率過程的狀態方程為:

和日收益率的觀察方程方程為

模型2
模型 2 是基本 SV 模型的一個變種。在這個模型中,對數波動率的狀態方程與基本的 AR-SV 模型相同,但是每日收益率的平均值
yt是α(非零)而不是零:

模型3
在這個模型中,對數波動率ht遵循一個AR(2)過程

這個方程最適合用來模擬具有較低自相關性的滯后-1 對數波動率過程。根據 Yule-Walker 方程(Cheng, 2005),對於這個 AR(2)過程中的任何 ht,滯后-1 自身相關(ht 和 ht-1 之間的相關性)是 ht-1 的系數,也就是 φ。另一方面,滯后n自相關(ht和ht-n之間的相關性)由φ n + ψ n-1給出。因此,該模型表明當前的對數波動率與它的滯后-1 對數波動率的相關性較小,但與所有其他的滯后對數波動率的相關性較大。
模型4
該模型由兩個獨立的AR(1)過程組成,如Harvey等人所述。

在這個模型中,對數波動率 ht 由 µ + h (1) t + h (2) t 給出,h (1) t 和 h (2) t 是兩個獨立的 AR(1) 過程。
模型5
模型5允許ut和vt+1之間存在相關性,這導致yt的不對稱效應。這種ut和vt+1之間的相關性早已被Black(1976)以及Engle和Ng(1993)所注意。在 Engle 和 Ng(1993)之前完成的一項研究中,發現收益沖擊對波動率有一定的影響。因此,假設二者之間存在關聯性是合理的。在模型 5 中,該相關性由以下協方差矩陣描述。

因此,SV模型方程和ht的狀態方程可以寫成

模型6
在這個模型中,觀察方程中包含了一個跳躍成分(觀察值的額外隨機向上或向下運動)。此外,yt也受到其滯后觀測值yt-1的影響。

一般來說,這個模型表明當前的收益率yt是由當前的價格波動率、隨機跳躍的發生和之前的觀察值yt-1決定的。
模型7
與模型6類似,模型7也包括跳躍成分,但不包括前面的觀察。

模型7中所有參數的分布都與模型6中的參數相同。
• 模型8
為了得到這個模型,觀察方程中的高斯觀察誤差被自由度為ν的學生t分布所取代。

由於誤差是對稱的和非正態的,根據Andrews和Mallows(1974)的觀點,可以使用正態分布的比例混合進行模型擬合。

2.2 擬合SV模型的貝葉斯推斷和馬爾科夫鏈蒙特卡洛抽樣法
由於似然函數的非分析形式,將經典的統計推斷,如最大似然估計,應用於SV模型是相當困難的。為了克服這個問題,人們提出了幾種替代方法。例如,在Harvey等人(1994)提出的准最大似然法中,通過將log(yt)的分布視為正態分布,得到了實際似然函數的近似值。然后,這個近似函數(准最大似然函數)被最大化,而不是實際似然函數。
在另一種被稱有效矩量法(EMM)的方法中,准似然函數的導數被用作廣義矩法(GMM)的矩條件。然后通過最小化矩條件的准則來計算EMM估計的參數。通過使用這個矩條件,而不是臨時選擇一些低階矩,EMM方法被認為是更有效的(Andersen等人,1999)。
在我們的研究中,我們對SV模型采用了貝葉斯推斷法。根據貝葉斯規則,給定模型參數π(θ,h)的先驗分布和觀測數據y obs,模型參數的后驗分布可以表示為。

為了將模型擬合給定的數據集,我們使用馬爾科夫鏈蒙特卡洛(MCMC)方法從每個模型的參數的后驗分布中取樣。在MCMC過程中,模型參數是根據馬爾科夫鏈進行抽樣的。馬爾科夫鏈是一個隨機過程,在一個給定的狀態空間中進行狀態轉換。給定一個有限的狀態空間,當鏈足夠長時,馬爾科夫鏈必然會達到一個穩定狀態(不變分布)(Gilks,2005)。
比較隨機模型的統計方法
在研究股票市場數據和預測未來趨勢時,模型的選擇非常重要。通過使用正確的模型,可以更好地理解和解釋數據的屬性,從而可以做出更好的預測和估計。而在實踐中使用錯誤的模型,則可能導致本可避免的意外損失。
傳統的方法,包括平均平方誤差(MSE)和決定系數(R2),只衡量數據與模型的擬合程度。由於在一個模型中增加額外的參數通常會增加擬合度,這些方法往往有利於復雜的模型,可能會過度擬合數據。為了克服過度擬合的問題,引入了交叉驗證方法。交叉驗證方法包括將數據集划分為兩個子集,用一個子集擬合模型,用另一個子集測試模型。盡管交叉驗證法似乎能夠完全解決過度擬合的問題,但這些方法耗時且成本高。另外,許多方法對模型的復雜性進行了懲罰。
實證結果
4.1 仿真研究
在我們的第一個研究中,通過使用一組模擬數據集來測試模型選擇標准的性能。首先,我們從模型6生成了一個數據集,數據的真實模型是模型6。這個數據生成過程被重復了100次,生成了100個數據集。其次,每個模擬數據集都被單獨擬合到列出的所有候選SV模型中。最后,使用模型選擇標准,包括DIC、nWAIC、nIS、iWAIC和iIS,來為模擬數據集選擇最佳模型。
在第一步,通過將模型6中的參數設置為一些特定的值來模擬數據集。在我們的特定情況下,用於數據生成的參數是:µ = -10,φ = 0.96,τ = 0.345,β = 0.1,κ = 0.08,δ = 0.03。每個模擬數據集是一個有2000個觀測值的時間序列。
一旦生成了數據集,我們隨后將候選的SV模型與數據進行擬合。為了擬合這些模型,我們使用了馬爾科夫鏈蒙特卡洛(MCMC)方法,從每個模型的參數后驗中取樣。許多MCMC算法已經被提出來對模型參數進行抽樣,如Metropolis-Hastings算法和Gibbs采樣。基於這些MCMC算法,開發了許多采樣軟件包,包括WinBUGS、OpenBUGS和JAGS(Lunn等人,2000;Spiegelhalter等人,2007;Plummer,2003)。然而,由於這些軟件包主要是基於Metropolis-Hastings算法,它們可能會因為算法中使用的隨機游走法提出新的狀態而出現收斂緩慢的問題。為了克服這個問題,開發了stan包(Carpenter等人,2015;Gelman等人,2015)。在stan中,通過應用Hamilton Monte Carlo和no-U-turn采樣,收斂速度可以快得多(Carpenter等人,2015)。因此,我們決定在SV模型的特定研究中使用stan采樣器。
在使用stan采樣器對模型參數的后驗分布進行采樣之前,我們需要先對參數進行先驗分布。對於本研究中的所有SV模型,μ的先驗分布是正態的,均值為-10,標准差為5。此外,τ 2的先驗分布為反Gamma(2.5, 0.025)(Kim et al., 1998),對於所有的候選模型,φ的先驗分布都是在0和1之間均勻分布。對於模型2,參數α∼N(0,10)的先驗,所有其他參數的先驗與基本SV模型相同。模型3中ψ的先驗分布與基本SV模型中φ的先驗分布相同(在0和1之間均勻分布)。在模型4中,參數φ2的先驗分布與基本SV模型中的φ相同。對於模型5,ρ的先驗分布在-1和1之間,均值為0,這給了相關參數ρ一個非信息性的先驗分布。模型6中的β參數衡量了當前觀測對先前觀測的影響程度,該參數一般被認為是小的。因此,我們對這個參數施加了β∼N(0,0.2)的信息性先驗。同樣在模型6中,衡量觀察中發生跳躍(yt的額外向上或向下運動,可能發生也可能不發生)的概率的κ參數被賦予Beta(2, 100)先驗(Chib等人,2002)。另一方面,跳躍大小參數st的先驗分布為ln(1+st)∼N(-δ 2/2, δ2),我們假定log(δ)的先驗分布為log(δ)∼N(-3.07, 0.149)(Chib et al., 2002)。在模型8中,參數ν在[2, 128]上有一個均勻分布作為其先驗(Chib等人,2002)。
一旦模型參數的先驗值被設定,Stan采樣器讀取模擬觀測值(來自模型6),隨后對候選模型進行擬合。為了確保馬爾科夫鏈的收斂,每個單獨的馬爾科夫鏈的采樣迭代次數被設定為20,000次。由於鏈可能需要一段時間來收斂,所以前10,000個樣本被放棄。為了減少相鄰樣本之間的自相關,最后的樣本只包含其余10,000個樣本中的每10個樣本。此外,為了確保馬爾科夫鏈的收斂性,對每個模擬數據集同時運行兩個獨立的鏈。兩條鏈在同一組數據上的比較證實了馬爾科夫鏈在MCMC抽樣的前10,000個樣本之前就已經收斂了。Rˆ是對跨鏈變異與鏈內變異的相對測量,接近1.0的值表明收斂性良好(Gelman等人,2011)。在我們的研究中,我們為每個后驗分布(基於給定模型的數據集)運行兩個單獨的馬爾可夫鏈,如果馬爾可夫鏈確實收斂,那么在收斂點之后,同一數據集的兩個鏈應該表現出類似的模式。Rˆ值大於1表明收斂不完善,Rˆ值越大,收斂就越差。擬合模型(使用模擬數據)的參數Rˆ值大多非常接近1,表明這些模型的馬爾科夫鏈確實收斂了。
不過,一個例外是模型4中的φ(Rˆ=53.8731)、τ(Rˆ=2.8202)、φ2(Rˆ=59.9186)和τ2(Rˆ=2.9484)參數。這些大的Rˆ值表明,馬爾科夫鏈在這個模型中收斂得並不好。然而,在這種特殊情況下,這個問題並不是一個大問題。在模型4中,我們有兩個獨立的AR(1)過程,它們具有相同的公式格式。因此,該模型包含兩個模式。如果一個模式包含h (1) t, φ, τ, h (2) t, φ2, τ2和所有其他參數,那么另一個模式是通過保持所有其他參數不變而用h (2) t, φ, τ的值完全交換來形成的。因此,模型4的Rˆ的高值是由兩個鏈收斂到兩個不同的模式引起的(見圖4.2的例子)。由於這兩個模式彼此相距較遠,任何現有的采樣器都很難在這個特定的情況下探索參數空間。由於收斂到不同的模式會保持h(1)t+h(2)t的分布不變,而ˆyt的分布只取決於h(1)t和h(2)t的總和,所以整個模型對yt的預測是不受影響的。
表4.2中列出了擬合參數的值及其標准偏差。表中的結果顯示,模型參數的期望值基本符合數據生成參數的輪廓,這表明擬合效果良好。
-
-
##########################################
-
## ##下面的R代碼從模型6生成100組模擬數據。
-
## ##數據集生成就會存儲在當前文件夾中。
-
##########################################
-
## y --- 模擬數據集。
-
for (ifold in 1:100){
-
s <- lss <- y<- h <- qq <- rep (0, T)
-
h[1] <- rnorm (1, mu + phi * (h0 - mu), tau)
-
for (t in 1:T) {lss[t] <- rnorm(1, -(delta^2)/2,delta^2); s[t] <- exp (lss[t] ) -
-
1}
-
-
##模型##########################################
-
-
-
## 下面的R代碼用rstan語言定義了模型1。
-
-
-
fit <- stan(model_code = model1, data = list(y = y, T = T), iter = 20000,
-
chains = 2, thin = 10)
-


每個跟蹤圖中的兩條鏈來自於基於模型6和同一組數據的兩條單獨模擬的馬爾可夫鏈。跨鏈方差與預燒期后的鏈內方差相比相對較小,表明馬爾科夫鏈的收斂性良好。
-
##########################################
-
## 下面的R代碼用rstan語言定義了模型4。
-
##########################################
-
-
model4 <-'
-
int<lower=1> T。
-
}
-
-
real<lower=0,upper=1> phi1。
-
real<lower=0,upper=1> phi2。
-
real<lower=0.0001> tausq;
-
real<lower=0.0001> tau2sq;
-
-
}
-
-
real<lower=0> tau。
-
real<lower=0> tau2。
-
tau <- sqrt(tausq);
-
tau2 <- sqrt(tau2sq);
-
}
-
-
mu ~ normal(-10,5);
-
-
h1[t] ~ normal(phi1*h1[t-1], tau);
-
-
h2[t] ~ normal(phi2*h2[t-1], tau2)。
-
-
##########################################
-
## 下面的R代碼使用HMC對給定的數據集進行模型擬合
-
方法。
-
## ###從每組測試數據中產生兩個獨立的馬爾科夫鏈。
-
##########################################
-
-
fit <- stan(model_code = model4, data = list(y = y, T = T), iter = 20000,


當兩個馬爾科夫鏈收斂到不同模式時,模型4中φ和φ2的跟蹤圖實例。軌跡圖中的φ和φ2來自基於模型4和同一組數據的兩個單獨模擬的馬爾科夫鏈。與鏈內方差相比,跨鏈方差很大,這是因為兩個鏈收斂到兩個不同的模式。
當stan采樣器完成模型參數的采樣后,使用DIC、WAIC、IS、iWAIC和iIS標准來進行模型選擇。為了計算iIS和iWAIC的綜合似然,我們在每次迭代中對每個時間點t抽樣100個ht。這個隨機抽樣過程是根據計算出的ht |θ,h-t的分布完成的(詳見第三章)。當得到f(ht |θ,h-t)的樣本后,可以計算出相應的log f(y obs t |θ,h-t)。為了計算這個綜合似然,我們將f(ht |θ,h-t)的樣本插入y obs t的概率函數中,一次一個,以計算每個迭代中每個時間點的y obs t的總共100個對數比例的概率。最后,100個y obs t的對數似然性的平均值將提供一個理想的綜合對數似然性log f(y obs t |θ,h-t)的良好估計。然而,對於模型5來說,f(ht |θ,h-t)的樣本不能輕易地從一個明確的分布中獲得,綜合對數似然的近似值是通過數字正交的方法計算的。
4.2 標普100指數數據的實證研究
除了模擬研究,我們還使用了一組真實世界的股市數據(2010年9月至2015年8月的標普100股票指數數據)來擬合SV模型。標准普爾100指數包括100只股票,這些股票幾乎占股票市場市值的45%。這個股票子集在資本市場上發揮着重要作用,是衡量金融市場整體實力的一個良好指標。因此,找到一個合適的方法來模擬標准普爾100指數數據是非常重要的。
在這項研究中,我們使用了2010年9月至2015年8月(1,258個交易日)標普100指數(從雅虎財經導出)的均值校正、連續復利的每日收益。總的來說,如圖4.3所示,這一時期的收益率上升,被認為是2008年股市下跌后的 "復蘇期"。然而,由於經濟狀況和貨幣政策的頻繁變化,股票市場的波動率在不同時期有很大的不同。因此,將SV模型應用於股票市場數據是有意義的。


真實數據研究中的模型擬合過程與我們之前對模擬數據的研究相同。rstan軟件包被用來用股票市場數據擬合模型參數。馬爾科夫鏈的總迭代次數為20,000次,預燒期為10,000次。也就是說,前10,000個樣本被丟棄了。對於剩下的10,000個樣本,我們只保留每10個樣本,以減少自相矛盾。對每個模型中的數據集運行了兩條平行的馬爾科夫鏈,Rˆ結果(詳見表4.5)顯示,馬爾科夫鏈在預燒期后收斂了。模型參數的Rˆ值一般都接近於1,表明馬爾可夫鏈收斂效果良好。
所有的擬合參數都列在模型參數表中,如表4.6所示。從該表提供的結果可以看出,有些模型參數的絕對值非常小,而方差卻很大,說明這些參數與0沒有顯著區別。如果是這樣,相應的模型可能不是給定數據的好選擇。
當我們從MCMC抽樣過程中得到模型參數樣本后,分別應用DIC、nWAIC、iWAIC、nWAIC、nIS和iIS方法對模型進行選擇(詳見模擬研究)。表4.7列出的結果顯示,除了iWAIC方法外,其他五種模型選擇標准都選擇了模型4作為給定股市指數數據的最佳模型。此外,DIC、nWAIC、nIS和iIS方法在模型的好壞排序上也提供了非常相似的結果。然而,nWAIC方法選擇了模型8作為最佳模型。同樣對於nWAIC方法,其余的排名結果也與其他的模型選擇標准非常不同。
結論和討論
總之,根據模擬數據研究,HMC方法在模型參數的后驗分布中取樣是成功的。在測試的模型選擇方法中,DIC方法的效果相當好。DIC方法的良好表現可能是由於在大多數擬合的模型中,參數通常遵循多變量正態分布。此外,nIS也相當一致,這表明重要性加權是糾正樂觀偏差的有效方法。此外,iIS 的結果顯示,與當前對數波動率 ht 相關的積分是進一步解決偏差問題的好方法。因此,iIS 方法能夠比 nIS 方法有所改進。但是,綜合方法可能並不總是一個好的選擇,因為它的計算成本很高。最后,在所有測試的方法中,nWAIC和iWAIC的性能都是最差的,這使得它們的理論基礎值得懷疑。根據這項研究,我們可以知道這兩種WAIC方法可能無法通過其公式准確地量化模型復雜性。
此外,對真實股市收益數據(2010年9月至2015年8月的標普100指數)的研究表明,根據模型選擇標准,最佳模型是模型4,這表明數據序列遵循ARMA過程。然而,由於所有的選擇標准都對模型4有強烈的偏好,即使真實的模型不是模型4,選擇這個模型作為最佳模型可能是一個錯誤。因此,次好的模型,模型2(非零預期收益模型),也是真實模型的良好候選。
在我們的研究中,我們使用馬爾科夫鏈蒙特卡洛方法來擬合我們的隨機波動率模型,並隨后使用五個不同的模型選擇標准(DIC,nWAIC,nIS,iWAIC,iIS)來評估模型。為了檢驗模型擬合算法的可靠性和模型選擇方法的一致性,在使用任何真實數據之前,對模擬數據集做了初步研究。在模擬研究中,總共有100個數據集是由模型6單獨生成的,參數如下:µ = -10,φ = 0.96,τ = 0.345,β = 0.1,κ = 0.08,δ = 0.03。通過數據生成過程,我們既知道真實的模型,也知道模型參數的真實值。因此,我們能夠評估模型擬合方法的優劣,以及模型選擇標准的一致性。
參考文獻
Alder, B. J. and Wainwright, T. (1959), “Studies in molecular dynamics. I. General method,” The Journal of Chemical Physics, 31, 459–466.
Andersen, H. C. (1980), “Molecular dynamics simulations at constant pressure and/or temperature,” The Journal of Chemical Physics, 72, 2384–2393.
Andersen, T. G., Chung, H.-J., and Sørensen, B. E. (1999), “Efficient method of moments estimation of a stochastic volatility model: A Monte Carlo study,” Journal of Econometrics, 91, 61–87.
Andrews, D. F. and Mallows, C. L. (1974), “Scale mixtures of normal distributions,” Journal of the Royal Statistical Society. Series B (Methodological), 36, 99–102.

最受歡迎的見解
1.HAR-RV-J與遞歸神經網絡(RNN)混合模型預測和交易大型股票指數的高頻波動率
2.WinBUGS對多元隨機波動率模型:貝葉斯估計與模型比較
4.R語言ARMA-EGARCH模型、集成預測算法對SPX實際波動率進行預測
