原文鏈接:http://tecdat.cn/?p=24182
原文出處:拓端數據部落公眾號
概要
本文用 R 編程語言極值理論 (EVT) 以確定 10 只股票指數的風險價值(和條件 VaR)。使用 Anderson-Darling 檢驗對 10 只股票的組合數據進行正態性檢驗,並使用 Block Maxima 和 Peak-Over-Threshold 的 EVT 方法估計 VaR/CvaR。最后,使用條件異向性 (GARCH) 處理的廣義自回歸來預測未來 20 天后指數的未來值。本文將確定計算風險因素的不同方法對模型結果的影響。
極值理論(最初由Fisher、Tippett和Gnedenko提出)表明,獨立同分布(iid)變量樣本的分塊最大值的分布會收斂到三個極值分布之一。
最近,統計學家對極端值建模的興趣又有了新的變化。極限值分析已被證明在各種風險因素的案例中很有用。在1999年至2008年的金融市場動盪之后,極值分析獲得了有效性,與之前的風險價值分析不同。極限值代表一個系統的極端波動。極限值分析提供了對極端事件的概率、規模和保護成本的關系進行建模的能力。
參考
https://arxiv.org/pdf/1310.3222.pdf
https://www.ma.utexas.edu/mp_arc/c/11/11-33.pdf
http://evt2013.weebly.com/uploads/1/2/6/9/12699923/penalva.pdf
Risk Measurement in Commodities Markets Using Conditional Extreme Value Theory
第 1a 部分 - 工作目錄、所需的包和會話信息
為了開始分析,工作目錄被設置為包含股票行情的文件夾。然后,安裝所需的 R 編程語言包並包含在包庫中。R 包包括極值理論函數、VaR 函數、時間序列分析、定量交易分析、回歸分析、繪圖和 html 格式的包。
-
library(ggplot2)
-
library(tseries)
-
library(vars)
-
library(evd)
-
library(POT)
-
library(rugarch)
-
第 1b 節 - 格式化專有數據
用於此分析的第一個文件是“Data_CSV.csv”。該文件包含在 DAX 證券交易所上市的 15 家公司的股票代碼數據,以及 DAX 交易所的市場投資組合數據。從這個數據文件中選出了 10 家公司,這些公司最近十年的股價信息是從谷歌財經下載的。
第 1c 節 - 下載股票代碼數據
股票價格數據下載並讀入 R 編程環境。收益率是用“開盤價/收盤價 ”計算的,十家公司的數據合並在一個數據框中,(每家公司一列)。
結果數據幀的每一行代表記錄股價的 10 年中的一個工作日。然后計算數據幀中每一行的均值。一列 10 年的日期被附加到數據框。還創建了僅包含行均值和日期信息的第二個數據框。
-
alDat <- cbind(retursDaa, returnDta_A,
-
retrnsata_Ss, reunsataDB,
-
retunsDta_H, reurnsDta_S, rtunsDaaA,
-
retrnsaa_senus,reursDtaAlnz,
-
reurnsData_ailer)
第 2a 節 - 探索性數據分析
創建一個數據框統計表,其中包含每列(或公司)的最小值、中值、平均值、最大值、標准偏差、1% 分位數、5% 分位數、95% 分位數、99% 分位數。分位數百分比適用於極值。還創建了所有收益率均值的時間序列圖表。
-
-
taeSs<- c(min(x), medan(x), man(x),
-
max(x), sd(x), quntile(x, .01),
-
quanile(x, .05), qunile(x, .95),
-
quatile(x, .99), lngth(x))
-
-
第 2b 節 - 10 只股票指數的 VaR 估計
-
all_va.2 <- VAR(lDvarts, p = 2, tpe= "cnst")
-
-
# 預測未來125天、250天和500天
-
aDFva100 <- pdc(alDva.c, n.aea = 100, ci = 0.9)
為了開始估算數據所隱含的未來事件,我們進行了初步的風險值估算。首先,所有行的平均值和日期信息的數據框架被轉換為時間序列格式,然后從這個時間序列中計算出風險值。根據VaR計算對未來100天和500天的價值進行預測。在隨后的預測圖中,藍色圓圈代表未來100天的數值,紅色圓圈代表500天的回報值。
-
plot(ap0$t$Tme[1:1200],
-
alF_ar.d.$fst[1:1200])
第 2c 部分 - 估計期望shortfall(ES),條件VAR(CvaR) 10 股票指數
為便於比較,計算了10只股票指數數據的條件風險值(CvaR或估計虧損)。首先,利用數據的時間序列,找到最差的0.95%的跌幅的最大值。然后,通過 "高斯 "方法計算出估計虧損,這兩種計算的結果都以表格形式呈現。
ES(s(lD1:2528, 2, rp=FAE]),p=0.95, mho="gausn")
第 2d 節 - 10 只股票指數的希爾Hill估計
由於假設10股指數數據為重尾分布,數據極少變化,所以采用Hill Estimation對尾指數進行參數估計。目的是驗證 10 只股票數據是否為極值分布。Hill Estimation 生成的圖證實了。
-
hil(orvtis, otio="x", trt=15, nd=45)
-
第 2e 節 - 正態分布的 Anderson-Darling 檢驗
Anderson-Darling 檢驗主要用於分布族,是分布非正態性的決定因素。在樣本量較大的情況下(如在 10 股指數中),小於 0.05 的 P 值表明分布與正態性不同。這是極值分布的預期。使用 Anderson-Darling 檢驗發現的概率值為 3.7^-24,因此證實了非正態性。
第 2f 節 - 結果表
最后,給出了10個股票指數未來價值的估計結果表。3 個 VaR 估計值(和估計差額)的點估計值和范圍被制成表格以比較。
-
-
VaRES[3,] <- c("ES", etFbl[1], 4)
-
eSFbe[2], estFtbl[3],
-
rond(eSab[4], 4))
第 3a 節 - 10 個股票指數的 EVT 分塊最大值估計
極值理論中的 Block Maxima 方法是 EVT 分析的最基本方法。Block Maxima 包括將觀察期划分為相同大小的不重疊的時期,並將注意力限制在每個時期的最大觀察值上。創建的觀察遵循吸引條件的域,近似於極值分布。然后將極值分布的參數統計方法應用於這些觀察。
極值理論家開發了廣義極值分布。GEV 包含一系列連續概率分布,即 Gumbel、Frechet 和 Weibull 分布(也稱為 I、II 和 III 型極值分布)。
在以下 EVT Block Maxima 分析中,10 股指數數據擬合 GEV。繪制得到的分布。創建時間序列圖以定位時間軸上的極端事件,從 2006 年到 2016 年。然后創建四個按 Block Maxima 數據順序排列的圖。最后,根據 gev() 函數創建 Block Maxima 分析參數表。
-
gev(ltMeans, x=0.8, m=0)
-
-
-
plt(alVF)
-
第 3b 節 - 分塊最大值的 VaR 預測
為了從 Block Maxima 數據中創建風險價值 (VaR) 估計,將 10 股指數 GEV 數據轉換為時間序列。VaR 估計是根據 GEV 時間序列數據進行的。未來值的預測(未來 100 天和 500 天)是從 VaR 數據推斷出來的。在結果圖中,藍色圓圈表示未來 100 天的值,紅色圓圈表示 500 天的收益率值。
-
-
# 預測未來500天
-
aGE500<- preit(aG_va.c, n.ad = 500, ci = 0.9)
-
-
plot(aGE500pd.500)
第 3c 部分 - 分塊最大值的期望損失ES (CvaR)
10只股票指數GEV數據的條件風險值("CvaR "或 "期望損失")被計算。首先,利用數據的時間序列,找到最差的0.95%的縮水的最大值。然后,通過極端分布的 "修正 "方法來計算 "估計虧損",這兩種計算的結果都以表格形式呈現。
-
# 條件縮減是最差的0.95%縮減的平均值
-
ddGV <- xdrow(aEVts[,2])
-
# CvaR(預期虧損)估計值
-
CvaR(ts(alE), p=0.95, meho="miie")
第 3d 節 - 分塊極大值的 Hill 估計
希爾估計(用於尾部指數的參數估計)驗證 10 只股票的 GEV 數據是極值分布。
第 3e 節 - 正態分布的 Anderson-Darling 檢驗
Anderson-Darling 檢驗是確定大樣本數量分布的非正態性的有力決定因素。如果 P 值小於 0.05,則分布與正態性不同。通過該測試發現了一個微小的概率值 3.7^-24。
第 3f 節 - 結果表
最后,給出了對 10 股指數 GEV 未來價值的估計結果表。3 個 GEV VaR 估計值(和 GEV 期望損失)的點估計值和范圍制成表格比較。
-
G_t[3,] <- c("GEV ES",sFale[1],
-
sStble[2], SEble[3],
-
"NA")
-
GRst
第 3g 節 - 分塊極大值的 100 天 GARCH 預測
通過將 Block Maxima GEV 分布(10 只股票的指數)擬合到 GARCH(1,1)(廣義自回歸條件異型)模型,對 Block Maxima EVT 數據進行預測。顯示預測公式參數表。創建一個“自相關函數”(ACF) 圖,顯示隨時間變化的重要事件。然后,顯示擬合模型結果的一組圖。創建對未來 20 天(股票指數表現)的預測。最后,20 天的預測顯示在 2 個圖中。
-
spec(aanc.ol = list(mel = 'eGARCH',
-
garer= c(1, 1)),
-
dirion = 'sd')
-
-
# 用廣義自回歸條件異質性擬合模型
-
alimol = ugct(pec,allV, sovr = 'ybi')
-
-
cofale <- dtafe(cof(litol))
-
oeBal
-
-
plt(l.itodl)
第 4a 節 - 峰值超過閾值估計 - 10 個股票指數
在 EVT 中的峰值超過閾值方法中,選擇超過某個高閾值的初始觀測值。這些選定觀測值的概率分布近似為廣義帕累托分布。通過擬合廣義帕累托分布來創建最大似然估計 (mle)。MLE 統計數據以表格形式呈現。然后通過 MLE 繪圖以圖形方式診斷所得估計值。
plot(Dseans, u.rg=c(0.3, 0.35))
第 4b 節 - POT 的 VaR 預測
POT 數據的風險價值 (VaR) 估計是通過將 10 個股票指數 MLE 數據轉換為時間序列來創建的。VaR 估計是根據 MLE 時間序列數據進行的。未來值的預測(未來 100 天和 500 天)是從 MLE VaR 數據推斷出來的。在結果圖中,藍色圓圈表示未來 100 天的值,紅色圓圈表示 500 天的收益值。
-
VAR(merts, p = 2, tp = "cost")
-
-
# 預測未來125天、250天和500天
-
mle_r.pd <- prect(e.ar, n.ahad = 100, ci = 0.9)
-
-
-
plot(mea.prd)
第 4c 部分 - POT 的期望損失ES (CvaR) 預測
然后計算10只股票指數MLE數據的條件風險值("CvaR "或 "期望損失ES")。數據的時間序列被用來尋找最差的0.95%的跌幅的最大值。通過極端分布的 "修正 "方法,計算出 "期望損失ES",兩種計算的結果都以表格形式呈現。
-
# 最差的0.95%最大回撤的平均值
-
mdM <- maxdadw(mlvs[,2])
-
-
CvaR(ldaa), p=0.95, meto="mdii",
-
pimeod = "comnen", weghts)
第 4d 節 - 峰值超過閾值的 Hill 估計
Hill 估計(用於尾部指數的參數估計)驗證 10 只股票的 MLE 數據是一個極值分布。
第 4e 節 - 正態分布的 Anderson-Darling 檢驗
Anderson-Darling 檢驗是確定大樣本數量分布的非正態性的有力決定因素。如果 P 值小於 0.05,則分布與正態性不同。此測試的結果 P 值為 3.7^-24。
第 4f 節 - 結果表
最后,給出了 10 個股票指數 MLE 未來價值的估計結果表。3 個 MLE VaR 估計值(和 MLE 期望損失ES)的點估計值和范圍被制成表格來比較。
第 4g 節 - 峰值超過閾值的 100 天 GARCH 預測
通過將 MLE(10 只股票指數的最大似然估計)擬合到 GARCH(1,1)(廣義自回歸條件異型性)模型,對峰值超過閾值 EVT 數據進行預測。顯示預測公式參數表。創建了一個“自相關函數”(ACF)圖,顯示了隨時間變化的重要事件。然后,顯示擬合模型結果的一組圖。然后創建對接下來 20 天(股票指數表現)的預測。最后,20 天的預測(來自峰值超過閾值 EVT extimation)顯示在 2 個圖中。
-
fit(ec,ta, slvr = 'hybrid')
-
-
-
-
plot(pot.fite.ol)
第 5a 節 - 估計方法影響表
下表匯總了檢驗 極值分布的 10 個股票的四種方法的結果。第一列包含四種估計方法的名稱。提供了 VaR、ES、mu統計量和 Anderson-Darling P 值的統計量。
-
c("VaR",
-
round(mean(cofets),4),
-
"NA", "NA", p.vau)
-
c("Block Maxm", round(mean(coffies),4),
-
MES, pr.ss[3],.vle)
-
-
c("POT",
-
round(mean(cofies), 4),
-
MES, fitdaes, p.ale)
-
第 5b 節 - 結論
在對 10 家公司(在 DAX 證券交易所上市)的 10 年股票收益率進行檢查后,確認將收益率百分比的變化表征為極值分布的有效性。四種分析方法的擬合值的所有 Anderson-Darling 檢驗都顯示分布具有正態性或所有非極值值的概率不顯着。這些方法在收益數據中的風險價值方面是一致的。Block Maxima 方法會產生 VaR 估計的輕微偏差。傳統的 VaR 估計和 POT 估計產生相同的風險價值。與股票收益率數據的傳統 CvaR 估計相比,這 2 種 EVT 方法預測的預期缺口較低。標准 QQ 圖表明峰值超過閾值是最可靠的估計方法,
在對10家公司(在德國DAX證券交易所上市)10年的股票收益率進行檢查后,證實了將收益率變化定性為極值分布的有效性。對四種分析方法的擬合值進行的所有安德森-達林測試顯示,分布具有正態性或所有非極值的概率不大。這些方法在收益數據的風險值方面是一致的。分塊最大值方法產生了一個風險值估計的偏差。傳統的VaR估計和POT估計產生相同的風險值。相對於傳統的股票收益率數據的CvaR估計,兩種EVT方法預測的期望損失較低。標准Q-Q圖表明,在10只股票的指數中,Peaks-Over-Threshold是最可靠的估計方法。
最受歡迎的見解
1.R語言基於ARMA-GARCH-VaR模型擬合和預測實證研究