均值-方差模型實踐


介紹

均值方差模型是由H.M.Markowitz哈里·馬科維茨)在1952年提出的風險度量模型,這是現代資產配置的起點。馬科維茨把風險定義為期望收益率波動率,首次將數理統計的方法應用到投資組合選擇的研究中。這種模型方法使相互制約的目標能夠達到最佳的平衡效果。其最有名的應用者是耶魯大學校友捐贈基金主理人斯文森。

      

耶魯大學教育基金的資產數量及配置變化

前摩根史丹利投資管理公司董事長巴頓·M·畢格斯(Barton M. Biggs)說:世界上只有兩位真正偉大的投資者,他們是斯文森和巴菲特。

其中斯文森是耶魯大學的校友捐贈基金的主理人,《機構投資的創新之路》就是他主筆的書。1985年斯文森回到耶魯接管捐贈基金之后,到2019年,該基金的資產從10億美元增長到了303億美元,接近30倍,而這是在基金不斷為大學提供開支的情況下做到的。要知道,在耶魯大學的支出逐漸提升的情況下,1985年教育基金僅提供耶魯大學10%的開支,而在《機構投資的創新之路》出版時,教育基金提供了耶魯大學45%的開支。

斯文森的業績如此優秀,來自於他自己開創的耶魯模式,從圖中可以看到,相比於巴菲特的集中式持股,斯文森主要依賴於分散化的資產配置。從《機構投資的創新之路》中可以讀到,其主要原理是改善后的均值-方差模型。接下來我們來詳細講述一下均值-方差模型。

 方法詳述

均值-方差模型的基本假設

1、投資者在考慮每一次投資選擇時,其依據是某一持倉時間內的證券收益的概率分布。

2、投資者是根據證券的期望收益率估測證券組合的風險。

3、投資者的決定僅僅是依據證券的風險和收益。

4、在一定的風險水平上,投資者期望收益最大;相對應的是在一定的收益水平上,投資者希望風險最小。

* 作者備注:第1點中提到的概率分布模型一般使用的是正態分布,那么后續234中提到的期望收益率就是收益的期望值(均值),風險就是方差。而正態分布可以完全用均值和方差兩個參數表征,有利於模型的解析。實際上資產們的收益分布不完全符合正態分布,這是該方法的一個bug

均值-方差模型的構建過程

根據上述基本假設的第四點,抽象出數學模型表達為:

收益最大化:

  

風險最小化:

  

根據上述作者備注,假設R1RN都符合正態分布,進一步假設U(.)是常見的凹函數。

跳過一系列解方程的過程,這是一個二次規划問題,最后解的形式為:

其中

  

其中

 

 

 

 期望收益率與收益率標准差

上述有效邊界圖形指出:單個資產或組合資產的期望收益率由風險測度指標標准差來決定;風險越大收益率越高;風險越小收益率越低。風險對收益的決定是非線性(二次)的雙曲線形式,這一結論是基於投資者為風險規避型這一假設進行的。

相關性的定性分析方法

確定相關系數的難度非常大,從不同經濟環境下債券和股票收益之間的相關性中便可見一斑,在正常情況下,債券收益與股票收益之間呈現出高度的爭先管關系。利率下降時,由於債券價格和收益率之間呈相反關系,債券價格將會上升。利率下降時,由於投資者用更低的折現率對未來收入的現金流進行折現,股票價格也將會上升。由於正常情況下,股票與債券之間呈現出高度的正相關關系,因此投資組合難以達到分散化的效果。

當發生超預期的通貨膨脹時,債券投資者將會遭受損失。物價上漲侵蝕了債券支付的固定本息的購買力,導致投資者推低債券價格。對股票而言,盡管通貨膨脹短期內可能產生負面影響,但是長期看來,其影響是正面的。可能發生超預期的通貨膨脹時,股票和債券的長期相關系數很低,這樣可以使組合達到充分的分散化效果。

在通貨緊縮的環境中,由於經濟不景氣導致企業盈利下降,股票的表現非常糟糕,相比之下,隨着物價水平下降,債券支付的固定本息顯得更具吸引力,因此債券的收益相當可觀。可見在通貨緊縮時期,由於股票和債券之間的相關性很低甚至為負,投資組合可以達到分散化的效果。

在符合預期和超預期的通脹環境中,股票收益和債券收益的表現存在根本性區別,這對財務建模者而言無疑是一個謎團,就是是采用通脹符合預期時股票和債券之間的相關系數呢,還是采用通脹超預期時的相關系數呢?前者不能達到分散化的目的,后者可以。導致這一問題更加復雜化的是,通常投資者更關心的是,在未預期的環境中(通常是通貨緊縮)債券的分散化功能。

優缺點

復雜性問題

從上述數學模型可以看出,這個二次規划問題相對較為復雜,基本需要編程解決計算問題。在應用時需要依據多個完美假設前提(正態分布假設、有效市場等);關於風險、收益、相關性等的評估也需要一定的經驗,僅依賴歷史數據的應用效果不盡如人意。

斯文森(關於優缺點的論斷)

將均值-方差最優化分析和對未來的模擬檢驗結合起來得出的組合仍受到諸多限制,組合的效果取決於對未來收益、風險和協方差的假設。雖然預測的收益不可能完全正確,但是上述方法的作用是它能夠對各種變量之間的相互關系進行評估。如果只有收益和風險假設的正確度是上述分析方法中的最大障礙,那么所得結論仍然具有較強的說服力。

更嚴重的問題是,資產類別的風險和各類資產之間的相關性不穩定。發生危機時,各類風險資產市場傾向於同向變動,這在短期里降低了分散化投資的價值。由於證券收益的分布特征不完全符合正態分布,資產類別之間的關系也不穩定,因此,資產配置過程中運用定量分析模型時面臨嚴峻的挑戰,但是,與其他不甚嚴密的組合構建方法相比,定量分析更加嚴謹。

國內市場適應性問題

關於資產配置在國內市場是否適用,曾經有一波非常大的討論,甚至到現在還是層出不窮。

從歷史數據看,中國在2008年以后,房地產的收益高、風險幾乎沒有;歷史上股票已經44次在3000點上下爬來爬去了,那么按照資產配置模型,由於房地產的期望值高、方差小,經過量化計算,我們是不是應該從此滿配房產呢?很顯然,歷史數據並不那么可信。

我調研了三篇文章(照道理應該看更多內容,但是實際上大同小異,結論也相差不遠),關於資產配置是否適合在國內市場使用,分別是2008年同濟大學的一篇博士論文,2016年的一篇自然科學基金面上項目論文和一篇2014年收益數據實證的論文。

先看一下三篇的結論。

全球化資產配置的過程中,提升投資績效或改善資產組合的風險收益特性的最根本的方法是充分的分散化,包括市場分散化、行業分散化、資產種類分散化以及幣種分散化等。

我們使用中國股票市場數據構建四個投資組合類別,來檢驗10種資產配置策略在中國市場的業績表現。結果發現,在中國市場,參數不確定性的存在確實顯著地影響了均值方差模型的有效性,導致了很差的模型業績表現。……並沒有任何一個最優化策略能夠在統計上優於簡單多樣化策略。

本文研究對比了16個投資組合模型在我國資本市場的表現,研究結果表明,盡管不同的投資組合模型都有改善估計誤差的作用,但由於在我國資本市場中估計誤差較大,致使不同投資組合模型都有改善估計誤差的作用,但由於在我國資本市場中估計誤差的改善效果有限 ,導致各配置模型表現甚至不及簡單的等權重模型。

其他可參考結論摘要:

低收益率伴隨高相關性體現在不同市場和不同行業間,商品資產與股票資產間存在收益率和相關性的同向發展,因此加入商品資產對資產配置有一定的收益改善作用

中國市場中的各類資產的相關性相對較高,增加資產種類帶來的收益無法超過其帶來的預測誤差、交易成本等負面影響;而全球市場中各行業的相關性略低於各主要證券市場之間的相關性,因此采取行業分散原則,略優於采用市場分散原則,因此中國市場指數+全球行業指數的組合模式具有相對較高的投資績效

“2004年到2014年數據,收益相關性研究顯示,國內股票市場短期收益主要受到香港股票市場和日本股票市場的影響,而從中長期看主要受香港股票市場、美國股票市場和英國股票市場的影響。波動相關性研究顯示,國內股票市場短期波動主要受到香港股票市場的影響,中長期波動則同時與香港股票市場、日本股票市場、美國股票市場和英國股票市場保持較高相關性。波動方向上中國股票市場與香港股票市場同步。中期尺度上(8天和16天),日本、美國和英國股票市場與國內股票市場之間存在明顯的波動溢出特征,波動領先的時差約3天。

中國市場的金融、公用事業、石油天然氣與國際市場的行業相關性較高

工具、回測方法及結果

數據來源

Wind 金融終端(公司才能用)

集思錄(有比較全面的ETF\QDII\LOF等的實時數據,歷史數據時間不長約3個月)

且慢(有一些比較簡單的數據)

雪球(可以找到一些綜合性數據的時間片段)

大眾寬客(公眾號,有一些ETF的相關性數據)

老羅話指數投資(可以看到部分來自wind的數據)

macroaxis https://www.macroaxis.com/invest/toolSummary(求人不如求己,這種相關性的事情肯定有人做了嘛,國外市場看這里)

python上面有很多相關的數據導入方法 https://pandas-datareader.readthedocs.io

上述數據中,除了Wind金融終端外,很難找到連續的足夠多年的直接數據用於MV模型的分析。直接數據指的是基金每天的價格、變化幅度等。Wind上甚至能直接獲得ETF的均值和方差等數據。

 

類似這樣的相關性圖可以從多個源找到

 

 

綜合以上表格和前述各類結論,結合我們可以購買的資產類型,參考斯文森的6類資產配置,

資產名稱

與滬市相關性

預期通脹場景

超預期通脹場景

通縮場景

滬深300/中證500

1

——

——

——

標普500/納斯達克等

0.4

基本與標准行同向相關,但相關性比較低

基本同向相關,可能會發生風險溢出,長期來看通脹對股票市場是利好

可能會發生風險溢出,導致相關性反而增加

華寶油氣/南方石油等

0.32

與石油開采情況有關,未知與標准行是否同向相關

油氣等資源類物料價格加速上漲,短期內與標准行非同向相關,長期可能同向

油氣等資源類物料價格加速下跌,與標准行同向相關,不應該用於分散風險,因為物料風險更大

日本

0.35

基本同向相關,但相關性較低,由於市場不同,可以用於分散風險

基本同向相關,但相關性較低,由於市場不同,可以用於分散風險

考慮到風險溢出,可能會發生同向相關,但日本市場經常作為避險市場,所以短期內可以用於分散風險

德國30

0.57

基本同向相關,但相關性較低,由於市場不同,可以用於分散風險

基本同向相關,但相關性較低,由於市場不同,可以用於分散風險

考慮到風險溢出,可能會發生同向相關,相比日本市場與美國市場相關性更加高,是發達市場中制造業含量比較高的指數,與經濟相關非常高,不建議用於分散風險

美國REIT

未知

作為房產租賃行業,與經濟景氣程度非常相關,與標准行可能是同向相關,由於市場不同可以用於分散風險,風險介於股市和債券之間

房產類資源在超預期場景下,應該是短期非同向

房價在通縮場景下應該會下跌,沒人租賃房產,與經濟相關度非常高,不建議用於分散風險

亞洲美元債

未知

由於是美元資源,可以對沖人民幣資產貶值的情況

由於是美元資源,可以對沖人民幣資產貶值的情況

通縮場景下的債券應該會比較好,但是亞洲美元債以新興國家為主,可能會發生無法償債的情況,也需要考慮配置一些別的地區的美元債

純債/理財

-0.25

同向

導致收益下降

可用於分散風險

黃金

-0.04

黃金資產從長期看沒有投資價值

黃金資產從長期看沒有投資價值

通縮場景可以用於分散風險

恆生指數

0.56

與滬深300等國內股票市場較強相關,不適合分散風險,但滬深300長期存在溢價,可以考慮在溢價比較大的情況下,購買部分

與滬深300等國內股票市場較強相關,不適合分散風險,但滬深300長期存在溢價,可以考慮在溢價比較大的情況下,購買部分

與滬深300等國內股票市場較強相關,不適合分散風險,但滬深300長期存在溢價,可以考慮在溢價比較大的情況下,購買部分

MV模型的python實現

Pandas庫提供了專門從財經網站獲取金融數據的API接口,可作為量化交易股票數據獲取的另一種途徑,該接口在urllib3庫基礎上實現了以客戶端身份訪問網站的股票數據。需要注意的是目前模塊已經遷徙到pandas-datareader包中,因此導入模塊時需要由import pandas.io.data as web更改為import pandas_datareader.data as web

通過參考GitHub上的代碼,參考個人可買的類目。

稍微修改過的代碼參考:MVmodel_done.py 

 各類目相對起始點的收益情況

 

 

各類目相關性

 

 

期望收益與收益率方差

由於我的目標是期望收益大於10%,方差小於10%。從中選擇出一系列的weights,也就是投資類目的權重,參考accept_weights.csvaccept_weights的描述參考下圖。 

從中選擇出收益最高的一行如下:

Returns

Volatility

Sharpe Ratio

510300.SS Weight

510500.SS Weight

^GSPC Weight

^IXIC Weight

DAX Weight

^N225 Weight

511010.SS Weight

^HSI Weight

518880.SS Weight

0.11

0.10

1.09

0.15

0.02

0.11

0.27

0.00

0.22

0.04

0.03

0.16

回測(MV模型、簡單分散、漫步華爾街分散方案)

時間軸拉長看,獲取從2008年到2019年的數據。

 

 

 

 

從圖中可以看出,跑的最好的是美國股市,相比簡單分散和華爾街配置,我們算出來的居然還是強行跑贏了。 

 

2005年開始的數據,看到08年的凹陷了嗎,可怕,風險溢出,所有資產對半折。

 

這次終於有點輸了,在收益上看的。

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM