尾部風險建模

07-29

尾部風險建模

來自專欄川流不息47 人贊了文章

寫在前面……

這篇文章寫在 2016 年年底。當時我做量化投資不久，希望從模型的角度學習尾部風險建模，因此這篇文章算是一個學習筆記 + 一些簡單的實證。現如今，經過了近兩年在 A 股和國內商品期貨市場的摸爬滾打（賺了該賺的錢，也虧了該虧的錢），越來越感覺到對於風險而言，所有樣本內的建模都是對樣本外的過擬合，真正的風險是 unknown unknowns。

本文對尾部風險建模的目的是計算諸如風險價值 VaR（給定概率下虧損的閾值 —— 最小值）、或 Expected Shortfall 這類度量風險的指標。關於 VaR 在刻畫風險方面是否有用，知乎上有篇著名的討論：《風險價值（VaR）是否是有史以來最蠢的衡量指標？》，我仔細學習了各位前輩的答案，收穫和感慨頗多。對於我而言，對 VaR 的理解和認識遠沒有各位前輩深刻，但是這篇筆記仍然是一個很好的學習過程，所以我決定還是把它放在專欄里。它記錄了學術界對尾部風險建模的一些努力，有助於我們更好的理解收益率的尖峰肥尾分布，以及市場參與者在試圖理解風險時 —— 哪怕是一點點 —— 面臨的困難。

1 風險控制和尾部建模

2016 年全球金融市場不太平，從英國脫歐到 Trump 當選美國總統再到義大利公投，「黑天鵝」事件頻出，就連美聯儲也跟著添亂，嚷嚷了一年加息、故意擾亂市場對美國經濟數據的解讀。未來兩年，潛在的黑天鵝更是一個接一個。

在這種背景下，風險控制再次回到人們的視線中。在金融領域，風險控制的目的是為了計算極端黑天鵝事件對金融資產造成的潛在損失（負收益率）的可能性以及衝擊的大小。

先來看一個分布。下圖為上證指數在過去 15 年內日收益率的分布。我們計算出日收益率的均值和標準差，便可以得到一個基於該均值和標準差的正態分布。下圖比較了收益率的直方圖和該正態分布。

不難看出，上證指數日收益率的分布表現出明顯的尖峰和肥尾特點，尤其是在負收益率部分。比較日收益率分布和標準正態分布的分點陣圖（下圖），也可以清晰地驗證這個結論。肥尾意味著上證指數實際發生極端收益率（從上圖來看，尤其是極端跌幅）的概率要遠遠大於正態分布對應的概率。換句話說，如果算出收益率的均值和標準差，然後構建一個正態分布來近似描述日收益率分布，這會造成很大的誤差。

除了尖峰、肥尾的特點之外，另一個困擾「黑天鵝建模」的問題是，發生極端虧損（真正的黑天鵝）的歷史樣本太少了。比如說，我們想回答「上證指數每十年一遇的日收益率最大跌幅是多少」這個問題，回看上證指數過去 20 幾年的歷史，我們僅僅有可憐的 2 個樣本點，無法根據它們構建有效的模型。

那麼應該怎麼辦呢？在統計學上，廣義極值分布（Generalized Extreme Value Distribution）可以用來對極端虧損建模。

2 極值建模

假設隨機變數 $X_i$ 代表某投資品的負收益率（虧損），它滿足某未知分布 $F(x) = Pr(X_i ≤ x)$ 。在下文中，我們用負收益率的絕對值代表虧損的大小（即 $X_i$ 的取值為正數）。在這種描述下，當 $X_i$ 的取值在其分布的右尾（right tail）時，便意味著該投資品發生了極端的虧損。

假設不同時間的虧損 $X_i$ 是獨立同分布的，並令 $M_n = max(X_1, cdots, X_n)$ ，即 $M_n$ 是 $n$ 個樣本中最壞的情況。廣義極限分布理論解決的問題就是對 $M_n$ 分布的建模。有了 $M_n$ 的分布，我們就可以回答上面諸如「上證指數每十年一遇的日收益率最大跌幅是多少」的問題。

根據獨立同分布的假設，我們可以寫出 $M_n$ 的 CDF 為：

$mbox{Prob}(M_nle x)=mbox{Prob}(X_1le x,cdots,X_nle x)=prod_{i=1}^n F(x)=F^n(x)$

由於分布 $F$ 是未知的， $F^n$ 自然也是未知的，而經驗分布函數對與 $F^n$ 的估計也是非常差的。但是，我們可以根據 Fisher-Tippet 理論（Fisher and Tippett 1928）來漸進逼近 $F^n$ ，並以此得到 $M_n$ 的分布。特別的，Fisher-Tippet 理論證明，將 $M_n$ 標準化後，即 $Z_n = (M_n – μ_n) / σ_n$ ， $Z_n$ 的分布收斂於形式如下的廣義極限分布：

$H_{xi}(z)=left{ egin{array}{lrl} exp{-(1+xi z)^{-1/xi}}&xi e 0,&1+xi z>0\ exp{-exp{(-z)}}&xi=0,&-inftyle zle infty end{array} ight.$

因此，只要我們有足夠多的原始負收益率樣本數據 $X_i$ ，我們可以用下式求出極端虧損 $M_n$ 的分布：

$mbox{Prob}(M_n<x)approx H_{xi,mu,sigma}left(frac{x-mu_n}{sigma_n} ight)=H_{xi,mu_n,sigma_n}(x)$

在實際使用中，廣義極限分布 $H$ 的參數 $(ξ, μ, σ)$ 可以通過極大似然估計（maximum likelihood estimation）得到。為了估計這些參數，我們必須有足夠多個 $M_n$ 的樣本。為此，我們可以將總長為 $T$ 期的歷史數據等分成單位長度為 $n$ 的 $m$ 個區間。每個區間中的最大虧損便是 $M_n$ 的一個樣本。這樣我們就可以得到 $m$ 個樣本。這樣，便可以根據這些樣本得到廣義極限分布 $H$ 的參數的估計。Embrechts et. al. (1997) 給出了詳細的數學推導。

3 閾值外數據建模

在風險管理中，風險價值（Value at Risk，VaR）是人們常說的一個概念。比如，當我們說 1% 的日收益率的 VaR = 6.8%，它的意思是，我們的目標投資品（或者投資組合）在當天有 1% 的概率可能產生超過 6.8% 的虧損（因此 VaR 的數值是風險的最低值）。在給定的概率下，VaR 越大，投資品的風險越大。

然而，如果想計算 VaR 的大小，上一節中對極值分布的模型並無法發揮作用。這是因為在計算 VaR 時，我們必須對虧損分布的右尾進行建模、而不單單是關注某一個極值（注意，在本文中我們用虧損的絕對值來描述虧損的大小，因此虧損都是正數，所以這裡我們是對分布的右尾建模）。為此，我們可以採用廣義帕累托分布（Generalized Pareto Distribution）。

和上節一樣， $X_i$ 表示某投資品的一系列虧損，並假設它們獨立且滿足某未知分布 $F$ 。同樣的，定義 $M_n = max(X_1, …, X_n)$ 。假設 $u$ 為某一個給定的虧損閾值。在所有這些 $X_i$ 中，我們感興趣的是那些大於 $u$ 的樣本，即那些虧損超過閾值的樣本點，我們希望用它們來對 $X_i$ 分布的右尾進行建模。超過給定閾值的虧損部分，即 $X_i – u> 0$ 的部分，可以由如下條件概率表示：

$F_u(y)=mbox{Prob}(X-ule y|X> u)=frac{F(y+u)-F(u)}{1-F(u)},~~~y>0$

Embrechts et. al. (1997) 證明，如果虧損 $X_i$ 的極值 $M_n$ 收斂於上節介紹的廣義極限分布 $H$ ，那麼存在一個 $u$ 的函數 $β(u)$ ，使得 $X_i – u$ 滿足如下形式的廣義帕累托分布 $G$ ：

$G_{xi,eta(u)}(y)=left{ egin{array}{lrl} 1-(1+xi y/eta(u))^{-1/xi}&mbox{for}&xi e 0\ 1-exp{-y/eta(u)}&mbox{for}&xi=0 end{array} ight.,eta(u)>0$

在實際應用中，如果我們想對 $X_i$ 的右尾建模，只需確定閾值 $u$ 。然後在 $X_i$ 的所有樣本中找出所有大於 $u$ 的樣本（註：我們用 $X_i$ 的絕對值表示虧損的大小，所以虧損在上述數學表達式中是正數），將這些滿足的樣本各自減去 $u$ 後得到超過 $u$ 的部分，然後用這些數據擬合廣義帕累托分布 $G$ ， $G$ 的參數由極大似然估計得到。

廣義帕累托分布 $G$ 的形狀隨著形狀參數 $ξ$ 的不同而不同。特別的，當 $ξ = 0$ 時， $G$ 就化簡為指數分布。我們以過去 15 年上證指數日頻的負收益率樣本為例，取閾值 $u = 2.65\%$ （即考察日收益率虧損超過 2.65% 的尾部分布），得到了 $G$ 的參數。其中形狀參數的取值非常接近 0。下圖為擬合得到帕累托分布和同比例的指數分布對比超額虧損的直方圖的結果。可以看到紅色的帕累托分布和綠色的指數分布非常接近。

此外，我們也可以用超額虧損和標準的指數分布放在一起做分點陣圖，得到的結果如下。結果顯示分點陣圖近似的滿足線性，說明超額虧損的分布和指數分布十分接近。

利用超額虧損對尾部分布建模後，我們便可以方便的求解風險價值。

4 風險價值

上一節曾經說過，風險價值描繪的是投資品在某一個指定的概率下虧損程度的閾值。在我們的定義下（即我們用正數來代表虧損的大小），風險價值就是某一給定概率下虧損 $X_i$ 分布中右尾的某一個分位數。換句話說，只要根據給定的概率求出分位數，它的值就是這個概率對應的風險價值。

因此，通過廣義帕累托分布 $G$ ，我們便可以簡單的推導出風險價值的公式。假設 $1 – q$ 代表我們考慮的概率（比如我們想知道 5% 的概率對應的虧損，那麼 $1 - q = 0.05$ ），則其對應的風險價值為：

$widehat{mbox{VaR}}_q=mu+frac{hateta(u)}{hatxi}left(left(frac{n}{k}(1-q) ight)^{-hat xi}-1 ight)$

其中， $n$ 是虧損樣本的總個數， $u$ 是對應的閾值，可以由 $q = F(u)$ 求出。 $k$ 是超過 $u$ 的虧損樣本的個數。在應用中， $(n-k)/n$ 可以作為對 $F(u)$ 的估計。因此，對於給定的概率 $1 – q$ ，計算風險價值的步驟為：

根據 $q$ 和 $q = (n-k)/n$ 求出 $k$ ；
根據 $k$ 求出 $u$ ，即在所有虧損的樣本中，找到對應的閾值 $u$ ，使得滿足 $X_i$ 大於 $u$ 的個數為 $k$ ；
用上一步找到的 $X_i – u$ 建模，得到廣義帕累托分布；
將參數帶入風險價值的公式中，求出風險價值。

由於風險價值關注的往往是 5% 甚至 1% 的虧損閾值，它們對應的是虧損分布中非常靠尾部的那些樣本，因此只有當 $n$ 足夠大時，我們才可能得到足夠多的超額虧損來建模。可惜的是，在這方面中國 A 股的年份太短了。

即便如此，我們仍然通過下面簡單的實驗來說明如何計算風險價值。這裡我們考慮標普 500 指數（從 1930 年至今）和上證指數（從 2000 年至今）。此外，為了增加樣本個數，我們考慮的風險價值對應的概率為 10%，而非極端的 5% 或者 1%。

對於標普 500，我們用每 15 年的數據來滾動建模，得到日收益率在 10% 概率下的風險價值。作為比較，我們用日收益率均值和標準差對應的正態分布同樣求出 10% 概率下的風險價值。結果如下圖所示。

上圖說明以下幾點：

由於收益率存在明顯的肥尾效應，正態分布嚴重低估了風險價值（綠線持續的在紅線之下）；
在 1929 年股災之後的有一段時間，風險價值都在高位，這是因為計算的樣本中有大量的高虧損樣本；
進入 21 世紀以來，風險價值有兩次明顯的躍升，分別對應著 2000年的 .com 泡沫和 2008 年的次貸危機。

同樣的，我們對上證指數建模。由於數據年份太短，我們用每 10 年的數據來滾動建模。結果如下所示。同樣的，正態分布建模嚴重低估了風險價值。此外，由於上證指數比標普 500 有更加明顯的肥尾，因此正態分布對潛在虧損的低估更加顯著。此外，2010 年到 2015 年股災之前，10% 概率對應的日收益率風險價值並無太大波動；股災之後，風險價值明顯上升。

我們可以用更短的時間（即更少的樣本）對上證指數進行滾動建模。但是樣本少一定會帶來建模的誤差。下圖為我們使用 5 年窗口進行滾動建模的結果。結果表明從 2008 年股災開始後一直到 2014 年，上證指數的風險都非常大（注意，正態分布建模無法很好的描述風險價值的變化，且存在嚴重的低估）。在最近兩年，隨著 2015 年股災和 2016 年 1 月份熔斷引發的二次災害，風險價值出現了兩次迅速的躥升。

5 結語

做投資時，如何強調風險控制都不過分。然而，做好風控的前提就是能用正確的數學手段對其量化。為了控制風險，有人刻意限制倉位，有人「把雞蛋放在不同的籃子里」。然而分散投資不完全等價於分散風險。「把雞蛋放在不同的籃子里」不如「把雞蛋放在一個籃子里，然後看好這個籃子」。從這個意義上說，對虧損的正確建模格外重要。

參考文獻

Embrechts, P. C. Kloppelberg, and T. Mikosch (1997). Modelling Extremal Events.Springer-Verlag, Berlin.
Fisher, R. and L. Tippett (1928). Limiting Forms of the Frequency Distribution of the Largest or Smallest Member of a Sample. Proceedings of the Cambridge Philosophical Society 24, 180-190.

原創不易，請保護版權。如需轉載，請聯繫獲得授權，並註明出處，謝謝。已委託「維權騎士」(維權騎士_免費版權監測/版權保護/版權分發) 為進行維權行動。