- 1 -
基于极值理论的股市风险度量
摘 要:VaR 作为金融风险管理的基础工具,目前有许多不同的计算方法,而且由不同方
法得到的 VaR 值往往相差很大.本文介绍了极值理论的超阈值模型,并对风险度量的新方
法——CVaR进行了介绍.最后以上证指数为例,将极值理论应用于风险价值的计算,并将
所得结果与几种典型的度量方法相比较,实证结果表明:基于广义帕累托分布的 VaR 模型
更准确地反映了我国股市的风险.同时,由极值理论得到的 CVaR 可在 VaR估计失效的交
易日里有效地覆盖风险,起到对风险实行“双限”监管的作用.模型的诊断结果进一步表明,
极值理论是测量极端市场条件下风险损失的一种有效方法,可以准确的描述分布尾部的分位
数,较适合于研究具有“厚尾”特征的金融资产收益率序列.
关键词:VaR;CVaR;极值理论;阈值
中图分类号:
1. 引言
近年来,VaR 和 CVaR 已经成为金融市场风险度量的主流方法,而对它们进行准确估
计一直是风险管理实务人员和理论工作者面临的现实挑战.大量的实证研究表明,金融资产
收益分布明显偏离正态分布,且呈现一种“厚尾”特性,而在风险管理中,收益分布的尾部恰
恰是风险管理者关注的高收益区域和高亏损区域.因此,更客观地描述资产收益的分布函数,
尤其是损失分布函数,成为精确度量风险的关键问题.基于传统的方差-协方差法、历史模
拟法、蒙特卡洛模拟法在估计金融资产收益率的 VaR 值上的低效[1],本文考虑金融时间序
列的“厚尾”特性,基于我国上证指数的收盘价,采用极值理论中的阈值模型来计算 VaR,并
将所得结果与传统方法进行比较.
2. 极值理论和阈值模型
VaR 和 CVaR
风险价值(Value at Risk,简称 VaR)通常被定义为“在未来一定时期内和给定的置信水
平下,在正常市场条件下,某一金融资产或证券组合可能遭受的最大损失”.其数学表达式
为
Pr( ) 1X VaR p> = − (1)
其中,X 为某项资产或证券组合的损失,VaR 为置信水平 p下的风险价值.
VaR 技术作为国际金融业的行业标准,其优势是明显的,它在考虑损失事件发生的可
能性的同时,也估测了潜在的损失大小.但同时一些文献指出 VaR 只考虑了分位点,对分
位点以外的损失并没有给出数量描述(仅仅有一个概率描述),并且在数学上 VaR 不满足
次可加性(sub-additive),这意味着用 VaR 度量的某一证券组合的风险可能比它的各组成成分
单独风险的和还要大,因而不能用 VaR 对投资组合进行优化,而 CVaR 弥补了这些缺陷.
CVaR 是指在损失超过 VaR 时的条件期望值,也称 ES[2](expected shortfall).设 X 是一
个随机变量,代表给定的资产损失,VaR( )X 代表在给定的时间内和置信水平 p下的风险
值,则
( ) [ | ( )]CVaR X E X X VaR X= > (2)
- 2 -
从上式看出,与 VaR 相比,CVaR 更适合于揭示尾部风险的极端情形.不过,由于 CVaR
是在 VaR 概念基础上衍生出来的,故精确度量 VaR 是精确度量 CVaR 的前提.
极值理论
通常有两类估测 VaR 的极值模型[3],即 BMM 模型(block maxima model)与 POT 模
型.BMM 模型是一种传统的极值分析方法,主要用于处理具有明显季节性数据的极值问题
上,POT 模型是一种新型的模型,主要是对观察值中所有超过某一较大门限值(threshold)
的数据建模,由于它有效地使用了有限的极端观察值,是现在经常使用的一类极值模型.在
POT 模型中,又分为两种不同的分析方法,即围绕 Hill 估计量展开的半参数模型与基于广
义帕累托分布的参数模型.本文运用基于广义帕累托分布的参数模型.
设 1 2, , , nx x xL 为股指的收益序列,其分布函数为 F,通常我们感兴趣的是投资损失
超出某一阈值 u 的情形,即分布的左尾.定义损失超出某一给定阈值 u 的极端分布函数
( ) Pr{ | }uF y X u y X u= − ≤ > (3)
其中 X u− 为超量损失.对超量分布存在如下极限定理[4]:对一大类(几乎包含所有常用的
分布)损失分布函数(3),存在函数 ( )uσ ,使得:
( ) ( )
, ( )
0
lim sup | ( ) ( ) | 0
n n
u uu x y x u
F y G yξ σ→ ≤ ≤ −
− = (4)
其中G ( )yξ σ, (u) 为某一广义帕累托分布(GPD)
1/
,
1 (1 / ) 0
G ( )
1 exp( / ) 0
x
x
x
ξ
ξ σ
ξ σ ξ
σ ξ
−⎧ − + ≠= ⎨ − − =⎩
(5)
这里ξ 为形状参数,其倒数1 / ξ 即为尾部指数, 0σ > 为尺度参数, ( ) max( )nx x= .不
同的ξ ,GPD 分布函数的尾部不一样,本文关注当 0ξ > 时 ,G ( )xξ σ 所对应的适合金融时
间序列研究的厚尾分布函数.
极值理论的 VaR 和 CVaR
根据乘法公式,由(3)式得
( ) ( )( )
1 ( )u
F y u F uF y
F u
+ −= − (6)
依据(4)式,当阈值 u 逐渐增大时,超越分布 F 收敛于广义帕累托分布,即当 nu x→ 时,
,( ) ( )uF y G yξ σ= ,由此及(6)式有
,( ) (1 ( )) ( ) ( )F x F u G x u F uξ σ= − − + (7)
上式中 x u y u= + > .当阈值 u 足够大时, ( )F u 在阈值处的估计值近似等于
( ) /un n n− , un 是超越值的个数,n是样本数.这样 ( )F x 可以表示为
ˆ1/ˆFˆ( ) 1 (1 )
ˆ
un x ux
n
ξξ σ
−−= − + (8)
其中ξˆ 和σˆ 分别为ξ 和σ 的极大似然估计值.由于 VaR 是在给定置信水平下的最大损失,
- 3 -
因而我们可以通过求分布函数 ˆ ( )F x 的反函数得到 VaR 值.给定概率水平 p条件下(8)式的
转化形式为
(( ) 1)p
u
nVaR u p
n
ξσ
ξ
−= + − (9)
由此 CVaR 的估计值为
( | )p p p pCVaR VaR E X VaR X VaR= + − > (10)
其中 ( | )p pE X VaR X VaR− > 称为给定阈值 pVaR 的超额均值函数 (mean excess
function),当 1ξ < 时,GPD 的超额均值函数为
( ) ( | ) 0
1
ze z E X z X z zσ ξ σ ξξ
+= − > = + >− , (11)
根据相关极值理论, pz VaR u= − ,则
( )
1 1 1
p p
p p
VaR u VaR uCVaR VaR
σ ξ σ ξ
ξ ξ ξ
+ − −= + = +− − − (12)
阈值的选取及参数估计
采用极值分布计算 VaR 时,需要估计参数 , ,u ξ σ ,而选取适当的阈值u是正确估计ξ
和σ的基础.根据 Pickands[5]和 Balkema、Haan[6]的研究,只有在u取足够大时条件超越极
值分布函数F ( )u y 才近似逼近 GPD,但是较高的阈值u必然导致较小的极值样本空间,必
将影响参数估计的精确度.因此,如何选择合适的阈值u是问题求解的一个关键所在,对于
这一问题,本文试图根据平均剩余寿命函数的性质结合平均剩余寿命函数图进行选择.
当广义 Pareto 分布可以作为阈值 0u 的超过量的有效近似时,对于一个更大的阈值u的
超过量也服从 GPD,且两者的形状参数ξ 相同,尺度参数有如下关系
0 0
( )u u u uσ σ ξ= + − (13)
则有:
0 0( )( ) ( | ) , 1
1 1
uu
u u
e u E X u X u
σ ξσ ξξ ξ
+ −= − > = = <− − (14)
因此对于 0u u> , ( )e u 是关于u的线性函数.设 (1) (2) ( ), , , unx x xL 为超越阈值u的 un
个样本点,作 ( ) max
1
{( , ( ) / ),0 }
un
i u
i
u x u n u x
=
− ≤ ≤∑ 的散点图,这里 un 表示超出量的个
数,由这些点构成的图称为平均剩余寿命图(mean residual life plot).当 GPD 可以作为阈值 0u
的超出量的有效近似时,图形中大于 0u 的部分应近似线性.
观察参数的稳定性,若令 u uσ σ ξ= −% ,由(13)式可知σ% 与u无关,称为修正的尺度参
数(modified scale).因此,若 0u 是适当的阈值,则对大于 0u 的u,σ% 和ξ 保持不变.
- 4 -
对应于样本 1 2 3{ , , , }Y y y y= L 的广义 Pareto 分布的对数似然函数表达式为
1
ln ( , | ) log (1 1/ ) log(1 ), 0
n
i
i
L y n yξξ σ σ ξ ξσ== − − + + ≠∑ (15)
其中 Y=X-u ,X 是原始样本,即 ( ) ( ) ( ){ | 0}i i ix x x u∈ − > ,可以利用数值算法解得极大似
然估计σˆ 和ξˆ .
3.实证分析
本文运用上述相关理论对股票指数收益进行实证分析,探讨与尾部相关的风险.实证部
分所涉及到的数据取自“同花顺”软件,包括上海证交所 2004 年 1 月 2 日到 2008 年 9 月 26
日全部上证综合日收盘指数,共 1151 个数据.
样本数据处理
首先,计算股指的日对数收益率 1ln( ) ln( )t t tR P P−= − ,得到收益率的折线图(图 1)和
部分统计量(表 1).可以发现,收益率的分布基本上以零为中心,呈现左偏、尖峰的分布
形态;序列不服从正态分布,收益率序列图显示出波动聚类现象;对数据进行 Augmented
Dickey-Fuller 单位根检验,可知序列是平稳的;自相关检验表明,回报序列本身不呈现明显
的自相关而回报序列的平方表现出很强的自相关,因此可以用 GARCH 模型来拟合收益率序
列.
.00
.05
.10
250 500 750 1000
DLSZ
图 1.上证综合指数日收益率折线图
表 1.上证综合指数日收益率的基本统计量表
均值 中位数 标准差 偏度 峰度 Jarque-Bera P 值
阈值的选取和参数估计
由于日对数收益率取值太小,直接使用可能影响精度,故将这些数据扩大 100 倍,取其
相反数,变成损失,然后根据上分位数来计算 VaR 和 CVaR[7].观察平均剩余寿命图(图 2),
其中实线是平均剩余寿命的估计,点划线是置信域.可以看到当阈值u = 时(缩小 100
倍),图形大致呈线性,当u太大时,样本的超过量太少,会导致较大的方差;而较小的u
- 5 -
(较多观测值,但同时(4)式不能应用)产生较大的偏.
-5 0 5
0
2
4
6
8
u
M
ea
n
E
xc
es
s
图 2.平均剩余寿命图
0.
00
0.
04
Threshold
M
od
ifi
ed
S
ca
le
-0
.4
0.
2
Threshold
S
ha
pe
图 3.对应于不同阈值的参数估计及相应的 95%的置信区间
u取 时,则有 128 个超越阈值数目,修正的尺度参数σˆ 、形状参数ξˆ 分别为 、
,标准误差分别为 、.图 3 中的上下图分别为修正的尺度参数和形状参
数在不同阈值上的值和误差限,由于其表现出相对稳定性,因此选取u = 作为阈值是合
理的.
对于给定的置信水平 p,将其带入(9)式、(12)式就可以求出 VaR 和 CVaR.将结果与
Riskmetrics 标准方法、GARCH(1,1)、GARCH(1,1)-t、David 半参数方法进行比较,列
于表 2.
- 6 -
表 2.沪市指数日 VaR 值的统计结果
置信水平 EVT Riskmetrics GARCH(1,1) GARCH(1,1)-t 半参数法
95%
99%
失败率[8]及
次数(95%)
%
(55 次)
%
(72 次)
%
(75 次)
%
(35 次)
%
(27 次)
失败率及
次数(99%)
%
(13 次)
%
(19 次)
%
(21 次)
%
(7 次)
%
(22 次)
由上表知,David 半参数法估计的 VaR 值实际上是一个区间[9],且区间太长(这里只采
用了估计的下限),其估计效果依赖于序列本身,所以在实际的风险管理过程中,其价值不
是太大.在 95%和 99%的置信水平下,Riskmetrics 标准方法和 GARCH(1,1)模型分别存在低
估股市风险的倾向,而 GARCH(1,1)-t 则存在高估市场风险的倾向.由失败率可知,基于极
值理论模型的 VaR 在 95%和 99%的置信水平下都能基本地预测股指的波动情况.
除此之外,由极值理论(EVT)计算出来的置信水平为 95%和 99%的 CVaR 分别是
、,可以看出 CVaR 估计值比 VaR 估计值高得多,因此从总体上说,CVaR
是一种可以覆盖更大范围左尾风险的风险度量工具.但我们更关心的是在 VaR 估计失效的
交易日里,CVaR 是否可以有效地覆盖风险.通过表 3 可以看出在 95%的置信水平下,两者
很接近;在 99%的置信水平下,CVaR 略大于平均损失.从而说明在 VaR 估计失效的交易
日里,CVaR 可以比较有效地度量左尾风险.
表 3.VaR 失效的交易日里实际损失与 CVaR 的比较
置信水平 95% 99%
实际损失均值
CVaR 估计值
模型的诊断
模型的诊断主要是把估计的 GPD 与经验的概率图(PP 图)、分位数图(QQ 图)、重现水平
图(Return Level Plot)和密度函数图分别进行比较.
由图 4 可以看到,概率图上点的分布基本上呈现一条直线;QQ 图中有几个点不在直线
上,但如果考虑到抽样的随机性,加上经验重现水平都落在估计的 95%的置信区间内,说
明数据与模型的偏离不大;但同时亦可以看出由模型外推到很高的重现水平时,有很大的不
确定性,金融风险分析中,重现水平图即 VaR;由密度图可知,分布函数的估计和频率图
拟合的也较好,所以说本文模型的选取是合适的.
- 7 -
0.
0
0.
4
0.
8
Probability Plot
Empirical
M
od
el
0.
02
0.
04
0.
06
0.
08
Quantile Plot
Model
E
m
pi
ric
al
1e-01 1e+01 1e+03
0.
0
0.
2
0.
4
0.
6
0.
8
Return Level Plot
Return period (years)
R
et
ur
n
le
ve
l
Density Plot
x
f(x
)
0
20
40
60
80
图 4.阈值超出量分析的诊断图
4. 小结
本文利用极值理论计算资产收益率的 VaR,以上证指数为例进行实证分析.研究表明
上证指数的历史收益率分布远远偏离正态而具有厚尾性,与传统方法相比,极值方法不需要
对回报的分布做出主观假设,而是充分利用超越门限的数据拟合分布的尾部,更注重对尾部
的近似表达,因此建模的风险减少了.利用失败率检验估计的统计结果可知,基于极值理论
计算的 VaR 能够更加准确地度量我国沪市的风险价值.
参考文献
[1]McNail, the tails of loss severity distribution using extreme value theory[J].1997, (27),117-137.
[2]Artzner P,Delbaen F, Eber J M,Heath measures of risk[J]. Mathematical Finance,
1999,9(3):203-228.
[3]封建强.沪、深股市收益率风险的极值 VaR 测度研究[J].统计研究,2002,(4):34-38.
[4]Alexander .《Extreme Value Theory for Risk Managers》[M].Department Mathematic
ETH Zentrum,1999.
[5]Pickands Inference Using Extreme Order Statistics[J]. Ann. Stat. 1975, 3(1):119-131.
[6]Balkema, A., and L. de Haan, Residual Life Time at Great Age, Annals of Probability 2, 792-804,1974.
[7]高松,李琳,史道济.平稳序列的 POT 模型及其在汇率风险价值中的应用[J].系统工程,2004,22(6):49-53.
[8]田新时,郭海燕.极值理论在风险度量中的应用[J].运筹与管理,2004,13(1):106-111.
[9]David at Risk Based on the Volatility, Skewness and Kurtosis. .
- 8 -
Risk Measurement on Stock Market by the Use of Extreme
Value Theory
Ding Yujie, Zhou Shengwu, Han Miao, Zhang Yan
College of science, China University of Mining and Technology ,Xuzhou,(221116)
Abstract
As the elementary tool of financial risk management, VaR can be calculated by a number of different
methods for the moment, and the results are often very different. In this paper, we especially introduce
the threshold model of extreme value theory and the new methods of risk measurement --CVaR. At last,
the extreme value theory is applied to calculate VaR of Shanghai stock index, and then we compare it
with the results of other typical measurement. The empirical results show that: the VaR based on GPD
model can reflect the risk of China's stock market more accurately. At the same time, when the
estimation of VaR is failure, the CVaR calculated by the extreme value theory can cover risk
effectively, so to a certain extent, VaR and CVaR play an important role in "double limit"
supervision .The further diagnosis shows that: the extreme value theory is an effective way to measure
the risk in the extreme market conditions. Also, it can accurately describe the quantile of the tail
distribution,so it is more suitable to study the characteristics of "fat-tail" of financial assets yield
sequence.
Keywords: VaR; CVaR; extreme value theory; threshold