基于极值理论的沪深股市VaR和CVaR分析 刘国光 王慧敏 河海大学国际工商学院 南京 210098 摘要: 将VaR 和CVaR结合起来能全面描述金融时间序列与尾部相关的风险考虑沪深股指收益序列胖尾特性极值理论方法能够对沪深股市VaR和 CVaR进行较好估计运用基于Bootstrap和极大似然估计方法解决极值理论数据不足的缺陷给出对VaR和 CVaR的点估计和区间估计 关键字: VaR CVaR 最大似然估计 极值理论 Bootstrap方法 一引言 近年来VaR和 CVaR已经成为普遍被接受最重要的风险测度而对它们进行准确估计一直是风险管理实务人员和理论工作者面临的现实挑战由于实际金融时间序列非正态胖尾分布特性估计左尾95%或者 99%分位数对风险管理人员其实是非常重要的基于正态分布的众多估计方法无疑存在较大缺陷众多的研究文献常把极端事件排斥在外而这些极端事件在风险管理中恰恰是极其重要的例如作为众多研究基础的高斯分布认为大的偏差极22少出现exp(-x/2)的量值随x绝对值增加急剧减少在2处事件的概率为5%3处-23概率为%而大于10的事件发生的概率为2*10也就是说决不会发生明显不符合分布的实际情形就需要恰当的模型对收益分布的尾部区域特别是左尾区域进行描述 本文考虑金融时间序列的胖尾特性运用极值理论方法对VaR和 CVaR进行估计估计面临的主要问题是尾部样本数据较少和如何选择适当分布函数描述收益分布特征尤其是收益分布的尾部特征当实际收益数据较少时用于描述尾部的数据就更少就需要首先确定实际收益分布是否存在胖尾特征在具有胖尾特征下用具有胖尾特性的分布函数进行拟合确定合适的分布函数针对尾部估计中数据较少情形运用Bootstrap方法产生大量的子样本给出相应分布函数参数以及VaR和 CVaR进行点估计和区间估计 作为实际应用本文运用上述相关理论对沪深股指收益进行实证分析探讨两市与尾部相关的风险研究所涉及到的数据包括深圳证交所从1991年4月3日到2003年3月20日全部深圳成份股日收盘指数和上海证交所1990年12月19日到2003年3月20日全部上证综合日收盘指数收益率公式为R= (lnSt+1-lnSt) *100StSt+1分别是t交易日和t+1交易日收盘指数为了计算方便对计算的收益率变号即r = -R本文所有的算例均运用编写相关程序实现 二极值理论VaR 和 CVaR 估计 一 VaR 和 CVaR VaR计算假设随机变量X有连续分布函数F描述特定金融工具在某一时间水平损失或负收益分布这样VaR可以定义为分布函数F的p分位数 -1VaRp = F(1 - p); (1) -1其中 F 是分布函数F的逆函数又称为分位数函数 出于内部管理需要大多数金融企业计算持有期限为1天5的VaR巴塞尔协议要求运用至少1年220天数据计算持有期限为10天1%的VaR CVaR计算Uryasev和Rockafellar在1999年给出CVaR等于给定X > VaRp 时X的条件期望即 CVaRp = E(X | X > VaRp): (2) VaR技术已成为国际金融业的行业标准其优点是很明显的但是VaR不论在实践应用 作者简介刘国光1967男汉江苏南京人博士研究生研究方向计量金融理论与方法 王慧敏1963女汉江苏南京人教授博士生导师研究方向数量经济 1
上还是在理论上都存在不可克服的缺点例如按照Artzner et al观点VaR不是一致性风险测度当损失分布非正态时运用VaR来测度市场风险就存在困难实际金融时间序列收益分布大多是具有胖尾特征的非正态分布VaR明显缺点是对损失超出阈值点VaR值有关数据没有进行任何处理它仅仅提供一个损失分布尾部的最低边界实际上损失超出阈值点VaR值数据分布是多种多样的在VaR基础上发展而来的CVaR技术能够测度损失超出VaR的风险而且是一致性风险测度是近年来风险评价理论研究的最有前途的课题最有希望成为未来国际金融业的行业标准 二极值理论 研究极端值分布的极值理论有两种相关方法确定实际极值数据一种是分块最大值方法block maxima,另一种是阈值方法threshold method本文仅运用阈值方法来研究沪深股市收益分布的尾部行为 设x1,x2,,xn表示股票收益分布序列其分布函数为F我们感兴趣的是投资损失超出某一阈值u情形即分布的左尾定义损失超出某一给定阈值u的极端值分布函数为 F(y)−F(u)Fu(y)=p{X-uy│X>u}= (3) 1−F(u)其中y=x-u当阈值u足够大时上述分布Fu(x)即可用一般帕累托分布GPD表示 -1/G G,(y)=1-(1+y/) (0) {GG,(y)=1-exp(-y/) (=0) (4) >0,即为形状参数其倒数即为尾部指数值越小尾部指数越大尾部就越粗 三基于极值理论的VaR 和 CVaR估计 可以根据和相关内容推导出VaR 和 CVaR解析表达式由(3)得 F(x)−F(u)Fu(y) (5) 1−F(u)用GPD代替Fu(y),F(u)用(n-Nu)/n代替n为总得样本数据数Nu为为观察值超出阈值u数则 (6) 简化形式为 (7) 给定概率水平p条件下(7)式的转化形式 (7) 这样CVaR就变成 CVaRVaRp+E(X – VaRp∣X> VaRp) (9) E(X–VaRp∣X> VaRp)为给定阈值VaRp超额均值函数(mean excess function)当<1时GPD的超额均值函数为 (10) 根据相关极值理论z = VaRp–u则 2
σ+ξ(VaRp−u)VaRp σ−ξuCVaRVaRp ++ (11) 1-ξ1-ξ1−ξ为了估计VaR和CVaR需要确定阈值u与相关参数和运用最大似然估计方法估计相关参数运用Bootstrap和似然基础方法给出参数和以及VaR和 CVaR的点估计和区间估计给定样本y={y,!,y}和分布为GPD条件下建立联合密度形式的对数似然函1n数L(ξ,σ|y) n1ξ−nlogσ−(+1)log(1+y)∑i0 εσi=1L(ξ,σ|y)= n1−nlogσ−logy∑iσ0 i=1三 深股市VaR 和 CVaR分析 一沪深股票收益QQ图分析 QQ图是从视觉上判断样本是否来自某一特定分布的方便工具如果样本来自某一特定分布那么QQ图就是一条直线在极值理论和应用中QQ图是相对一般帕累托分布尾部为中等绘制的主要用来检验分布的尾部肥胖程度如果QQ图为一直线样本来自一般帕累托分布图1和图2是沪深股市指数收益相对于一般帕累托分布的QQ图从中可以看出沪深股指收益QQ线基本上为一直线说明沪深股市收益分布为一般帕累托分布 图1 深成指收益相对于一般帕累托分布QQ图 图2 沪综指相当于托分布QQ图 (二一般帕累托分布GPD拟合分析 当阈值足够大时极值数据的分布接近一般帕累托分布函数拟合情形从两幅图中可以看出拟合程度相当满意图3中当阈值k110其分布符合形状参数为的帕累托分布尾部指成指收益分布的左尾呈现典型的肥胖形态图4中当阈值u=其分布基本符合形状参数为的帕累托分布尾部指数1综指收益分布的左尾呈现典型的肥胖形态图3的拟合程度比图 3 一般帕累GPD图3和图4是实际u=时极端值数目数1/=表明深时极端值数目k113/=同样表明沪4好
图3 深成指收益拟合GPD分布 图4 沪综指收益拟合GPD分布 (k=110,u= =) (k=113,u= =) 三VaR和 CVaR的点估计和区间估计 1 VaR和 CVaR的点估计 首先运用对数似然函数L(ξ,σ|y)估计相关参数和然后根据公式(8)和公式(9)进行估计本文分别计算了深成指和沪综指收益和的VaR CVaR结果见表1从表1中可以看出CVaR远高出VaR深市的CVaR/VaR值远高于沪市CVaR/VaR值 p=时深市CVaR/沪市CVaR值远高于p=时深市CVaR/沪市CVaR值表明深市的尾部风险远高于沪市的尾部风险 表1 基于POT方法的ML点估计 qqqq VaR 深成指 沪综指 2 基于Bootstrap方法的 VaR和 CVaR区间估计 Bootstrap法它是以原始数据为基础的模拟抽样统计推断法其基本思想是在原始数据的范围内作有放回的再抽样样本含量仍为n原始数据中每个观察单位每次被抽到的概(b)率相等为1/n所得样本称为Bootstrap样本于是可得到参数的估计值这样(b)重复若干次记为B设B=1 000就得到该参数的1 000个估计值当的频数分布近(b)似正态分布时以其均数作为点估计用正态原理估计可信区间当的频数分布为偏态时以其中位数作为点估计以上下%分位数作为其95%置信区间Bootstrap法估计的误差是多少?Bootstrap统计量的抽样误差包含了两个部分一是原样本(经验分布)的抽样误差二是Bootstrap再抽样误差当B充分大小时Bootstrap再抽样误差就趋于消失Bootstrap估计的误差就接近抽样误差B的大小与原分布有关一般取50200之间即可但若原数据的变异较大则B的取值相应增加 表2 基于POT方法95%Bootstrap区间估计(1) B=200 B=500 B=1000 深成指 沪综指 深成指 沪综指 深成指 沪综指 4
表2 基于POT方法95%Bootstrap区间估计(2) B=1500 B=2000 B=2500 深成指 沪综指 深成指 沪综指 深成指 沪综指 表2是95%显著性水平下基于Bootstrap方法对VaR和CVaR进行的区间估计从表2可看出原始资料变量值小的一侧相对稳定B=200到B=2500 VaR和CVaR置信区间左边界很接近深成指和沪综指VaR估计值左边界变动范围分别是至和至深成指和沪综指CVaR估计值左边界变动范围分别为至和至深成指和沪综指VaR估计值右边界变动范围分别是至和至变动范围也较小深成指和沪综指CVaR估计值右边界变动范围分别为至和至变动范围较大提示我们对于变异较大的数据特别是存有极大值或极小值B宜取大一些如本例B=1 000时以上时置信区间才趋于稳定 四 结论 通过沪深股指收益左尾分布拟合分析发现一般帕累托分布函数能较好描述沪深股市收益左尾分布特征将VaR 和CVaR结合起来能全面描述与尾部相关的风险不论在理论上还是在实务上都是必要的和其它估计VaR 和CVaR方法相比极值理论方法建立在金融时间序列实际分布基础上又有明确的解析形式运用Bootstrap方法能够弥补极值理论方法数据较少的缺点同时还给出VaR 和CVaR置信区间不失为一种可行高效的估计方法对这些方法和工具我们应该结合我国实际认真加以研究满足我国蓬勃发展的证券市场来需要 参考文献 [1] 陈峰.Bootstrap估计及其应用.中国卫生统计199714(5) [2] 王春峰 VaR金融市场风险管理 天津大学出版社 2001 [3] 秦拯 邹建军 VaR模型在金融领域的应用分析 长沙电力学院学报 (社会科学版 ) 2002年 8月 第 17卷第 3期 [4] 刘静 VaR应用分析以及对我国的启示 南开经济研究2002年第3期 [5] R. Tyrrell Rockafellar Stanislav Uryasev Conditional value-at-risk for general loss distributions Journal of Banking & Finance 26 (2002) 1443–1471 [6] Artzner, Ph., F. Delbaen, J.-M. Eber, and D. Heath (1999), Coherent Risk Measures, Mathematical Finance 9, 203-228 5
Using Extreme Value Theory to Estimate VaR and CVaR (Liu Guo-guang Wang Hui-min) (International Business School of Hohai University Nanjing 210098) Abstract: Uniting VaR and CVaR can fully describe tail-related risk . Since Shanghai and Shenzhen A Stock Market return distribution exhibit fat tails, we use extreme value theory method to estimate VaR and CVaR. Bootstrap method is to used to reproduce subsamples to offset insufficiency data, bootstrap and likelihood-based methods are also used to give point estimation and construct confidence intervals for the VaR and CVaR. Key words: VaR, CVaR, Extreme Value Theory, Bootstrap Method (刘国光 1967男汉江苏南京人博士研究生研究方向计量金融理论与方法025-3789947 13813328706 gglive@ 王慧敏 1963女汉江苏南京人博士后教授博士生导师研究方向数量经济 025-3787637 13822500338 huimingwang63@) 6