1银行信用组合风险多成分重要性抽样研究 龚朴 胡祖辉 (华中科技大学管理学院) 【摘要】:银行信用组合违约风险的度量和计算对银行监管有着重要意义。使用蒙特卡洛研究信用组合违约概率时,重要性抽样通过条件独立性和“均值移动”两个步骤实现。本文提出了一种基于违约相关性矩阵的单步重要性抽样算法。该算法通过主成分抽样选择违约结构中占优成分,扩大其方差来实现,并给出了最优方差扩大倍数。数值实验证明了该方法在信用组合遭遇极值事件时,具有一定的计算优势。 关键词:信用组合风险,蒙特卡洛模拟,重要性抽样,主成分分析 中图分类号: 文献标识码:A Principal component importance sampling for bank credit portfolio risk management Abstract: The bank credit portfolio risk measurement has great significance on bank supervision. When using Monte Carlo simulation to estimate the default risk, the importance sampling procedure is achieved by conditional independence and ‘mean shift’ in a factor copula model. In this paper, we propose an importance sampling procedure which needn’t conditional independence. The procedure uses principal component analysis to choose dominant factors, then scales up their variances. Numerical experiments are provided and shown that when a credit portfolio confronts extreme events, it has some efficience. Keywords: portfolio credit risk, Monte Carlo simulation, important sampling, principle component analysis 1本项目受国家自然科学基金项目“信用衍生产品定价理论模型和数值模拟技术研究”(项目批准号:70871049)的资助。
一、引言 近年来,随着信用衍生品市场的发展和成熟,信用风险的流动性逐渐增加。这种新的金融市场为对冲或投机信用风险提供了可能的投资机会,迫使商业银行精确地计算贷款和债券的违约风险,更加积极地管理其信用组合风险敞口。 商业银行的风险敞口一般来自于不同的公司,地区和行业。信用之间的违约风险可能存在着较强的相关性,例如商业银行普遍偏好于贷款给某个地区的公司,或者某个行业的公司,以减小信息不对称所带来的额外风险。然而,当其中一个贷款违约时,极有可能引起其他贷款的骨牌效应。在计算这种信用组合的违约概率时,困难之处在于如何从投资组合管理的角度处理信用间违约相关性,同时降低计算成本,提高计算速度。蒙特卡洛模拟可以用来处理较为复杂的组合违约相关性,然而,计算时间较长。对于一个具有较高信用等级银行所持有的贷款组合而言,估计小概率大损失事件的发生概率会需要数天的计算时间。因此,直接使用蒙特卡洛方法效率不高,降低了信用组合压力测试的可行性。所以,各种加速方法,如重要性抽样算法,得到了越来越多学者的关注。 二、文献回顾 Glasserman和Jingyi (2005)率先提出了一种两阶段重要性抽样(Importance Sampling, IS)算法:首先,在CreditMetrics(Gupton, Finger et al. 1997)模型下得到单因素条件独立的违约事件;然后,对条件独立违约事件使用指数抽样算法提高计算速度。他们认为信用之间的违约相关性对计算效率有着十分重要的影响。Glasserman等 (2007; 2008)将上述工作扩展到多因素模型,用于处理不同信用等级的银行贷款组合。他们将异质信用组合违约损失问题归结至一类“最小子集和问题”。在该框架下,学者们从不同的角度研究了蒙特卡洛的计算效率。Glasserman (2006)使用蒙特卡洛模拟和重要性抽样算法研究了信用组合中边际风险的贡献率问题。Dunkel 等(2007)讨论了如何有效地使用蒙特卡洛模拟估计凸风险度量。Bassamboo 等(2008)将极值相依关系引入其中,并给出了渐进有效的重要性抽样算法。而Huang 和Oosterlee (2009)使用了与前述工作不同的处理方法,他们采用自适应蒙特卡洛积分替代了蒙特卡洛模拟和重要性抽样算法。 这些模型在计算信用组合违约概率时都需要条件独立性,以便样本尽可能集中在对计算结果有影响的重要性区域。然而,在参数空间中确定重要性区域的方位和大小涉及到一系列较为困难的优化问题(Kang and Lee 2006; Glasserman, Wanmo et al. 2008; Grundke 2009; Sak, Hörmann et al. 2009),求解算法复杂,计算效率较差。Morokoff (2006)提出在计算信用组合的违约概率时,条件独立性并不是必要的。在此基础上,本文并将其工作推广至多个占优因子的情形,并给出了多因子情形下的最优方差扩大倍数。数值算例说明单因子常方差扩大模型在贷款组合遭遇极端违约事件(如次债危机)时,计算效率将会下降,而多因子变方差扩大模型能够较好地处理极端损失事件,计算效率有一定的改善。 本文剩余部分组织如下:第三节简要给出信用组合违约相关性模型和占优因子选择方法;第四节详细描述多因子变方差扩大算法;第五节给出最优方差扩大因子;第六节对算法进行数值检验,并分析计算结果;第七节总结全文指出下一步研究方向。 三、违约相关性模型 考虑某商业银行由N个贷款,债券等构成资产组合。假设第i个信用的边际违约概率为p。假设存在代理变量X,当X小于某个给定的阈值x时(Li 2000; Glasserman and Jingyi iiii2005),第i个信用违约,并记其违约损失为l。那么,该资产组合的违约损失可表示为: i
N L=l1 (1) ∑i{X<x}iii=1其中1为示性函数。违约阈值x可由边际违约概率p确定:PX<x=p,那么,违约事{}iiiii⋅{}件1之间的相关关系可以由代理变量X之间的相关关系决定(Zhiyong and Glasserman X<xi{}ii2008): X=aZ+"+aZ+bε (2) ii11iddii222其中ε和Z是相互独立的标准正态随机变量,且a+"+a+b=1。 iii1idi对代理变量X可以通过移动其分布的均值来得到重要性区域(Glasserman and Jingyi i2005; Glasserman, Wanmo et al. 2008)。然而,如果模型(2)中影响因子较多,如何在多维空间中确定分布均值的移动方向和大小是一个较难处理的优化问题。此时,可以通过扩大模型中占优成分的方差来得到重要性区域(Morokoff 2006)。通过扩大主要占优成分的方差,计算样本将更多地来自联合分布的尾部,较为直观且避免了复杂的优化过程。然而,直接扩大某个因子或某几个因子的方差并不能带来令人满意的结果,其原因在于其他因子的取值可能会消除方差扩大的影响。 主成分分析法(Principal Components Analysis, PCA)可以将所有因子按照各自相对重要性程度组成新的成分,此时,便可以按照某种特殊比例关系同时扩大所有因子的方差,以满足算法的需要。假设需要扩大m个占优因子的方差(m M),对于代理变量X的相关性矩阵 TT Σ=A+B (3) 其中矩阵A表示模型(2)中的载荷矩阵,矩阵B表示载荷矩阵A的补充矩阵,使得相关性矩阵Σ的主对角线为1,就需要识别m个占优因子。一般说来,相关性矩阵Σ应至少具有m个正的特征值λ≥"≥λ>0,其对应的正交标准特征向量表示为ν,…,ν。由PCA可知,{}1m1m相应成分的相对重要性可以由特征值λ决定。特征值λ越大,其对总方差的解释力度越强。ii因此,本文将使用特征值的大小关系来定义成分之间的占优关系。当识别出m个占优成分之后,就可以扩大相应的λ,使得它们变得更加重要。这样处理后相当于扩大了分布的方差,i在模拟过程中将会有更多的样本取自那些对计算结果有影响的重要性区域,从而提高模拟效率。 四、多成分变方差扩大重要性抽样 由以上分析可知,代理变量X的分布在处理前后发生了变化。这也是重要性抽样算法i的工作原理。重要性抽样算法通过改变随机变量的分布函数,使得更多的样本来自于那些对计算结果有影响的区域。假设需要估计函数E⎡hW⎤,其中f表示随机变量W的分布密()f⎣⎦度函数,h为相应概率密度下可测函数。假设g是另一分布密度函数,当fW>0时,有()
gW>0。那么估计函数可以表示为 ()fw⎡f⎤()() E⎡hW⎤=hwfwdw=hwgwdw=Ehw (4) ()()()()()()⎢⎥fg⎣⎦∫∫gg()()⎢⎥⎣⎦fw()即可通过模拟服从g的随机变量W,通过表达式hw来无偏地估计原估计量()gw()(Glasserman and Jingyi 2005; Glasserman, Wanmo et al. 2008)。其中fwgw似然比率。 ()()选择一个合适的重要性抽样分布与待解决的问题有着紧密的关系。如果新分布函数使得样本过于集中在某些区域,可能会导致模拟精度的下降。本文通过扩大占优因子的方差使分布的尾部变厚,因此,不会出现样本过于集中在某些区域的情形。代理变量的联合分布仍然是多元正态,唯一的差别在于他们的协方差矩阵特征值不尽相同。假设新概率分布的协方差2 矩阵特征值为λ=αλ, =1,…,m,λ=λ, i=m+1,…,N,那么新的协方差矩阵为 iiiiiT Σ=VΛV(5) 其中Λ为主对角元素为λ,…,λ的对角矩阵,矩阵V的第i列元素为ν。那么似然比率可以1Ni表示为 Σ1⎛⎞T−1−1 ωx=exp−xΣx (6) ()() ⎜⎟ΣΣΣ2⎝⎠TT 其中x表示协方差矩阵为Σ的多元正态随机变量。利用Σ=VΛV,Σ=VΛV和相应的标准 Σ正交条件,有 2T⎛⎞mmxv⎛⎞()11 iΣ⎜⎟ ωxαexp−1− (7) () ∏∑⎜⎟iΣ22αλi=1i=1⎝i⎠i⎠为了能够直接比较多个重要性抽样算法的计算结果,需要将其转化到未做概率变换的分布上,换句话说,需要将似然比率表达为协方差矩阵为x的函数。 Σ记对角矩阵D,其主对角元素分别为d=α,=1,",m ,d=1, i=m+1,",N,那么 iiiiiT x=VDVx(8)() ΣΣ所以,有 mT x=α−1vxv+x (9) ()() ∑iiΣiΣΣi=1TT注意到vv=1和vv=0,i≠j,有 iiij2T⎛⎞mmxv()1Σi2⎜⎟ ωxαexp−α−1 (10) ()() ∏∑iiΣ2λi=1i=1i⎝⎠
本节假设α是已知的,通过利用标准正交性条件将Morokoff(2006)推广到了一般情形。对iT于随机变量x,如果有Σ=CC,则可以使用标准正态随机变量模拟x=Cz。一般说来,ΣΣ服从新分布随机变量的取样需要额外的计算成本。然而,式(9)说明了本节提出的重要性抽样算法所需额外计算成本可以忽略不计。在这个新框架中,如果令α=1,便是直接蒙特卡洛模拟方法;如果令m=1且α=2,便得到了Morokoff (2006)的算法。这个新框架同时包含了直接蒙特卡洛模拟和Morokoff重要性抽样算法作为其特例。如果对三个算法在模拟时使用同样的随机数,便可以排除随机数的影响,从而直接比较其计算效率。 五、最优方差扩大参数 Morokoff(2006)认为随机变量vxλ是一个服从标准正态分布的随机变量。那么,似1Σ1然比率也可以看作服从如下分布的随机变量: ⎛⎞⎛−2logωα()⎜⎟ Pω<w=21−Φ⎜ (11) ()2α−1⎝⎠并假定随着违约损失的增加似然比率值将会减小。然而,该假设并不总是成立,信用组合的违约相关性与违约损失之间有着较强的相互关系。数值算例说明了当信用组合违约损失超过自身价值一半时,计算效率将下降。 本文将通过最小化待估计值的方差,或者说二阶矩来选择α。信用违约损失概率的二i阶矩可以表示为 2 Mx=Mx,α=E⎡1L>xω⎤x (12) ()(){}() 22iΣ⎣⎦所以, 2 E⎡1L>xω⎤x=E⎡1L>xωx⎤≤E⎡ωx⎤ (13) {}(){}()() ΣΣΣ⎣⎦⎣⎦⎣⎦有 2mT⎛⎞mαxv()∏1Σii=12T−1i⎜⎟ E⎡ωx⎤=exp−α−1+xΣxdx (14) ()()ΣN∑i⎣⎦∫RN2λi=1i2πΣ()⎝⎠T−1T−1相关性矩阵Σ是半正定的,可以表示为Σ=VΛV,它的逆可以表示成为Σ=VΛV,其−1中Λ是一个对角矩阵,其主对角元素为1λ,或者零。注意到λ>0,因此对于x的标准iiT−1T−1二次型,当对角矩阵的某些主对角元素设为零时,有xΛx≥xΛ′x。所以, 2T⎛⎞2mmxv()⎛2α⎞Σi2T−1i⎜⎟ −α−1+xΣx≤−xv (15) ()()∑⎜∑⎟Σλλi=1=⎝⎠⎝⎠此时, 222mNmNm222αααTiii xvvxvx−vx (16) ()()()∑Σ∑ii,j|Nj|Ni,j+1|N∑j1|Ni,jjλλλ=1j=1j=1
⋅|N为取余操作。v表示向量v的第j个元素。因此,有 ()i,jim2Nmα⎛2⎞∏1αi=1i Mx≤exp−vxd (17) ()()⎜2N∑∑⎟i,jj∫RN2λj=1i=1⎝i⎠2πΣ()令α=λ,那么Mx表示为N个正态概率累积函数的乘积 ()ii2mNmλ∏ii=21 Mx≤v(18) ()2∏∑i,jΣji=1N如果,选择m=N,有Σ=λ,且 ∏ii=1N2 Mx≤v (19) ()2∑i,ji=1N2近似地,v≤1,因此,Mx≤1。如果令m=1,那么有 ()∑i,j2i=1λ1 Mx≤(20) ()2Σ尽管这个值的上限取决于相关性矩阵Σ,却是有限的。如果标的信用间的相关性很高,相关性矩阵行列式的值较小,特征值λ也较小,因此,上限值较小。如果标的信用间的相关性较1低,相关性矩阵行列式的值较大,此时,特征值λ也相对较大。 1六、数值算例 本节将通过数值算例讨论和比较三种算法的计算效率,通过对比研究说明直接蒙特卡洛模拟方法,Morokoff重要性抽样算法和多成分变方差扩大重要性抽样适用性。第一个数值算例取自Glasserman和Jingyi (2005)。假设信用组合由N=1000个信用组成,含有10个因子。信用的边际违约概率和边际违约损失由下式给出 16iπ⎛⎞ p=×1+sin, =1,",; (21) i⎜⎟N⎝⎠25i⎡⎤ l=, i=1,",N;(22)i⎢N⎥它代表了一个典型的异质信用组合。因子载荷系数a由相互独立的均匀分布kj0,1d,d=10构成。图一给出了直接蒙特卡洛模拟算法(plain MC),Morokoff IS(Morokoff ()MC),单一成分重要性抽样(PCA 1 MC)和两成分重要性抽样算法(PCA 2 MC)的结果对比图。更多成分的重要性抽样算法在计算过程中会产生数据向下溢出现象,因此不再对比其计算结果。所有的蒙特卡洛模拟均使用了相同的随机数。为了说明计算结果的稳定性,直接蒙特卡洛模拟使用的路径数为10000次,重要性抽样算法使用的路径数为1000次。
-1010 10 plain MCplain MCMorokoff MCMorokoff MCPCA 1 MCPCA 1 MCPCA 2 MC-2PCA 2 MC-11010-3-21010-4-31010-5-41010-6-51010-7 10 0500100015002000250030003500400045005000 0500100015002000250030003500400045005000 图一:10因子信用组合违约概率 图二:10因子信用组合违约概率方差 为了准确地区分违约损失概率及其置信区间,将违约损失概率的样本方差置于图二中,并对直接蒙特卡洛模拟和重要性抽样算法计算了相同违约损失发生的概率。我们发现,当违约损失较小时,重要性抽样算法(无论是Morokoff MC还是PCA MC)比直接蒙特卡洛模拟算法效率要低。这一点可以从图二中观察样本的方差得出。然而,随着违约损失的增大,重要性抽样算法变得越来越具有效率。当违约损失超过某一阈值时,PCA重要性抽样算法变得比Morokoff重要性抽样算法有效。随着违约损失的进一步扩大,PCA 2 IS变成了最具效率的重要性抽样算法。这也意味着,当违约损失越来越大时,单方差常数扩大算法效率下降。随着违约损失的扩大,应改变方差扩大倍数。 第二个算例是50因子信用组合模型,它与Morokoff (2006)的算例相同。这个算例也包含了1000个信用,它们的边际违约概率和违约损失分别服从表达式(21)和表达式(22)的控制。第一个载荷系数从均匀分布,中随机取得。第二个到第五个载荷系数相互独立[]的从均匀分布,中随机取得。最后两个非零载荷系数从剩余的系数中独立地挑选。[]如果选择的两个载荷系数是同一个,那么选择该载荷系数和相邻载荷系数,且服从0,的[]均匀分布。最后将这些载荷系数单位化,使其平方和为1。这个系数结构有如下解释:第一个因子代表了市场范围的影响因素,它作用于所有的信用;接下来的四个影响因子代表了产业和地理因素的影响,剩余的两个影响因子表示了与公司相关的信用影响因素。 算例二的模拟结果显示在图三和图四中。根据设定,该信用组合最大可能的违约损失是11000,设定损失阈值为c=10000表示了非常极端的违约损失情况。表一给出的方差缩小因子是直接蒙特卡洛的样本方差比上重要性抽样算法的样本方差。就像我们所预期的那样,方差缩小因子随着违约损失的扩大而扩大。而本文重要性抽样算法所需要的计算时间与直接蒙特卡洛模拟基本相同,因此,这些方差缩小因子也是重要性抽样算法的效率扩大倍数。0010 10 plain MCplain MCMorokoff MCMorokoff MCPCA 1 MCPCA 1 MCPCA 2 MCPCA 2 MC-5-51010-10-101010-15-151010-2010-2010-2510 -2501000200030004000500060007000800090001000010 010002000300040005000600070008000900010000Lll
图三:50因子信用组合违约概率 图四:50因子信用组合违约概率方差 在第二个算例中,当违约损失c>5000时,直接蒙特卡洛模拟方法给出的估计值将不再可靠。因此,本文将方差缩小因子的原始定义做出了微小的调整:当违约损失超过5000时,方差缩小因子将使用Morokoff重要性抽样算法的样本方差作为分子,并称之为相对方差缩小因子。结果显示在表二中。 表一:50因子模型方差缩小值 损失水平 1000200030004000 4600 Morokoff MC 1 MC 2 MC 从表二可以看出,当违约损失越来越大时,PCA 2 IS算法逐渐获得了较大的相对方差因子。这进一步验证了本文从第一个数值算例中所得到的结论:当违约损失较小时,应该使用直接蒙特卡洛模拟方法来计算违约损失概率;当违约损失处于某一个中间水平时,可以使用Morokoff重要性抽样算法;然而,当违约损失较大时,应该使用PCA重要性抽样算法估计违约损失发生的概率。 表二:50因子模型相对方差缩小值 损失水平 5000600070008000900010000 PCA 1 MC 2 MC 然而,具体到某个违约水平应该使用何种重要性抽样算法是另外一个值得深入探讨的问题,它与信用组合的结构和违约相关性强弱有着密切的关系。我们的初步意见是,当违约损失达到或者超过了最大可能损失的三分之一时,应该使用PCA 1 IS算法;当违约损失超过或者达到最大可能损失的二分之一时,应使用PCA 2 IS算法,以进一步加快算法收敛速度,提高计算效率。 七、结论 本文发展并分析了一种基于主成分分析方法的重要性抽样算法,它在违约损失较大时,获得了计算效率提升。与传统基于条件独立性的重要性抽样算法相比,该算法通过适当地扩大占优成分的方差,得到了较好的算法改进。数值结果显示,当违约损失较大时,本文提出的重要性抽样算法估计违约损失概率较为适合。 参考文献 [1] Bassamboo, A., S. Juneja, et al. (2008). Portfolio Credit Risk with Extremal Dependence: Asymptotic Analysis and Efficient Simulation. Operations Research[J] 56: 593-606. [2] Dunkel, J., S. Weber, et al. (2007). Efficient Monte Carlo methods for convex risk measures in portfolio credit risk models . 2007 Winter Simulation Conference[M], Washington, DC. [3] Glasserman, P. (2006). Measuring marginal risk contributions in credit portfolios. Journal of Computational Finance[J] 2(9): 1-41. [4] Glasserman, P. and L. Jingyi (2005). Importance Sampling for Portfolio Credit Risk. Management Science[J] 51(11): 1643-1656. [5] Glasserman, P., K. Wanmo, et al. (2007). Large Deviations In Multifactor Portfolio Credit Risk. Mathematical Finance[J] 17: 345-379. [6] Glasserman, P., K. Wanmo, et al. (2008). Fast Simulation of Multifactor Portfolio Credit Risk.
Operations Research[J] 56: 1200-1217. [7] Grundke, P. (2009). Importance sampling for integrated market and credit portfolio models. European Journal of Operational Research[J] 194(1): 206-226. [8] Gupton, G. M., C. C. Finger, et al. (1997). CreditMetrics technical document[M]. New York, J. P. Morgan & Co. [9] Huang, X. and C. W. Oosterlee (2009). Adaptive integration for multi-factor portfolio credit loss models. Journal of Computational and Applied Mathematics[J] 231(2): 506-516. [10] Kang, W. and K. Lee (2006). Optimization Problems in the Simulation of Multifactor Portfolio Credit Risk. Computational Science and Its Applications – ICCSA[M] 2006: 777-784. [11] Li, D. X. (2000). On Default Correlation: A Copula Function Approach. Journal of Fixed Income [J] 9(4): 43-55. [12] Morokoff, W. J. (2004). An importance sampling method for portfolios of credit risky assets. Simulation Conference . Simulation Conference, 2004[M]. Proceedings of the 2004 Winter. [13] Sak, H., W. Hörmann, et al. (2009). Efficient risk simulations for linear asset portfolios in the t-copula model. European Journal of Operational Research In Press[J], Corrected Proof. [14] Zhiyong, C. and P. Glasserman (2008). Fast Pricing of Basket Default Swaps. Operations Research[J] 56: 286-303.