第 15 卷第 5 期
2012 年 5 月
管 理 科 学 学 报
JOURNAL OF MANAGEMENT SCIENCES IN CHINA
Vol. 15 No. 5
May 2012
股市波动率的短期预测模型和预测精度评价
①
杨 科1,2,陈浪南2
(1. 华南农业大学经济管理学院,广州 510642;2. 中山大学岭南学院,广州 510275)
摘要:基于幂转换以及不设定扰动项的具体相关结构和分布形式,构建了半参数的短期预测
模型来预测中国股市的波动率.模型采用基于极值估计量的两阶段估计法进行估计,估计方法
的小样本性质表现良好.此外,还通过具有 Bootstrap 特性的 SPA 检验实证比较了新模型与其
他 6 种预测模型的预测精度.实证结果表明,在各种损失函数下,半参数短期预测模型是预测
中国股市波动率精度最高的模型.
关键词:已实现波动率;半参数模型;SPA 检验
中图分类号:F830 文献标识码:A 文章编号:1007 - 9807(2012)05 - 0019 - 13
0 引 言
经过多年来众多学者的大量细致研究,股市
波动率的预测模型已有了很大发展,其中 En-
gle[1]提出的 ARCH 模型以及 Taylor[2]提出的随
机波动率(SV)模型,被认为是最集中地反映了金
融数据时间序列方差波动特点的模型,成为现代
经济计量学研究的重点. Bollerslev[3] 修正了
ARCH模型,在 ARCH 模型中加入了条件异方差
的移动平均项,提出了 GARCH 模型.实证结果表
明,GARCH模型能更好地刻画收益率序列残差
项的异方差性. 国外学者利用 GARCH 模型进行
了大量研究,并对该模型进行了扩展和改进. En-
gle、Lilien 和 Robbins将条件标准方差引入均值方
程,进一步提出了 GARCH - M 模型,使期望收益
率与风险紧密联系在一起. Nelson[4]提出指数
GARCH(exponential GARCH. EGARCH)模型,避
免了对参数的非负性假设. Pagan 和 Schwert 发现
相对于非参数模型而言,EGARCH 模型的预测效
果是最好的. Harvey、Ruiz 和 Sentana 提出了结构
性 ARCH(structural ARCH. STARCH)模型.然而,
ARCH族模型和随机波动率模型都是利用收益数
据来估计过去的波动率和预测未来的波动率,而
收益的平方是波动率的噪声估计量,且这两类模
型都需要进行复杂的参数估计,因此这两类模型
对波动率的预测存在较大偏差,均不能直接应用
于高频金融数据.
近几年,用高频分时数据估计波动率即已实
现波动率(realized volatility,后文记为 RV)的方法
开始流行. Andersen 等[5 - 8](后文记为 ABDL)给
出了已实现波动率与已实现协方差的理论解释,
得出已实现波动率的概率极限在一定的条件下为
积分波动率(integrated volatility). 与 ARCH 族模
型和随机波动率模型相比,已实现波动率有两点
优势:1)它可以把波动率当作一个观测到的时间
序列,解决了 ARCH模型和 GARCH模型中的“维
数灾难”问题;2)与收益平方相比,已实现波动率
为积分波动率提供了更加可信的估计.因此,这种
① 收稿日期:2010 - 03 - 22;修订日期:2010 - 09 - 27.
基金项目:国家自然科学基金资助项目(70673116) ;国家社科基金重点资助项目(08ATL007) ;教育部人文社会科学重点研究基地重大资
助项目(05JJD790075) ;广东省自然科学基金资助项目(9151027501000032) ;广东省普通高校人文社会科学重点研究基地资助
项目;北京大学汇丰金融研究院 2009 年资助项目;中山大学“985 工程”产业与区域发展研究创新基地资助项目.
通信作者:陈浪南(1958—) ,男,福建福州人,博士,教授,博士生导师. Email:lnscln@ mail. sysu. edu. cn;lnchen@ xm10000. cn
估计量的改善更加有利于波动率的预测. 按照
ABDL[8]的建模思想,国内对基于高频数据的波
动率预测以及预测模型的评价和比较方面,也做
了一些研究,例如,郭名媛和张世英[9]对赋权已
实现波动率建立了 ARFIMA 模型;根据 Andersen
等的建模思想,唐勇和张世英[10]考虑了单整、分
数维等特征,将模型进行了进一步的扩展,得到了
两类波动率模型:单变量模型为 RV-ARFIMA 和
lnRV-ARFIMA模型,多变量模型为 RV-FIVAR 和
lnRV-FIVAR模型;魏宇[11]基于最新提出的多分
形波动率(multifractal volatility) ,构建了多分形波
动率的 ARFIMA模型,并运用最近提出的 SPA 检
验法,实证比较了多分形波动率模型与现有的如
已实现波动率模型、GARCH 模型以及随机波动
率模型对市场波动率预测能力的优劣;最近,魏
宇[12]以沪深 300 股指期货仿真交易的 5 min高频
数据为例,运用滚动时间窗的样本外预测和 SPA
检验,比较了基于日收益数据的历史波动率模型
和基于高频数据的已实现波动率模型对波动率的
刻画和预测能力.
然而,ABDL 的模型以及国内扩展的模型的
建模动机是与 RV 本身相比,已实现波动率的对
数(后文记为 lnRV)更加近似于正态分布,且 ln-
RV能很大程度上消除条件异方差. 然而,这些模
型都是建立在扰动必须服从正态分布且不存在条
件异方差的假设下的. 通过对上证综指日已实现
波动率的分析,有如下发现:1)尽管 lnRV 的分布
比 RV 更加近似于正态分布,但在所有标准的显
著水平上都拒绝为正态;2)虽然 lnRV 能够部分
消除条件异方差,但仍然存在条件异方差的证据.
因此,用 ABDL的模型来预测我国股市波动率是
不精确的,存在较大的改善空间.
为了克服已实现波动率对数转换的缺陷,本
文按照 Yu 等[13]的思想,对已实现波动率进行幂
转换同时不设定非负扰动部分的相关结构和分布
的具体形式进一步扩展了 Barndorff-Nielsen 和
Shephard[14 - 15]的线性非负模型,构建了已实现波
动率的半参数短期预测模型. 模型采用基于极值
估计量的两阶段估计法进行估计:第 1 步,将非线
性的最小二乘法运用到非标准的对象函数上;第
2 步,采用极值估计量.通过 Monte Carlo 模拟,这
种估计方法的小样本性质表现良好.最后,本文运
用新建立的半参数预测模型对上证综指日波动率
进行了预测并通过 SPA 检验评价和比较了几种
波动率预测模型的预测能力.
1 数据以及已实现波动率的估计
本文研究的数据样本为上证综指(SSEC)从
2000 - 01 - 04 ~ 2008 - 12 - 31 的每 5 min 高频数
据,总共有 2 085 个交易日②. 数据来源于中国经
济研究中心(CCER)股票市场高频数据库. 上海
证券交易所每个交易日 9∶ 30 开盘,到 11∶ 30 中午
休市,然后13∶ 00开盘,到15∶ 00全天收盘,每天共有
4 h(即 240 min)连续竞价交易时间,因此,采用每
5 min记录 1个数据的方法每天可以产生 48个高频
股价记录,样本总体的高频数据量为 100 080个.
假设在一个给定的交易日 t,每笔交易的对
数价格都能观测到,考虑 Λt = {τ0,…,τnt}包括
所有的观察点,假定 pt,i,i = 1,…,nt表示交易日 t
的第 i个对数价格观测值,其中 nt表示交易日 t内
所有观测值的总数.令 rt,i = pt,i - pt,i -1 表示交易
日 t内第 i个时间段上的收益.
已实现波动率〈RV〉定义为所有可以获得的
交易日内高频率收益平方总和的开方,即
〈RV〉t = ∑
nt
i = 0
r2t,槡 i (1)
由于市场微观结构动态通过噪声影响价格过
程,因此在基于金融高频时间序列研究波动率时
不得不考虑微观结构噪声的影响. 式(1)所述的
已实现波动率估计量在不考虑微观结构效应的影
响时,都是积分波动率的无偏估计量,但在考虑微
观结构效应时,就都是有偏的积分波动率估计量
—02— 管 理 科 学 学 报 2012 年 5 月
② 本文选择的这样一段样本区间包含了:2001 年6 月14 日国有股减持办法出台,引发股市单边大幅下挫;2001 年10 月 22 日,暂停国有
股减持;2002 年 6 月 23 日,停止国有股减持,引发 6. 24 井喷;2007 年以来美国次贷危机引发的世界金融危机等一系列重大事件.期间
股价经历了一个比较完整的下跌—上升—再下跌的周期,因此对我国股市的一个较为完整的波动周期具有较好的代表性.
了.目前国外文献处理市场微观结构噪声对已实
现波动率的影响大致有两个方法:1)通过降低或
控制抽样频率来降低微观结构噪声对已实现波动
率的影响;2)通过移动平均滤子、自回归滤子和
核估计量等方法将波动率与微观结构噪声分离,
从而对已实现波动率估计量进行偏差校正.
本文采用 Hansen 和 Lunde[16]的核估计量来
对已实现波动率〈RV〉进行偏差校正
〈RV〉t =
∑
nt
i = 1
r2t,i + 2∑
q
h = 1
1 - hq +( )1 ∑
nt-h
i = 1
rt,i rt,槡 i +h (2)
其中,q表示不大于 4nt( )100 2 /9 的非负整数.
图 1 给出了整个时间区域上的日已实现波动
率和日对数已实现波动率的时间序列图. 表 1 给
出了上证综指已实现波动率估计量〈RV〉以及
〈lnRV〉序列的描述性统计结果.
从表 1 可以看出,上证综指日已实现波动率
〈RV〉的样本峰态系数为 24. 037 2,表明日已实现
波动率的分布是非正态分布.相比之下,日对数已
实现波动率的样本峰度系数和偏度系数都很小,
分别为 0. 341 3和 0. 081 9.这就是要考虑对数—
线性高斯 AR 模型(lnRV-LinAR) (式(9) )的原
因.然而,通过 J-B 统计量分别对〈RV〉和〈lnRV〉
进行正态性检验,发现在所有标准的显著水平下,
两者都拒绝为正态(它们的 p值分别为0. 000 0和
0. 001 9). 这意味着对数 - 线性高斯 AR 模型
(lnRV-LinAR)存在着进一步的改善空间.表 1 还
给出了序列滞后 10,20,30 的 L - B 统计量,发现
〈RV〉和〈lnRV〉都具有显著的相关性.
图 1 上证综指日已实现波动率和日对数已实现波动率:2000 年 - 2008 年
Fig. 1 SSEC daily realized volatilities and logarithmic realized volatilities:2000 - 2008
考虑到〈RV〉和〈lnRV〉序列可能存在单
位根,本文还通过 A D F检验(a u g m e n t e d
di c k e y -f u l l e r t e s t)以及 PP检验(P h i l l i p s -
perrontest)对〈RV〉和〈lnRV〉序列进行了单位
根检验.〈RV〉在整个样本区间上的 ADF统计量
和 PP 统计量分别为 - 7. 379 和 - 16 . 560,
〈lnRV〉在整个样本区间上的 ADF 统计量和 PP
统计量分别为 - 6 . 136 和 - 13 . 590 . 因此,在标
准的显著水平上,〈RV〉和〈lnRV〉序列都拒绝有
单位根.
—12—第 5 期 杨 科等:股市波动率的短期预测模型和预测精度评价
2 已实现波动率的半参数短期预测
模型
2. 1 模型的构建
文献[14]介绍了一个关于波动率 σ2(t)的
连续时间模型,即
dσ2(t)= - λσ2(t)dt + dz(λt) ,λ > 0 (3)
表 1 日已实现波动率和日对数已实现波动率序列
的描述性统计
Table 1 Summary statistics for〈RV〉and〈lnRV〉
参数
已实现波动率相关序列
〈RV〉 〈lnRV〉
均值 0. 011 3 - 4. 655 4
最大值 0. 062 5 - 2. 772 5
偏态系数 1. 665 3 0. 081 9
峰态系数 24. 037 2 0. 341 3
J-B 2 369. 484 0*** 12. 572 5***
Q(10) 10 333. 700 0*** 8 160. 528 0***
Q(20) 17 890. 330 0*** 14 141. 130 0***
Q(30) 213 815. 720 0*** 18 750. 620 0***
注:***代表在 1% 水平下显著;J-B为 Jarque-Bera统计量;
Q(n)为滞后 n期的 Ljung-Box Q统计量
其中 z是具有非负独立增量的 Le’vy过程,保证了
σ2(t)始终为正数(见文献[14]中的式(2) ). 对
式(3)所示的连续时间模型进行欧拉逼近可以得
到下面的离散时间模型
σ2t +1 = ρσ
2
t + Vt+1 (4)
其中,ρ = 1 - λ,Vt+1 = z[λ(t + 1) ]- z(λt)是个
独立同分布的随机变量序列,且分布具有非负的
支撑. Barndorff-Nielsen 和 Shephard[14] 讨论了这
个模型的优点.在 Vt+1 是指数分布的条件下,他们
推导出 ρ的极值估计量的小样本精确分布[18],从
模型(4)的模拟路径发现该模型对真实的已实现
波动率数据拟合得很好. 然而,到目前为止,这个
模型缺乏实证证据.模型(4)还有一个缺陷:由于
模型假设 Vt+1 是独立同分布序列,所以模型不容
许有条件异方差.
Yu等[13] 用更加具有一般性的 Box-Cox转换
代替对数转换进一步扩展了 Taylor[2]的随机波动
率模型,其模型为
h(σ2t,λ)= μ + ρ[h(σ
2
t-1,λ)- μ]+ ηt (5)
其中
h(x,λ)=
(xλ - 1)/λ,λ≠ 0
ln x, λ ={ 0
与对数转换相比,Box-Cox 幂转化提供了一个更
为灵活的可以导出正态分布和消除异方差的方
式. Box-Cox模型的一个很好的优点是几种标准
设定方式都是它的特殊形式,如对数转换(λ =
0)和线性形式(λ = 1).
虽然 Barndorff-Nielsen 和 Shephard[14] 的线
性非负模型和 Yu等的 Box-Cox模型[13]已经被证
明对波动率建模很有用,但至今几乎没有文献阐
述这两个模型在波动率预测方面的用处.
基于模型(4)和模型(5)的缺陷,本文首先
考虑模型(5)的已实现波动率〈RV〉的形式
h(〈RV〉t,λ)=
α + βh(〈RV〉t-1,λ)+ εt,t = 2,…,T (6)
其中,εt 是服从 N(0,σ
2
ε)独立的随机变量序列;
h(x,λ)与模型(5)相同.当λ≠0时,可以将模型
写成下面的形式
〈RV〉λt = (λα + 1)+ β(〈RV〉λt -1 - 1)+ λεt
(7)
其中,〈RV〉λt 是简单的幂转换. 当 λ = 1 时,模型
(6)为线性高斯 AR(1)模型
〈RV〉t = (α + 1)+ β(〈RV〉t-1 - 1)+ εt (8)
当 λ = 0 时模型(6)为文献中经常使用的对数 -
线性高斯 AR(1)模型
〈ln RV〉t = α + β〈ln RV〉t -1 + εt (9)
虽然模型(7)比对数 - 线性高斯 AR(1)模
型(9)更加具有一般性,但模型(7)有两个缺陷:
1)在模型(7)的右边必须以 1 的概率为非负,这
与正态扰动分布的支撑是整个实数相矛盾;2)模
型(7)对转换后的〈RV〉强加了一个 AR(1)结
构.虽然 AR(1)结构在捕捉波动率的动态方面是
典型且最重要的组成部分,但波动率的真实动态
特征应该比它更复杂. Chernov等以及ABDL[8]已
经找到了反对简单的 AR(1)结构的证据. 如在
ABDL的模型中通过增加能够导致长记忆性的分
数积分成分扩展了 AR(1)的设定.
基于模型(7)以上两个缺陷,促使本文建立
—22— 管 理 科 学 学 报 2012 年 5 月
下面形式的已实现波动率的半参数模型
〈RV〉λt = ρ〈RV〉λt -1 + Vt,t = 2,…,T (10)
其中,λ≠ 0,ρ > 0,初始值〈RV〉1 以概率 1大于
0.假定 Vt 是一个 m-dependent③的同分布且具有
非负支撑[γ,∞](γ≥ 0,未知)的连续的随机变
量序列.假定 m∈ N是有限的未知数,即 Vt 的相
关性结构没有设定,其具体的分布形式也没有
设定.
在模型(10)中,扰动项分布具有非负支撑的
限制保证了〈RV〉λt 为正,因此本文建立的半参数
模型不会遇到在经典的 Box-Cox 模型(6)中的截
取问题.当 Vt 是序列相关时,〈RV〉λt 的动态结构
比AR(1)模型的动态结构要复杂,同时如果 Vt的
分布也不设定具体形式,则模型将允许一些非常
灵活的尾部特征. 因此,模型(10)很好地解决了
经典 Box-Cox模型存在的两个缺陷,并且其转化
参数 λ能够减少异方差.
总的来说,模型扰动项的相关结构以及分布
形式都没有具体设定,因此这个半参数模型是由
关于持久性的参数组成部分和关于扰动项的非参
数部分组成.
2. 2 模型的稳健估计及预测
2. 2. 1 ρ的稳健估计
当 λ已知时,采用极值估计量(extreme value
estimator)来估计 ρ,即
ρ^(λ)= min 〈RV〉t
〈RV〉t -
( )
1
{ }λ T
t = 2
(11)
当模型(10)的扰动项是独立的服从指数分
布的随机变量序列时,估计量(11)是 ρ的极大似
然估计量(参见文献[17]).与熟悉的 OLS估计量
一样,极值估计量的一致性不需要假设扰动项要
服从特殊的分布.然而,极值估计量在有些方面要
比OLS估计量好,例如,当 ρ < 1时,极值估计量的
收敛速度要比Op(T
-1 /2)快,而OLS估计量只有在
ρ≥ 1 时收敛速度才比 Op(T
-1 /2)快(参见文献
[20]).另一方面,极值估计量的一致性条件不涉
及到任何高阶矩的存在性,而 OLS 估计量需要这
方面的条件.
命题 1 在给定 λ 的条件下,如果所建立的
已实现波动率的半参数模型满足以下两个条件:
1)λ≠ 0,ρ > 0,初始值〈RV〉1以概率 1大于
0. Vt 是 m-dependent的同分布且非负连续的随机
变量序列.
2)对于所有的0 < c1 < c2 < ∞,模型(10)的
扰动项满足 P(c1 < Vt < c2)< 1 则有:
ⅰ)对于所有的 T,极值估计量 ρ^T(λ) =
min 〈RV〉t
〈RV〉t -
( )
1
{ }λ T
t = 2
是 ρ的具有正偏差的有偏估
计量;
ⅱ)在 T→∞ 时极值估计量 ρ^T(λ) =
min 〈RV〉t
〈RV〉t -
( )
1
{ }λ T
t = 2
有 ρ^T →
a,s
ρ.
命题 1 的条件 1)对于已实现波动率来说是
很容易满足的,而条件 2)对于任何具有无界非负
支撑的扰动项分布都是能满足的. 命题 1 的简单
证明参见附录.
2. 2. 2 ρ和 λ的估计及向前一步预测
在实际应用中,并不知道 λ的真实值,因此本
文运用基于极值估计量的两阶段估计法对模型
(10)的参数 ρ和 λ进行估计.
第 1 步,选择 λ^最小化向前一步预测误差平
方的总和
λ^T = arg min
λ
∑
T
t = 2
[〈RV〉t -〈RV〉t
^
(λ) ]2
其中
〈RV〉t
^
(λ)=
1
T - 1,∑
T
i = 2
[ρ^(λ)〈RV〉λt -1 + V^i(λ) ]
1 /λ
ρ^(λ)= min 〈RV〉t
〈RV〉t -
( )
1
{ }λ T
t = 2
V^i(λ)=〈RV〉λi -ρ^(λ)〈RV〉λi-1
采用这种估计结构,是因为期望当 T很大时,
〈RV〉t
^
(λ^T)很接近 E(〈RV〉t |〈RV〉t -1).事实上,
由模型(10)可以得到〈RV〉t = (ρ〈RV〉λt -1 +
Vt)
1 /λ,对上式两边取期望,有
—32—第 5 期 杨 科等:股市波动率的短期预测模型和预测精度评价
③ m-dependent是指存在一个自然数 m,使得对于所有的 k≥ m,都有 Vt 和 Vt+k 是随机独立的.
E(〈RV〉t | 〈RV〉t -1)=
E[(ρ〈RV〉λt -1 + Vt)
1 /λ | 〈RV〉t -1]
因此当 T 很大时,〈RV〉t
^
(λ^T)很接近 E(〈RV〉t
|〈RV〉t-1).
第 2 步,运用极值估计量来估计 ρ
ρ^T = ρ^(λ^T)= min
〈RV〉t
〈RV〉t -
( )
1
λ^{ }T T
t = 2
在估计 λ时,采用的是最小化向前一步预测
误差平方的总和,当然还存在其他的标准,如最小
化向前一步预测误差绝对值的总和.
最后,运用估计的 λ和 ρ,可以得到模型(10)
的半参数向前一步预测的表达式
〈RV〉fT+1 =
1
T - 1∑
T
i = 2
[ρ^T〈RV〉λ^TT + V^i]
1 / λ^T
其中,V^i =〈RV〉λ^Ti - ρ^T〈RV〉λ^T-1i 是在 i时的残差.
2. 3 小样本性质的Monte Carlo模拟
Barndorff-Nielsen和 Shephard[18] 指出,在扰
动项具有指数分布的非负 AR(1)模型中,参数的
极值估计量服从非标准的、非对称的指数分布.新
建的半参数模型中参数的估计量是基于极值估计
量的两阶段估计法进行估计的,其渐进分布也同
样是非标准的,而且很难获得. 因此本文将采用
Monte Carlo模拟的方法来考察估计量的小样本
性质.
设计两个 Monte Carlo模拟实验,实验的数据
由下面的非负模型产生
〈RV〉λt = ρ〈RV〉λt -1 + ξt + δξt -1,t = 2,…,T
其中,噪声 ξt 是由独立同分布的标准指数分布生
成.参数 λ和 ρ采用前面介绍的基于极值估计量
的两阶段估计法进行估计.
在第 1个 Monte Carlo模拟实验中,设定参数
的真实值为:λ = - 0. 42,ρ = 0. 68 和 δ = 0. 05.
在第 2个 Monte Carlo模拟实验中,设定参数的真
实值为:λ = - 0. 28,ρ = 0. 54 和 δ = 0. 15.考虑
样本大小 T分别为 200、400、800、1 200.这些样本
大小与本文实证研究部分的真实数据的数目比较
接近.表2和表3给出了5 000次Monte Carlo模拟
得到的模拟结果. 从这两个表中可以发现以下几
点结论:1)样本数目 T越小,估计量 λ^T和 ρ^T的样
本偏差越大;2)随着 T值的增加,估计量 λ^T 和 ρ^T
的偏差及标准离差减小. 从模拟结果还可以看出
估计量 ρ^T的偏差也可能为负,这是因为 λ是由 λ^T
估计得到的,而不是事先给定的.图 2 和图 3 给出
了两个Monte Carlo模拟实验模拟5 000次得到的
λ^T 和 ρ^T的柱状图,其中样本大小 T都为 1 200.总
的来说,新建的半参数模型采用基于极值估计量
的两阶段估计法进行估计,估计量的有限样本性
质表现良好,特别是当 T很大时.
表 2 基于极值估计量的两阶段估计法的模拟结果 1
Table 2 Simulation results 1 for the two-step estimation method
估计量
T = 200 T = 400 T = 800 T = 1 200
均值 标准离差 均值 标准离差 均值 标准离差 均值 标准离差
λ^T - 0. 516 8 0. 234 1 - 0. 464 6 0. 170 2 - 0. 415 0 0. 153 1 - 0. 420 1 0. 143 2
ρ^T 0. 626 2 0. 099 3 0. 653 9 0. 076 0 0. 678 3 0. 063 4 0. 680 8 0. 057 5
注:参数 λ和 ρ的真实值分别为 - 0. 42 和 0. 68.模拟结果是通过 5 000 次的 Monte Carlo模拟得到.
表 3 基于极值估计量的两阶段估计法的模拟结果 2
Table 3 Simulation results 2 for the two-step estimation method
估计量
T = 200 T = 400 T = 800 T = 1 200
均值 标准离差 均值 标准离差 均值 标准离差 均值 标准离差
λ^T - 0. 381 3 0. 148 8 - 0. 320 5 0. 095 0 - 0. 269 9 0. 074 3 - 0. 281 2 0. 067 8
ρ^T 0. 460 5 0. 115 1 0. 514 1 0. 092 1 0. 552 7 0. 078 8 0. 542 2 0. 072 9
注:参数 λ和 ρ的真实值分别为 - 0. 28 和 0. 54.模拟结果是通过 5 000 次的 Monte Carlo模拟得到.
—42— 管 理 科 学 学 报 2012 年 5 月
(a)λ^T 的柱状图 (b)ρ^T 的柱状图
说明:参数 λ和 ρ的真实值分别为 - 0. 42 和 0. 68,模拟结果是通过 5 000 次的 Monte Carlo模拟得到,样本大小均为 T = 1 200
图 2 λ^T 和 ρ^T 的柱状图
Fig. 2 Histograms of λ^T and ρ^T
(a)λ^T 的柱状图 (b)ρ^T 的柱状图
说明:参数 λ和 ρ的真实值分别为 - 0. 28 和 0. 54,模拟结果是通过 5 000 次的 Monte Carlo模拟得到,样本大小均为 T = 1 200
图 3 λ^T 和 ρ^T 的柱状图
Fig. 3 Histograms of λ^T and ρ^T
3 预测精度比较
3. 1 其他已实现波动率的预测模型
虽然基于高频数据的波动率预测建模的研究
还处于初步探索阶段,但理论界还是已有一些研
究比较活跃的波动率的高频预测模型,其中比较
早的有指数平滑模型(exponential smoothing,
ES) ,它是比较简单的预测模型,它对已实现波动
率的向前一步预测模型为
〈RV〉fT+1 = (1 - α)〈RV〉T + α〈RV〉
f
T
= (1 - α)∑
T-1
i = 0
αi〈RV〉T-i (12)
其中,0 < α < 1.指数平滑方程(12)可以理解为
已实现波动率形式的 Risk Metrics,即用〈RV〉T 代
替 R2T(收益平方).在收益的条件分布为正态假设
下,R2T 是 σ
2
T 瞬时点波动率的无偏估计量. Risk
Metrics方法推荐对于日数据使用 α = 0. 94,对于
月数据使用 α = 0. 97.
为了考虑 lnRV 的长期记忆性,ABDL[8] 将
—52—第 5 期 杨 科等:股市波动率的短期预测模型和预测精度评价
lnRV描述为 ARFIMA(p,d,q)过程. 他们发现这
个模型对已实现波动率的预测效果要比一些基于
收 益 平 方 的 标 准 方 法 的 预 测 效 果 要 好
(如GARCH(1,1)、Risk Metrics). 已实现波动率
对数的 ARFIMA(p,d,q)模型(lnRV-ARFIMA)
可以表述为
Φ(L)(1 - L)d(〈ln RV〉t - μ)= Θ(L)εt (13)
其中
Φ(L)= 1 - 1L - 2L
2 - … - pL
p,
Θ(L)= 1 + θ1L + θ2L
2 + … + θqL
q
分别为自回归滞后 p阶算子以及移动平均滞后 q
阶算子,L为滞后算子,(1 - L)d为分数差分算子,
μ是〈ln RV〉t 的均值. 同时假定 εt 是相互独立且
服从正态分布 N(0,σ2ε)的随机变量序列.
3. 2 预测方法
对上面讨论的 7 种已实现波动率模型(即新
建的半参数模型、ES、RV-LinAR、lnRV-LinAR、
ARFIMA(1,d,0)、ARFIMA(2,d,0)、ARFIMA
(1,d,1) )进行滚动时间窗④的“样本外预测能力
检验”.
首先将数据样本总体(t = 1,2,…,N)划分
为“估计样本”(sample for estimation)和“预测样
本”(sample for predicting)两部分. 其中估计样
本包含 H个交易日数据,而预测样本包含最后 M
个交易日数据,本文将上证综指 2000 -01 -04 ~
2005-12-30共 1 380个交易日的观察数据设定为
估计样本用来预测2006-01-04 ~ 2008-12-31共
705 个交易日的波动率. 然后将估计窗口固定为
H,利用观察值[1 + t ∶ (H + t) ]M-1t = 0 重新估计模型,
得到 M个预测值.
不同的已实现波动率模型,都获得了 M 个未
来的日间市场波动率预测,记为〈RV〉fm,m = H +
1,H + 2,…,H + M.将式(2)得到的在预测样本区
间的已实现波动率估计记为〈RV〉m,m = H + 1,
H +2,…,H + M,并以此作为真实市场波动率的
代理(proxy) ,用以评价各类波动率模型的预测精
度.图 4 是本文构建的已实现波动率半参数预测
模型在预测样本区间(2006 -01 -04 ~ 2008 -12 -
31,共 705 个)的波动率预测结果与式(2)得到的在
预测样本区间上已实现波动率的估计值的对比图.
图 4 已实现波动率半参数模型在预测样本区间的预测结果
Fig. 4 Forecasting results for semiparametric model during forecasting sample
3. 3 预测评价和比较
有了对市场波动率的预测值以后,就可以比
较模型预测值与真实市场波动率的代理
—〈RV〉m 的偏差究竟有多大. 然而,用哪一种损
失函数作为衡量预测误差的标准最为合理,学术
界尚未达成共识. Hansen和 Lunde[17]建议可以尽
可能多地采用不同形式的损失函数来作为预测模
型精度的判断标准.基于这样的思考,首先采用 4
种不同的损失函数来分别作为各类已实现波动率
模型预测精度的评价标准.
这 4种损失函数分别记为 Li,i = 1,2,3,4,L1
和 L2 分别为平均误差平方(mean square error,
MSE)和平均绝对误差(mean absolute error,
MAE) ,它们是此类判断中最常用的两类损失函
数形式,L3 和 L4 分别是平均百分比误差平方
(mean square percentage error,MSPE)和平均绝
对百分比误差(mean absolute percentage error,
MAPE) ,它们是经异方差调整的 MSE和 MAE.假
设〈RV〉fkm,m = H + 1,H + 2,…,H + M表示模型
k在预测区间 m 对已实现波动率的预测值,定义
—62— 管 理 科 学 学 报 2012 年 5 月
④ 魏宇和余怒涛[22] 介绍了滚动时间窗.
ekm =〈RV〉m -〈RV〉
f
km为相应的预测误差.则这4
种损失函数的具体定义为
L1 =
1
M∑
H+M
m = H+1
e2km,
L2 =
1
M∑
H+M
m = H+1
| ekm |,
L3 =
1
M∑
H+M
m = H+1
ekm
〈RV〉( )m
2
,
L4 =
1
M∑
H+M
m = H+1
| ekm〈RV〉m |
(14)
当计算预测误差时,一般都简单假设〈RV〉m
是在预测区间m上的真实市场波动率.然而,在现
实中,市场波动率的代理〈RV〉m 并不是真实的潜
在波动率. Patton[22] 指出当运用条件无偏但不完
备的波动率代理代替真实波动率比较评价各类波
动率模型预测精度时,会导致意想不到的结果.因
此本文在考虑以上 4 类损失函数基础上,进一步
采用 Patton建立的一类对存在噪声的波动率代理
变量是同质的而且是稳健的损失函数,为
L5 ∶ L(〈RV〉m,〈RV〉
f
km,b)=
1
M∑
H+M
m = H+
[
1
1
(b + 1) (b + 2)(〈RV〉
(b+2)
m -(〈RV〉
f
km)
b+2)-
1
(b + 1)(〈RV〉
f
km)
b+1(〈RV〉m -〈RV〉
f
m ]) ,b≠- 1,- 2
1
M∑
H+M
m = H+1
〈RV〉fkm -〈RV〉m +〈RV〉m ln
〈RV〉m
〈RV〉f( )km ,b = - 1
1
M∑
H+M
m = H+1
〈RV〉m
〈RV〉fkm
- ln
〈RV〉m
〈RV〉fkm
-( )1 , b = -
2
(15)
需要指出的是,如果在一次研究中发现:采
用某种损失函数作为判断标准,得到了模型 A 比
模型 B的预测误差值小的话,那只能判断为,在这
样一个特定的数据样本中,采用这一特定的损失
函数时,模型 A比模型 B 的预测精度高.很明显,
这一判断是不稳健的,且无法推广到其他类似的
数据样本或者其他的损失函数判断标准. 为了解
决这一问题,Hansen和 Lunde[17] 提出了“高级预
测能力检验法”(SPA) ,他们研究证明,SPA检验
比类似的 White[24] 提出的 reality check(RC)检
验具有更加优异的模型判别能力,且 SPA 检验的
结论具有更好的稳健性.
SPA检验过程如下:首先,假定有 J + 1 种类
型的已实现波动率模型,记为 Mk,k = 0,1,…,J.
每种波动率模型 Mk 得到的未来一天的波动率预
测为〈RV〉fkm,其中m = H + 1,H + 2,…,H + M.对
每一个预测值,可以计算式(14)所定义的 4 种常
见的损失函数值,记为 Li,k,m,其中 i = 1,2,3,4.另
外还可以根据式(15)计算当 b = 1,- 1,2,- 2,
3,- 3,4,- 4时的稳健损失函数值,记为 Li,k,m,其
中 i = 5,6,…,12.用 M0 表示作为 SPA检验的基
础模型(即用该模型作为与其他模型的预测表现
进行对比检验的基础) ,因此,对于其他的 k = 1,
2,…,J种类型已实现波动率模型,可以计算其相
对于基础模型 M0 的相对损失函数值,记为
dk,m = Li,0,m - Li,k,m (16)
需要验证在模型Mk(k = 1,2,…,J)中,是否
存在比基础模型 M0 表现更好的模型. 为此,可以
定义零假设H0为:与对比模型Mk(k = 1,2,…,J)
相比,基础模型 M0 是表现最好的预测模型. 假设
dm = (d1,m,d2,m,…,dJ,m)',令 u≡ E(dm) ,则这一
零假设的数学表达式为
H0 ∶ u≤ 0
Hansen和 Lunde 证明了上述假设检验的检
验统计量为
TSPAM = max maxk = 1,2,…,J
M1 /2dk
ω^k
,[ ]0 (17)
其中
dk = M
-1∑
H+M
m = H+1
dk,m,ω^
2
k = Var(M
1 /2dk)
为获得 TSPAM 检验量的分布状况及其 p 值,Hansen
和 Lunde建议采用“自举法”(bootstrap)来获得.
简言之,SPA检验的 p值越大,则表明越不能
拒绝所定义的零假设 H0,说明基础模型的预测精
—72—第 5 期 杨 科等:股市波动率的短期预测模型和预测精度评价
度越高.
表4给出了各种已实现波动率模型在12种损
失函数下的预测精度,其中包括 4 种常用的损失
函数以及 8 种稳健的损失函数. 从表中可以发现
以下几个结论:1)各类预测模型在不同的损失函
数下,其预测精度排名次序是不尽相同的. 例如,
ES 模型在损失函数 MAE、MAPE、MSE、MSPE
下排名为 4,而在稳健损失函数 b = - 3和 b = - 4
下却排名为 2;2)3 种已实现波动率对数的
ARFIMA(p,d,q)模型(lnRV-ARFIMA)在各种
损失函数下,预测精度都比较低,这说明
lnRV-ARFIMA 模型不能很好地刻画已实现波动
率本身的波动特征;3)半参数模型在各种损失函
数下,预测精度都很高,其排名基本上都为 1.
表 4 在不同损失函数下,各类已实现波动率模型的预测精度以及排名
Table 4 Forecasting performance of the competing models under 12 different accuracy measures
模型
MAE MAPE MSE MSPE
数值 /103 排名 数值 排名 数值 /105 排名 数值 排名
ES 4. 506 4 4 0. 280 0 4 4. 104 5 4 0. 133 8 4
LinGau 4. 026 8 2 0. 225 6 3 3. 796 8 2 0. 126 6 3
LogGau 4. 080 7 3 0. 220 3 1 4. 026 3 3 0. 113 9 1
ARFIMA(2,d,0) 4. 925 4 5 0. 289 9 5 6. 341 6 5 0. 356 8 5
ARFIMA(1,d,0) 5. 219 6 6 0. 309 9 6 6. 767 1 6 0. 373 7 6
ARFIMA(1,d,1) 10. 290 7 0. 650 8 7 96. 955 0 7 4. 740 1 7
半参数 3. 957 6 1 0. 223 6 2 3. 691 5 1 0. 117 4 2
模型
b = 1 b = - 1 b = 2 b = - 2
数值 /107 排名 数值 /103 排名 数值 /108 排名 数值 /102 排名
ES 4. 565 3 4 1. 034 9 3 1. 131 1 5 5. 956 0 3
LinGau 4. 246 0 2 0. 975 9 2 1. 083 0 2 5. 815 0 2
LogGau 4. 385 0 3 1. 059 2 4 1. 085 5 3 6. 456 0 4
ARFIMA(2,d,0) 9. 988 0 5 1. 323 0 5 3. 923 2 4 7. 815 2 5
ARFIMA(1,d,0) 10. 610 0 6 1. 419 2 6 4. 151 4 6 8. 410 0 6
ARFIMA(1,d,1) 1 158. 000 0 7 5. 550 8 7 4 265. 200 0 7 33. 151 0 7
半参数 4. 126 5 1 0. 945 2 1 1. 046 3 1 5. 613 5 1
模型
b = 3 b = - 3 b = 4 b = - 4
数值 /1010 排名 数值 排名 数值 /1012 排名 数值 /10 -2 排名
ES 3. 118 3 3 4. 014 5 2 9. 564 2 3 3. 283 9 2
LinGau 3. 119 0 4 4. 054 0 3 10. 019 0 5 3. 328 1 3
LogGau 3. 029 8 2 4. 617 1 4 9. 452 7 1 3. 908 0 4
ARFIMA(2,d,0) 18. 154 0 5 7. 649 4 5 94. 030 0 7 13. 807 0 6
ARFIMA(1,d,0) 19. 154 0 6 8. 144 4 6 9. 905 5 4 14. 306 5 5
ARFIMA(1,d,1) 186. 860 0 7 79. 653 7 7 88. 506 0 6 373. 317 2 7
半参数 2. 983 6 1 3. 925 8 1 9. 478 0 2 3. 267 4 1
注:该表是基于从 2006 -01 -04 ~ 2008 -12 -31,共 705 个向前一步预测得到.
—82— 管 理 科 学 学 报 2012 年 5 月
表5是经过10 000次bootstrap模拟过程后得到
的 SPA检验结果,表 5中第 1列表示各种损失函数,
第 2列是基础模型(本文为半参数模型),表中数字
为 SPA检验的 p值.在某一损失函数的判断标准下,
如果基础模型相对于其他模型的 SPA检验 p值越大
(越接近于 1),表明该模型的预测精度越高.从表 5
可以看出:对中国股市而言,已实现波动率的半参数
预测模型是预测精度最高的波动率模型,在各种损
失函数下,它比 3种已实现波动率对数 ARFIMA(p,
d,q)模型(lnRV-ARFIMA)的预测精度要高.
表 5 不同已实现波动率模型的 SPA检验结果
Table 5 SPA results for different realized volatility models
损失
函数
基础
模型
对比模型
LinGau LogGau ARFIMA(2,d,0) ARFIMA(1,d,0) ARFIMA(1,d,1) ES
MSE
MAE
MSPE
MAPE
半参数
0. 989 7 1. 000 0 0. 999 4 0. 999 9 0. 955 8 0. 931 3
0. 999 3 1. 000 0 1. 000 0 1. 000 0 1. 000 0 1. 000 0
0. 902 5 0. 188 8 0. 919 2 0. 999 9 0. 916 2 0. 999 8
0. 904 1 0. 146 4 1. 000 0 1. 000 0 0. 999 9 0. 946 7
稳健
函数
基础
模型
对比模型
LinGau LogGau ARFIMA(2,d,0) ARFIMA(1,d,0) ARFIMA(1,d,1) ES
b = 1
b = - 1
b = 2
b = - 2
b = 3
b = - 3
b = 4
b = - 4
半参数
0. 948 3 0. 882 4 0. 996 9 0. 983 2 0. 913 3 0. 932 2
0. 999 9 1. 000 0 0. 993 3 1. 000 0 0. 999 8 1. 000 0
0. 925 9 0. 528 1 0. 993 4 0. 961 3 0. 911 5 0. 844 5
1. 000 0 1. 000 0 0. 906 2 1. 000 0 1. 000 0 0. 999 9
0. 926 6 0. 257 1 0. 988 3 0. 945 1 0. 910 1 0. 867 7
0. 994 4 0. 999 9 0. 865 7 0. 998 5 0. 993 6 0. 999 9
0. 934 5 0. 158 6 0. 982 3 0. 936 2 0. 908 9 0. 909 0
0. 715 5 0. 996 9 0. 887 9 0. 961 3 0. 972 8 0. 945 6
注:表中数字为10 000次 bootstrap模拟过程后得到的 SPA检验 p值. p值越大,表明与所考察的对比模型相比,基础模型的表现越好.
4 结束语
本文在考察上证综指日已实现波动率特征的
基础上,构建了简单的半参数时间序列模型来预
测中国股票市场的波动率. 新的模型将非负的扰
动项和灵活的 Box-Cox 幂转换很好的结合在一
起,幂转换用来减少异方差,而非负的扰动项解决
了经典的 Box-Cox 模型中存在的截取问题. 模型
不设定扰动项的具体相关结构,使得模型刻画的
已实现波动率动态结构比 AR(1)模型的动态结
构复杂得多,同时模型还不设定扰动项的具体分
布形式,使得模型还能允许一些非常灵活的尾部
特征.因此,本文构建的模型很好地解决了经典的
Box-Cox 模型中存在的问题,克服了经典的已实
现波动率预测模型(ABDL的模型)需要设定扰动
项具体结构以及不能存在异方差的缺陷. 并且本
文的模型所要估计的参数非常少,仅仅涉及到两
个参数的估计.模型采用基于极值估计量的两阶
段估计法进行估计,通过 Monte Carlo模拟,发现这
种估计方法的有限样本性质表现良好.本文模型为
预测波动率提供了一个更为灵活和精确的方法.
本文还运用 Hansen 和 Lunde 提出的对波动
率模型预测能力的 SPA 检验法,在各种评价标准
下(包括稳健损失函数在内的 12 种损失函数) ,
实证考察了已实现波动率的半参数模型以及指数
平滑模型,对数长记忆 ARFIMA 模型等 7 个模型
对中国股市波动率的刻画和预测能力. 实证结果
显示,对中国股市而言,已实现波动率的半参数预
测模型是预测精度最高的波动率模型,在各种损
失函数下,它比其他 6 种已实现波动率模型的预
测精度要高.
—92—第 5 期 杨 科等:股市波动率的短期预测模型和预测精度评价
参 考 文 献:
[1]Engle R F. Autoregressive conditional heteroskedasticity with estimates of the variance for U. K. infortion[J]. Econometri-
ca,1982,50(3) :987 - 1007.
[2]Taylor S J. Modelling stochastic volatility[J]. Mathematica Finance,1994,4(2) :183 - 204.
[3]Bollerslev T. Generalized autoregressive conditional heteroskedasticity[J]. Journal of Econometrics,1986,31(2) :307
- 327.
[4]Nelson D. Conditional heterskedasticity in asset returns:A new approach[J]. Econometrica,1991,59(2) :347 - 370.
[5]Andersen T G,Bollerslev T,Diebol F X,et al. Exchange rate returns standardized by realized volatility are(nearly)gaussi-
an[J]. Multinational Finance Journal,2000,4(3) :159 - 179.
[6]Andersen T G,Bollerslev T,Diebol F X,et al. The distribution of realized exchange rate volatility[J]. Journal of the Amer-
ican Statistical Association,2001,96(3) :42 - 55.
[7]Andersen T G,Bollerslev T,Diebol F X,et al. The distribution of realized stock return volatility[J]. Journal of Financial
Economics,2001,61(5) :43 - 76.
[8]Andersen T G,Bollerslev T,Diebol F X,et al. Modelling and forecasting realized volatility[J]. Econometrica,2003,71
(2) :579 - 625.
[9]郭名媛,张世英. 赋权已实现波动及其长记忆、最优抽样频率选择[J]. 系统工程学报,2006,21(6) :568 - 573.
Guo Mingyuan,Zhang Shiying. Weighted realized volatility and its long memory and optimal frequency[J]. Journal of Sys-
tems Engineering,2006,21(6) :568 - 573. (in Chinese)
[10]唐 勇,张世英. 金融高频数据的加权已实现极差波动及其实证分析[J]. 系统工程,2006,24(8) :52 - 57.
Tang Yong,Zhang Shiying. Weighted realized range-based volatility based on high-frequency data and its empirical analysis
[J]. Systems Engineering,2006,24(8) :52 - 57. (in Chinese)
[11]魏 宇. 金融市场的多分形波动率测度、模型及其 SPA检验[J]. 管理科学学报,2009,12(5) :88 - 99.
Wei Yu. Multifractal volatility measure,its model and SPA test in financial market[J]. Journal of Management Sciences in
China,2009,12(5) :88 - 99. (in Chinese)
[12]魏 宇. 沪深 300 股指期货的波动率预测模型研究[J]. 管理科学学报,2010,13(2) :66 - 76.
Wei Yu. Volatility forecasting models for CSI300 index futures[J]. Journal of Management Sciences in China,2010,13
(2) :66 - 76. (in Chinese)
[13]Yu Jou,Yang Zhenlin. A Class of Nonlinear Stochastic Volatility Models[R]. Auckland:University of Auckland,2002.
[14]Barndorff-Nielsen O E,Shephard N. Non gaussian ornstein-uhlenbeck-based models and some of their uses in financial eco-
nomics[J]. Journal of the Royal Statistical Society,Series B,2001,63(2) :167 - 241.
[15]Barndorff-Nielsen O E,Shephard N. Econometric analysis of realized volatility and its use in estimating stochastic volatility
models[J]. Journal of the Royal Statistical Society,Series B,2002,64(2) :253 - 280.
[16]Hansen P R,Lunde A. Realized variance and market microstructure noise[J]. Journal of Business and Economic Statis-
tics,2006,24(2) :127 - 218.
[17]Hansen P R,Lunde A. A forecast comparison of volatility models:Does anything beat a GARCH(1,1) [J]. Journal of Ap-
plied Econometrics,2005,20(7) :873 - 899.
[18]Barndorff-Nielsen O E,Shephard N. Likelihood analysis of a first-order autoregressive model with exponential innovations
[J]. Journal of Time Series Analysis,2003,24(3) :337 - 344.
[19]Goncalves S,Meddahi N. Box-cox Transforms for Realized Volatility[R]. Montreal:Department de Sciences
Economiques,University de Montreal,2006:1 - 30.
[20]Phillips P C B. Time series regression with a unit root[J]. Econometrica,1987,55(2) :277 - 301.
[21]Bell C,Smith E. Inference for non-negative autoregressive schemes[J]. Communications in Statistics:Theory and Meth-
ods,1986,15(8) :2267 - 2293.
—03— 管 理 科 学 学 报 2012 年 5 月
[22]魏 宇,余怒涛. 中国股票市场的波动率预测模型及其 SPA检验[J]. 金融研究,2007,(7) :138 - 150.
Wei Yu,Yu Nutao. Volatility forecasting models and SPA test in Chinese stock market[J]. Journal of Financial Research,
2007,(7) :138 - 150. (in Chinese)
[23]Potton A J. Volatility forecast comparison using imperfect volatility proxies[J]. Journal of Econometrics,2011,160(1) :
246 - 256.
[24]White H. A reality check for data snooping[J]. Econometrica,2000,68(3) :1097 - 1126.
Short-term volatility forecast model and its performance evaluation
YANG Ke1,2,CHEN Lang-nan2
1. College of Economics & Management,South China Agricultural University,Guangzhou 510642,China;
2. Lingnan College,Sun Yat-sen University,Guangzhou 510275,China
Abstract:A semiparametric time series model through power transformation and not setting the dependency
structure and distributional form of its error component is proposed to forecast the volatility in Chinese stock
markets. The model is estimated by an extreme value estimator based the two-stage estimation method and this
estimation method works fairely well in finite samples. In addition,a bootstrap SPA test is used to evaluate the
predicting accuracy for the proposed model and other 6 models. The empirical results show that,under various
loss functions,the proposed model is the best model for volatility forecasts among the 6 models in Chinese
stock markets.
Key words:realized volatility;semiparametric model;SPA test
附录:
命题 1 的证明
由模型(10)有
ρ =
〈RV〉λt
〈RV〉λt-1
-
Vt
〈RV〉λt-1
,t = 2,…,T
从而有
ρ^T = ρ + min
Vt
〈RV〉λt-
{ }
1
T
t = 2
= ρ + RT
由于 Vt 是非负的连续的随机变量序列(命题 1 条件
1) ) ,则有 P(RT ≤ 0)= 0,因此 ρ是具有正偏差的有偏估
计量.令 T≥ m + 1,对于给定的 ε > 0,有
P(RT > ε)= P(Vt ≥ ε〈RV〉λt-1;t = 1,…,T)
≤ P(V(2i-1)m+1 > ε〈RV〉λ(2i-1)m;i = 1,…,N)
其中,N(T)= [12 (
T - 1
m + 1) ],[x]表示不大于 x的最
大整数,则 N(T)∈[0,T) ,且当 T→∞ 时,N(T)也趋于
无穷大.
由模型(10)进一步可以得到
〈RV〉λl = ρ
l〈RV〉λ0 +∑
l-1
j = 0
ρjVl-j
其中,l = (2i - 1)m,从而有
P(RT > ε)≤
P(V(2i-1)m+1 > ερ
m-1V(2i-2)m+1;i = 1,…,N)
令 Wi =
V(2i-1)m+1
V(2i-2)m+1
,则{Wi}
N
i = 1 是一个 i. i. d 随机变量
序列,且每个Wi的分子和分母都是随机独立的,因此上式
可以进一步改写为
P(RT > ε)≤ P(W1 > ερ
m-1)N
= P(Vm+1 > τV1)
N
其中 τ = ερm-1 .运用 Bell和 Smith[20]的引理和N(T)的极
限性质,可以得到
lim
T→∞
P(RT ≥ ε)= 0
因为 ε > 0是任意的,则当 T→∞,RT 依概率收敛于
0. 又因为序列{R}T是单调的,即 P{RT+1 ≤ RT}= 1,由此
可以推出 T→ ∞ 时有 ρ^T→
a,s
ρ. 证毕.
—13—第 5 期 杨 科等:股市波动率的短期预测模型和预测精度评价