不同抽样频率波动模型的预测精度比较
摘要:以上证综指和标准普尔500指数为例,构建了基于不同抽样频率股价数据的波动模
型,然后运用样本外的滚动时间窗法实证计算了各波动模型对未来市场波动率的预测值,最后
运用具有bootstrap特性的SPA检验法实证检验了各波动模型的预测精度差异。研究结果表
明,基于低频数据的波动模型对股市波动率的预测精度远远落后于基于高频数据的波动模型,
使用高频数据有助于对市场波动率的精确预测。
关键词:高频股价数据;GARCH族模型;实现波动率模型;SPA检验
中图分类号:C93;F830.9 文献标识码:A 文章编号:1672884X(2010)08125805
﹤┄│┅┇┈┄┃┄﹨┄┇┈┉┃﹢━┉┎┄┄━┉━┉┎┄━┈┌┉﹥┇┃┉﹨┇┆┊┃┎
WANGPeng WEIYu
(SouthwestJiaotongUniversity,Chengdu,China)
﹢┈┉┇┉:Whetherhighfrequencyfluctuationsinstockpricedataishelpfultoimprovethepre
dictionaccuracyistheforefrontissueofacademic.TakingtheSSECindexandSP500indexassam
ple,wecomputethevolatilitypredictingresultsbasedonvolatilitymodelswithdifferentsamplingfre
quencyandoutofsamplerollingtimewindowsmethod.UsingbootstrappingSPAtest,wecompare
thepredictingperformanceofdifferentvolatilitymodels.Theempiricalresultsshowthat,considering
theskewed,leptokurtic,andfattaileddistributioninstockmarketreturns,volatilitymodelbasedon
highfrequencyreturndataoutperformsmodelswithdailyreturndatawhenvolatilitypredictionaccu
racyisconcerned.
┎┌┄┇┈:highfrequencyreturndata;GARCH volatilitymodels;realizedvolatilitymodel;
SPAtest
收稿日期:20080602
基金项目:国家自然科学基金资助项目(70501025,70771097)
对金融资产波动率的研究是现代金融理论
的核心内容之一。由于波动率不仅是金融风险
资产的决定因素,还是金融衍生产品定价中的
一个关键参数,因此能否对市场波动做出准确
的刻画和预测,直接关系到风险管理的有效性
和衍生产品定价的合理性等重要问题。
传统波动模型(如GARCH、EGARCH等)
的构建往往是基于抽样频率较低的历史股价数
据,如每日、每周甚至是每月[1~4]。然而,Ander
senandBollerslev的研究指出[5],使用日内高
频股价数据(常见的有每5min、每10min等)可
以获得对日波动率更精确的描述,并由此建立
了一种基于高频股价数据的波动率测度——实
现波动率(realizedvolatility,RV)。国内外很多
学者对不同金融市场RV的统计特性进行了深
入研究[6~8]。ANDERSEN等[9]的研究发现,在取
自然对数后,对数实现波动率(lnRV)的动力学
特征可以通过自回归分整移动平均过程ARFI
MA(牘,牆,牚)来刻画,这种对于波动率的刻画方
式称为lnRVARFIMA模型。
从本质上讲,由于高频数据中蕴含了比低
频数据更多的市场波动信息,因此基于高频数
据的波动率测度一定是一种更为真实的市场波
动描述[5,10],但基于高频数据的波动模型是否一
定可以获得比低频数据模型更优的波动率预测
精度,现有的实证研究对此未能取得一致结
论[11~13]。
基于以上认识,本文以新兴资本市场和成
熟资本市场的代表性股价指数——上证综指
(SSEC)和标准普尔500指数(SP500)的数据样
本为例,通过构建基于低频数据的GARCH类
波动模型和基于高频数据的实现波动率模型,
·8521·
第7卷第8期
2010年8月
管 理 学 报
ChineseJournalofManagement
Vol.7No.8
Aug.2010
并进一步运用较传统的损失函数法更为稳健的
SPA检验法,对比检验上述 2类波动模型对股
票市场真实波动率的预测精度差异。
1 数据
本研究使用的样本为SSEC和SP500指数
2001年3月1日~2006年10月10日的每5min
高频股价数据①。其中,SSEC共有1354个交易
日,SP500共有1411个交易日。采用每5min记
录一个数据的方法,SSEC和SP500每天分别可
以产生48个和80个高频股价记录(不包括收盘
价),样本区间内SSEC和SP500的高频股价数
据总量分别在6.5万个和11.3万个左右。
本文选择的SSEC样本区间包括:2001年2
月末中国证监会决定B股市场向境内开放,随
后中国股市开始一波向上行情;2001年6月14
日国有股减持办法出台,引起股市单边大幅下
挫;2005年6月,SSEC见底998.23点;2006年,
中国股市又以单边上行之势稳步攀升。同时,美
国股市在 2001年上半年呈震荡上行之势;而
9.11事件及后来的经济衰退导致SP500指数在
2001年下半年至 2003年第一季度间下跌了
30%左右;2003年第二季度至2006年10月,随
着美国经济逐渐回暖,SP500指数又保持了稳
步攀升态势。由此,样本期间内两国股市都经历
了一个较为完整的上升下跌上升周期。
若将第牠天的每5min高频股价数据记为
爤牠,牆,则SSEC和SP500第牠天的日收益率爲牠和高
频收益率爲牠,牆可表示为
爲牠= 100(ln爤牠,牅- ln爤牠-1,牅), (牠= 2,3,…,爫),(1)
爲牠,牆= 100(ln爤牠,牆- ln爤牠,牆-1), (牆= 1,2,…,爟),(2)
式中,爤牠,牅表示第牠天的收盘价。对于SSEC,爫=
1354,爟=48;对于 SP500,爫=1411,爟=80。
按照惯例[14],使用日收益率的平方爲2牠作为市场
真实波动率的代理变量,即某一模型的预测值
若越接近爲2牠,则该模型的预测能力就越强。表1
是对SSEC和SP500日收益率序列的描述性统
计结果。
表 SSEC和SP日收益率序列的描述性统计结果
SSEC SP500
均 值 -0.007 0.006
标准差 1.351 1.085
偏度系数 0.662(0.000) 0.114(0.080)
峰度系数 5.528(0.000) 2.584(0.000)
爥爜 1823(0.000) 395(0.000)
爯(30) 40.808(0.090) 57.899(0.002)
注:表中的,峰度系数为超额峰度;爥爜为 JarqueBera统计量值;
爯(30)为LjungBox爯统计量滞后30阶的值;括号中是对应检验的牘
值。
由表1可以看出,两指数的日收益序列都
表现出明显的有偏和尖峰胖尾特征,同时序列
之间具有显著的自相关性(两序列的爯(30)统
计量都非常显著)。另外,通过比较标准差、偏度
系数、峰度系数等统计量还可以看出,在中国股
票市场这样的新兴资本市场当中,市场的波动
较成熟资本市场更为剧烈。
2 基于低频数据的GARCH族波动模型
在金融计量研究中,日收益率爲牠常被假定
为满足如下形式
爲牠= 犨牠+ 犡牠= 犨牠+ 犲牠牫牠, (3)
式中,犨牠为收益率的条件均值;犲2牠为收益率的条
件方差;新生量牫牠是一个满足均值为0、方差为1
的独立同分布的随机变量。由于犨牠一般很小,因
此在实证研究中假定其为零。
为了准确刻画指数日收益率分布所展现出
的非对称或有偏的尖峰胖尾形态,本文采用文
献中常用的EGARCH(1,1)模型为 犲2牠建模,同
时假定牫牠服从“有偏的学生分布”(skewedstu
dentdistribution,skewed牠)。
EGARCH(1,1)模型假定 犲2牠服从以下过
程:
ln犲2牠=犽+犜牫牠-1+犝ln犲2牠-1+犞(燏牫牠-1燏-爠燏牫牠-1燏), (4)
式中,犞为“非对称杠杆系数”。若犞>0,则表明
与相同程度的前一期正收益相比,前一期的负
收益将导致本期更高的波动性。
skewed牠分布的概率密度函数可表示为
牊(牫牠燏犪,牅)=
2
犪+1燉犪牞牋[犪(牞牫牠+牔)燏牅], (牫牠<-
牔
牞);
2
犪+1燉犪牞牋[犪(牞牫牠+牔)燉犪燏牅], (牫牠≥-
牔
牞
烅
烄
烆 ),
(5)
式中,牋(牋燏牅)为标准对称牠分布(均值为0,方差
为1)的概率密度函数;牅为自由度,牅越小,表明
该收益分布的尖峰胖尾特征越明显;犪为非对
称系数,若ln犪>0,则表明牫牠的分布右偏,反之
表明牫牠的分布左偏;牔和牞分别为该skewed牠分
布的均值和标准差:
牔=
槡牰[(牅- 1)燉2] 牅- 2
槡犮牰(牅燉2)
(犪- 1燉犪), (6)
牞= 犪2+ 1燉犪2槡 - 1- 牔2。 (7)
·9521·
不同抽样频率波动模型的预测精度比较——王 鹏 魏 宇
① 由于计算指数时运用了若干种股票的价格,因此,这里
其实是把指数看作一种投资组合。这样做需要一个较强假设:整
个样本期间内,投资组合中各种股票所占权重并不发生变化。尽
管这一假设在现实中并不总是成立,但由于风险管理、最优投资
组合选择等众多金融领域的操作大都是基于投资组合而非个股,
以及指数数据通常较个股数据更为完整、更具代表性等原因,因
此,目前绝大部分的实证金融文献仍使用指数序列而非个股价格
序列。
为了增强实证对比结果的可靠性,除了运
用 EGARCH(1,1)skewed牠模型对条件方差
建模外,还估计了在国内外金融实务界常用的
GARCH(1,1)normal模型。在GARCH(1,1)
normal模型中,牫牠服从正态分布,同时 犲2牠被假
定为服从以下过程:
犲2牠= 犽+ 犜犡2牠-1+ 犝犲2牠-1。 (8)
3 基于高频数据的实现波动率模型
根据文献[5]的定义,对第牠天实现波动率
爲爼牠的估计表示为第牠天内高频收益率的平方
和,即
爲爼牠=∑
爟
牆=1
爲2牠,牆。 (9)
ANDERSEN等[9]的研究发现,在取自然对
数以后,对数实现波动率(ln爲爼)的波动特征可
以用一种高斯动力学过程来描述,同时ln爲爼展
现出明显的长期记忆性特性。也就是说,随着滞
后期数的增加,ln爲爼的相关性衰减速度要小于
指数衰减形式,故 ANDERSEN等建议采用自
回归分整移动平均过程ARFIMA(牘,牆,牚)来描
述ln爲爼的上述动力学特征。通过比较不同滞后
阶数 ARFIMA(牘,牆,牚)模型的赤池信息准则
(AIC)值和贝叶斯信息准则(SBIC)值大小,将
滞后阶数确定为牘=1和牚=1。ln爲爼ARFIMA
(1,牆,1)模型形式为
(1- 犗爧)(1- 爧)牆(ln爲爼牠- 犨)= (1+ 犤爧)犡牠,(10)
式中,爧为滞后算子;(1-爧)牆为分数差分算子;
犨是ln爲爼的均值;这里假定犡牠~爫(-0,犲2犡)。
4 波动模型预测精度的SPA检验法
将2种指数的样本总体划分为估计样本和
预测样本2个部分:估计样本区间为 2001年 3
月1日~2005年 12月 30日,预测样本区间为
2006年 1月 4日~2006年 10月 10日,其中
SSEC预测样本区间包含最后 183个交易日,
SP500预测样本区间包含最后 195个交易日。
然后,运用样本外的滚动时间窗预测法(即每次
对模型估计后计算其向前一步预测值,然后保
持估计的样本长度不变,将估计样本区间向后
推移一期,进行模型的重新估计和向前一步预
测),计算出各模型的样本外预测值 犲
2
牐(对于
SSEC,牐=1,2,…,爥=183;对于SP500,牐=1,2,
…,爥=195),同时记预测样本区间内的市场真
实波动率(即平方收益率)为爲2牐。
有了对市场波动的预测值 犲
2
牐,就可以比较
各模型的预测值与市场真实波动率爲2牐之间的
偏差(或损失)的大小了。然而,至于用哪一种损
失函数作为衡量预测误差标准最为合理,学术
界至今仍未达成共识。文献[15]建议,应该尽可
能多地采用不同形式的损失函数作为预测精度
的判断标准。基于这样的认识,本文采用文献中
常用的4种损失函数作为不同波动模型预测精
度高低的评判标准:
爧1:爩爛爠= 爥-1∑
爥
牐=1
燏爲2牐- 犲
2
牐燏, (11)
爧2:爩爳爠= 爥-1∑
爥
牐=1
(爲2牐- 犲
2
牐)2, (12)
爧3:爣爩爛爠= 爥-1∑
爥
牐=1
燏1- 犲
2
牐燉爲2牐燏, (13)
爧4:爣爩爳爠= 爥-1∑
爥
牐=1
(1- 犲
2
牐燉爲2牐)2。 (14)
这4种损失函数分别标记为爧牏(牏=1,2,3,
4)。其中 爧1和 爧2分别称为平均绝对误差
(MAE)和平均误差平方(MSE),它们是此类判
断中最常用的2种损失函数形式;爧3和爧4分别
是经异方差调整的MAE和MSE。按照式(11)
~式(14)的定义,对于3种波动模型的每个预
测值,都可以计算4种损失函数值,记为爧牏,牐,牑,其
中牑=1,2,3为模型下标。
需要指出的是,如果在一次研究中发现采
用某种损失函数爧牏作为判断标准,得到了模型
甲比模型乙的预测误差值小,那么只能得出这
样的结论:在这样一个特定的数据样本中,采用
这一特定的损失函数爧牏时,模型甲的预测精度
比模型乙高。很明显,这一判断是不稳健的,且
无法推广到其他类似的数据样本或者其他的损
失函数标准[15,16]。
为了解决这一问题,文献[15]提出了一种
正 式 的 检 验 方 法:SPA(superiorprediction
ability)检验法,该文献证明,因为采用了所谓
的“自举法”,SPA检验比单纯使用损失函数方
法具有更加优异的预测精度和判别能力,且结
论具有更好的稳健性。也就是说,与基于一个单
一样本的其他检验法相比,SPA检验得到的结
论更加可靠并且可以推广到其他类似的数据样
本中去[16]。
SPA检验方法的关键在于运用自举法计
算SPA检验统计量及其相应的牘值,判定某一
“基础模型”爩0(即用该模型作为与其他模型的
预测表现进行对比检验的基础)是否优于其余
各“对比模型”爩牑的准则也正是基于SPA检验
的牘值:基础模型爩0相对于其余各对比模型爩牑
的检验牘值越大(越接近于1),表明爩0的预测
精度越高;反之,基础模型爩0相对于其余各对
·0621·
管理学报第7卷第8期2010年8月
比模型爩牑的检验牘值越小(越接近于0),表明
爩0的预测精度越低①。
5 实证研究结果
表2和表3是对各模型预测精度的SPA检
验结果②。表中数字为SPA检验的牘值。在某一
损失函数爧牏的判断标准下,若基础模型爩0相对
于其他对比模型爩牑的检验牘值越大,则该基础
模型的预测精度就越高。
表 不同波动模型对SSEC波动率预测
精度的SPA检验结果
损失
函数爧牏
基础模型爩0
对比模型爩牑
GARCH
normal
EGARCH
skewed牠
ln爲爼
ARFIMA
MAE GARCHnormal — 0.231 0
EGARCHskewed牠 0.769 — 0
ln爲爼ARFIMA 1 1 —
MSE GARCHnormal — 0.855 0.012
EGARCHskewed牠 0.145 — 0
ln爲爼ARFIMA 0.988 1 —
HMAE GARCHnormal — 0 0
EGARCHskewed牠 1 — 0
ln爲爼ARFIMA 1 1 —
HMSE GARCHnormal — 0.04 0
EGARCHskewed牠 0.96 — 0
ln爲爼ARFIMA 1 1 —
注:表中用下划线表示的是在某一损失函数标准下的最优预测模型及其
SPA检验的牘值(下同)。
表 不同波动模型对SP波动率预测
精度的SPA检验结果
损失
函数爧牏
基础模型爩0
对比模型爩牑
GARCH
normal
EGARCH
skewed牠
ln爲爼
ARFIMA
MAE GARCHnormal — 0.055 0
EGARCHskewed牠 0.945 — 0.015
ln爲爼ARFIMA 1 0.985 —
MSE GARCHnormal — 0.003 0.01
EGARCHskewed牠 0.997 — 0.291
ln爲爼ARFIMA 0.99 0.709 —
HMAE GARCHnormal — 0.246 0
EGARCHskewed牠 0.754 — 0
ln爲爼ARFIMA 1 1 —
HMSE GARCHnormal — 0.083 0
EGARCHskewed牠 0.917 — 0
ln爲爼ARFIMA 1 1 —
由表2和表3可以得到以下结论:
(1)无论是对于SSEC还是SP500,基于高
频数据的ln爲爼ARFIMA模型都提供了最优的
波动率预测精度。这表现为在各种损失函数标
准下,ln爲爼ARFIMA模型相对于其余2种“对
比模型”的SPA检验牘值都是最大的,并且在很
多损失函数标准下,ln爲爼ARFIMA模型的检
验牘值都取得了最大值1。
(2)对基于低频数据的EGARCHskewed
牠模型来说,由于其能够描述股市收益分布所展
现的“有偏”和“尖峰胖尾”等特征,所以尽管其
预测精度落后于基于高频数据的实现波动率模
型,但却明显优于同样基于低频数据却未能描
述这些特征的GARCHnormal模型。
(3)尽管基于低频数据的GARCHnormal
模型在国内外金融实务界得到了广泛的应用,
但是,从表2和表3的SPA检验结果可以看出,
无论对于新兴资本市场还是成熟资本市场,该
模型的波动率预测表现都明显劣于其余2种所
考察的波动模型。
由于本文的研究同时考察了新兴股市和成
熟股市2种不同的市场代表性指数,并且运用
了具有bootstrap特性的SPA波动模型预测能
力检验法,因此,所得结论较现有研究具有更好
的实用性和更优的稳健性。
目前,中国股市正酝酿全面推出金融衍生
产品(如股指期货和期权),本文的检验方法和
实证结果对于衍生产品定价等基础性问题可以
提供有益的方法借鉴和实证结果。
参 考 文 献
[1]ENGLERF. Autoregressive Conditional Het
eroscedasticitywithEstimatesoftheVarianceofthe
UnitedKingdom Inflation[J].Econometrica,1982,
50(4):987~1007.
[2]BOLLERSLEVT.GeneralizedAutoregressiveCon
ditionalHeteroskedasticity[J].JournalofEconomet
rics,1986,31(2):307~328.
[3]NELSONDB.ARCHModelsasDiffusionApproxi
mations[J].JournalofEconometrics,1990,45(1):7
~38.
[4]GLOSTENLR,JAGANNATHAN R,RUNKLED
E.OntheRelationbetweentheExpectedValueand
theVolatilityoftheNominalExcessRetrun of
Stocks[J].JournalofFinace,1993,48(5):1779~
1801.
[5]ANDERSENTG,BOLLERSLEVT.Answeringthe
Skeptics:Yes,StandardVolatilityModelsDoProvide
AccurateForecasts[J].InternationalEconomicRe
view,1998,39(4):885~905.
·1621·
不同抽样频率波动模型的预测精度比较——王 鹏 魏 宇
①
② 笔者感谢斯坦福大学经济系的HANSEN教授授权使用
基于OX语言的SPA检验基础程序,以及就基础程序的完善所提
供的宝贵建议。
限于篇幅,这里仅将SPA检验的判断准则作出了说明,
有关SPA检验的技术细节可以参见文献[15]。
[6]FLEMINGJ,KIRBYC,OSTDIEKB.TheEconomic
ValueofVolatilityTimingUsing“Realized”Volatili
ty[J].JournalofFinancialEconomics,2003,67(3):
473~509.
[7]FERLANDR,LALANCETTES.DynamicsofReal
izedVolatilitiesandCorrelations:AnEmpiricalStudy
[J].JournalofBanking& Finance,2005,29(7):
939~958.
[8]张伟,李平,曾勇.中国股票市场个股已实现波动率估
计[J].管理学报,2008,5(2):269~273.
[9]ANDERSENTG,BOLLERSLEV T,DIEBOLD F
X.TheDistributionofRealizedStockReturnVolatil
ity[J].JournalofFinancialEconomics,2001,61(1):
43~76.
[10]ENGLERF,GALLO G M.A MultipleIndicator
ModelforVolatilityUsingIntradailyData[J].
JournalofEconometrics,2006,131(1):3~27.
[11]GIOTP,LAURENTS.ModelingDailyValueat
RiskUsingRealizedVolatilityandARCH Type
Models[J].JournalofEmpiricalFinance,2004,11
(3):379~398.
[12]魏宇.高频股价数据有助于对市场风险的预测吗?
[J].中国金融评论,2007(1):18~31.
[13]KOOPMANSJ,JUNGBACKERB,HOLE.Fore
castingDailyVariabilityoftheS&P100StockIndex
UsingHistorical,RealizedandImpliedVolatility
Measurements[J].JournalofEmpiricalFinance,
2005,12(3):445~475.
[14]郑梅,苗佳,王升.预测沪深股市市场波动性 [J].系
统工程理论与实践,2005(11):41~45.
[15]HANSENPR,LUNDEA.AForecastComparison
ofVolatilityModels:DoesAnythingBeataGARCH
(1,1)[J].JournalofAppliedEconometrics,2005,20
(7):873~889.
[16]魏宇.中国股市波动的异方差模型及其 SPA检验
[J].系统工程理论与实践,2007(6):27~35.
(编辑 王有登)
通讯作者:魏宇(1975~),男,四川攀枝花人。西南交通大
学(成都市 610031)经济管理学院副教授、博士研究生
导师。研究方向为金融工程、金融风险管理。Email:
weiyusy@126.
com
(上接第1257页)
[4]EMBRECHTSP,RESNICKS.ExtremeValueThe
oryasaRiskManagementTool[J].NorthAmeri
canactuarialJ,1999,3(2):30~41.
[5]GREENWOODA,LANDWEHRJM,MATALASN
C,etal.ProbabilityWeightedMoments:Definition
andRelationtoParametersofDistributionsExpress
ibleinInverseform[J].WaterResourcesResearch,
1979,15(5):45~52.
[6]AMIRHI,JOHNM N.EstimatingWaveCrestDis
tributionsUsingtheMethodofLmoments[J].Ap
pliedOceanResearch,2009,31(1):37~43.
[7]JUHAK,ARTON.CharacterizingtheGeneralized
LambdaDistributionbyLmoments[J].Computa
tionalStatistics& DataAnalysis,2007,52(4):
1971~1983.
[8]WILLIAM HA.LmomentsandTLmomentsofthe
GeneralizedLambdaDistribution[J].Computational
Statistics& DataAnalysis,2006,51(9):4484~4
496.
[9]DELICADOA P,GORIABM N.A SmallSample
ComparisonofMaximum Likelihood,Momentsand
LmomentsMethodsfortheAsymmetricExponen
tialPowerDistribution[J].ComputationalStatistics
&DataAnalysis,2008,52(3):1661~1673.
[10]PANDEYM D,VANGELDERPHAJM,VRI
JLINGJK.TheEstimationofExtremeQuantiles
ofWindVelocityUsingLmomentsinthePeaks
OverThresholdApproach[J].StructuralSafety,
2001,23(2):179~192.
[11]HOSKINGJRM.LMoments:AnalysisandEsti
mationofDistributionsUsingLinearCombinations
ofOrderStatistics[J].JournaloftheRoyalStatis
ticalSociety.SeriesB (Methodological),1990,
52(1):105~124.
[12]SANKARASUBRAMANIANA,SRINIVASANK.
InvestigationandComparisonofSamplingProper
tiesofLmomentsandConventionalMoments[J].
JournalofHydrology,1999,218(2):13~34.
[13]KUPIECP.TechniquesforVerifyingtheAccuracy
ofRisk MeasurementModels[J]. Journalof
Derivatives,1995,3(2):173~184.
(编辑 王有登)
通讯作者:王春峰(1966~),男,河北隆尧人。天津大学
(天津市 300072)管理学院教授。研究方向为金融工程
与金融风险管理。Email:cfwang@tju.edu.cn
·2621·
管理学报第7卷第8期2010年8月