第!"卷 第#期 运 筹 与 管 理 $%&’!",(%’#
)**+年,月 -./0123-(40/4/10561(781(19/8/(2453/(5/ 1:;’)**+
收稿日期:)**+<*#<!*
作者简介:刘群(!=")<)男,讲师,研究方向为统计分析。
高频金融数据的标度分析
刘群!, 史晓平), 葛春蕾)
(!’安徽国防科技职业学院,安徽 六安)>?*!!;)’合肥工业大学 理学院,安徽 合肥)>***=)
摘 要:高频金融数据通常具有尖峰厚尾的非正态特征,常用稳定分布来拟合。本文采用稳定分布的性质对高
频上证指数收益率的分布作了标度分析,求得特征指数为!’#,,说明我们在分析证券指数分布时可以用稳定分
布,而非正态分布。
关键词:高频数据;稳定分布;标度分析;特征指数
中图分类号:-)!) 文章标识码:1 文章编号:!**?<>))!()**+)*#<*!)?<*>
!"#$%&’"()!*+,-./&’0,#*"#+"-&.1&’2-/(03)4#).*%0-.+.*)5+"+
@3AB:C!,463DEF%<GEC;),9/5H:C<&IE)
(!!"#$%&’()&*#(+,-.-#/-0*/()&*#(+1*++-2-,3&%(#)>?*!!,1$&#(;)!1*++-2-*.4/&-#/-,
5-.-&6#&7-89&):*.;-/$#*+*2:,5-.-&)>***=,1$&#()
671"3+*":6E;HJKIL:ICMNJECFCMIOFPFFKIC%PC%KQF&:R:F&&N,R%PHFPRPFS&IOERPKES:PE%CER:R:F&&N:RIOP%JEP
PHIQ’TIFGG&NPHIMHFKFMPIKECPHIRPFS&IOERPKES:PE%CP%PHI4HFC;HFE4P%MUR/VMHFC;I5%QG%REPIECOIV,
:REC;PHIRMF&EC;%JJ&:MP:FPE%CR,FCO;FECMHFKFMPIKERPEMECOIV,WHEMHER!’#,’2HERRH%WRPHFPWIMFC:RI
RPFS&IOERPKES:PE%CECRPIFO%JC%C<C%KQF&%CIECFCF&NXEC;RIM:KEPEIRECOIV’
8)%9&3$1:HE;HJKIL:ICMNJECFCMIOFPF;RPFS&IOERPKES:PE%C;RMF&EC;;MHFKFMPIKERPEMECOIV
* 引言
证券收益率的统计规律与分布形式是金融市场的基本性质之一。按照中心极限定理,收益率的分布
遵循高斯分布(正态分布)。然而,大量实际的高频金融数据表明,收益率的分布远远偏离正态分布,具有
尖峰、厚尾特征。在研究过程中,人们逐步发现稳定分布比正态分布更适合描述收益率的分布。!=+>年,
Y’Y’8FCOI&SK%[!]在对棉花价格的分析中观察到,价格回复过程,不仅是一种非高斯分布,还显示出时间
“标度”的存在,即对于!P的各种不同尺度的选择,分布具有相同的函数形式。基于胖尾现象和时间的标
度性,Y’8FCOI&SK%得出价格回复分布可以用@IZN稳定过程模拟;随后0’(’8FCPI;CF和6’/’4PFC&IN[)]
研究证实,纽约股票交易所的4[."**指数的回复分布可以由中心部分为@IZN分布,再连接一个近似指
数下降分布的尾部的分布模型来描述。汪秉宏[>]及其合作者对香港\恒生指数涨落的统计规律进行了
细致的研究,研究结果表明,恒生指数回复的统计分布也呈现出显著的标度行为,这一过程的动力学在分
布中心分是与@IZN过程所预测的结果相一致,而在分布尾部的下降特征则以幂函数规律作指数下降。王
卫宁[#,"]也对金融数据作了统计分析,得到一些非线性特征。
本文采用标度分析方法,利用稳定分布可加性,研究间隔!*秒的高频上证指数收益率的分布,建立不
同时间间隔!P与!P内收益率和的中心概率密度之间的对数线性关系,用对应斜率的负导数估计稳定分
布的尺度参数。
万方数据
! 稳定分布
稳定分布特征函数的自然对数如下:
"#!["#$!]!"(!)$
%%&"!"&{!%##’#()(!)&’#(&$/()})#*! &#!
%%"!"{!)(##$’#()
(!)"#"!"})#*! &
$
%
& $!
假设随机变量+服从稳定分布,记为+!,&(%,#,*)。&是稳定指数或特征指数,%是尺度参数,#
是偏移参数,* 是位置参数。他们具有如下特征:
(!)&’[*,(],当&$(时是正态分布。当&((时,逐渐偏离正态分布,具有尖峰厚尾特征(见图!)。
(()%越大对应概率密度函数越‘宽’。
(+)#’[%!,!],当#$!,分布完全偏向右边,当#$%!,分布完全偏向左边,当#$*,分布对称。
(+)*’-,且*$!(+)。
稳定分布中有三种可求出解析式的特殊分布:正态分布,((%,*,*)$.(*,(%(),柯西分布,!(%,
*,*)和,-./01234#5.分布,!((%,!,*)。
稳定分布具有可加性:几个具有相同特征指数的稳定分布的随机变量之和仍是相同特征指数的稳定分布。
设+!,⋯,+)独立,且+#!,&(%,#,*),#$!,⋯,)。则)
)
#/!
+#!,&(%"
"#)
& ,#,)*)
图! 不同特征指数&的概率密度函数(#$*,%$!,*$*)
( 用稳定分布拟合上证指数收益率的分布
本文分析了(**(年间隔十秒的上证指数序列+(0),从!月+日到6月7日,共有个交易日,每天上
午89:*!!!9:*,下午!9**!:9**为交易时间,间隔!*秒。这样总共!8*8*;个点。
定义收益率1(0)!"#+(0)!)%"#+(0)。图(可以看出有大量的波动。
在实际的观察中,我们发现样本{1(0)}均值为!2<=!*%<,由此对参数* 估计都为*,且我们认为收
益率的概率密度围绕均值对称的,即#$*。则{1(0)}近似服从,&(%,*,*)。接着估计参数&,%。由稳
定分布的可加性,)
&0
#/!
1(0)#)!,&(%"
"#&0
& ,*,*)
对于稳定分布,&(%"
"#&0
& ,*,*)通过富立叶变换和特征函数求出概率密度
3($,&0)$!($*
4>
5>
"%#$6"%&0%
&
6
&
76$!$*
4>
*
?5@($6)"%&0%
&
6
&
76
3(*,&0)$!$*
4>
*
"%&0%
&
6
&
76$’(!/&)/[$&(%&&0)!/&]
6(! 运 筹 与 管 理 (**;年第!7卷
万方数据
图! 间隔"#秒上证指数收益率的序列!(")(!##!#"#!$%!##!#&#’)
式中!("/$)是伽马函数,其定义为!(%)(!
)
#
"%%"&%"’" (%"#)
两边取自然对数
*+((#,#")([*+!("/$)%*+$$%]%"$*+#"#%((
(#,#")/[$$!("/$)#""/$] (")
图, 不同#"对应概率密度((),#"")的自然对数 图$ #"与概率密度((),#")中心峰值
的双对数线性关系
让#"(",!,$,&,"-,,!,-$,"!&,建立*+((#,#")与*+#"的线性关系,其斜率的负导数估计$,再把它
代入")式估计%。
通过*+((#,#")对*+#"的线性拟合,斜率为%##-.$,这样我们获得特征指数$(% "%##-.$("#$&
,
要估计{*(")}!+$(%,#,#)分布中的%,只需令#"(",把$("#$&代入(")式即可得%(&#./"#%’。
, 结论
通过对高频数据的标度分析,利用稳定分布的可加性,可以较好地估计稳定分布的特征指数,结果表
明特征指数$("#$&$!,说明分布具有非正态特征。
参考文献:
["]01+23*4567889:3;<37=62>?+>717?>7?@1*3@6+6<?@>[A]9A6B5+1*6CD6*?7?@1*E@6+6<F,"G-,,(."):$!"H$$#9
[!]01+73I+1J:KE9L71+*3F9L@1*?+I43=1M?6B5?+7=32F+1<?@>6C1+3@6+6<?@?+23N[A]9:17B53,"GG’,(,.-):$-H$G9
[,]O1+I8K,KB?D09P=32?>75?4B7?6+1+2>@1*?+I6CC*B@7B17?6+>C65=1+I>3+I?+23N?+=6+IQ6+I>76@Q<15Q37[A]9EB59D=F>9A98,!##",
(!#):’.,H’.G9
[$]王卫宁,汪秉宏,史晓平9股票价格波动的混沌行为分析[A]9数量经济技术经济研究,!##$,($):"$"H"$.9
[’]王卫宁,汪秉宏,史晓平9混沌中的随机性分析及其在证券中的应用[A]9运筹与管理,!##’,(,):"!"H"!$9
G!"第$期 刘群,等:高频金融数据的标度分析
万方数据