基于成交量标度的股价动力学分析*
摘要 传统的基于时间标度的股价动力学分析方法缺乏考虑成交量的重要作
用,本文在股价调整的成交量进程时间假设下,提出基于成交量标度的股价
动力学分析方法。通过对上证综合指数的实证研究,结果表明基于成交量标
度的股价动力学分析方法的可行性和有效性。
关键词 成交量标度 成交量进程时间假设 股价
1 引言
长期以来,成交量一直被金融实务界看作影响价格变动的重要因素,它是交易者从市场
上能观察到的除了价格之外的另一重要变量。交易者从成交量中获取信息进行学习,并据此
制定交易策略。在金融理论上,成交量与股价变动绝对值之间呈正相关关系,成交量影响股
票收益率的自相关性、互自相关性和惯性效应,成交量已作为金融或宏观经济事件的“信息
含量”的一种度量方法。
但是,传统的基于时间标度的股价动力学模型却很少考虑成交量在股价分析中的重要作
用,而且基于时间标度的股价模型都要一个隐含的假设:股票价格的调整是基于固定的日历
时间间隔推进的。而实际上,股价的推进是按它自己的交易时间进行的,本文在股价调整的
成交量进程时间假设的基础上,提出基于成交量标度的股价动力学分析的基本思想和基本方
法,并通过对上证综合指数的实证研究证实了基于成交量标度的股价动力学分析方法的可行
性和有效性。
2 成交量进程时间假设
成交量进程时间假设
我们都是以固定的日历时间间隔记录经济世界和金融市场中的经济变量,比如宏观经济
统计中的 GDP 年增长率,消费价格指数月变化率,金融市场中的股票价格的日收盘价。对
这些金融经济变量的传统的时间序列分析都有一个隐含的假设:这些变量是以固定的日历时
间进程推进的。但是,大量的研究发现,这些经济变量并不是以固定的日历时间进程推进的,
而是以它自己的经济时间推进的。比如,经济周期就是一个独立的经济时间单位,即有关经
济周期的变量的推进模式是从一个周期的一个阶段进入下一个阶段,而不是从一个月到下一
个月。由于各个经济周期的时间长度不同,所以分析这些周期行为的合适的时间刻度不能基
于月、季、年或者其它日历时间刻度,而应该是经济周期本身[1]。
对于股票价格的研究,目前也都是使用固定的日历时间间隔记录的数据,即使是成交层
次的数据,其时间间隔也是固定的,只不过从日频率变为小时、分钟而已。所以目前的股价
的时间序列分析也都有一个隐含的假设:股票价格的调整是以固定的日历时间间隔推进的。
但许多研究发现,股票价格的变化与市场上的信息有很大的关系,股票价格的调整并不是以
我们记录数据用的固定的日历时间进程推进的,不是从这一日到下一日,从这一周到下一周,
它也存在自己独立的时间推进进程,比如信息流进程[2、3]。
正如华尔街上的谚语所说的,成交量推动股价的前进(It takes volume to move prices),
股价的调整是按照成交量进程推进的,我们把这称为成交量进程时间假设。
成交量进程时间假设的数学刻划
在成交量进程时间假设下,令成交量进程时间刻度为 ,日历时间刻度为 ,日历时间
与成交量进程时间的转换式为 。假设基于日历时间点观察到的变量表示成 ,
可观察的离散日历时间变量 表达成 = 。则称 为对应于
日历时间 到 这段时期内的成交量进程时间长度,称 为成交量进程时间转换函数。
通常假设 满足下面几个条件:
(1) 不依赖于将来的 值;
(2)成交量进程时间和日历时间以相同方向推进, , ;
(3) 可辨识,特别地,只是简单的时间线性转换函数是不合适的,因为时间线性
转换只是对日历时间重新标定,如把季度转换成年。
(4)一般令 ,另外,在实证研究中令其均值为 1, ,这样一个单
位的成交量进程时间平均对应于一个单位的日历时间。
(5)为了参数估计的方便,假设转换函数为连续的。
在成交量进程时间假设下,记:
(1)
其中: 为 时刻的成交量。
满足上面 5 个条件的 函数很多,不同的 函数对应不同的成交量进程时间假
设。特别地,当 时,即为传统的日历时间假设。
在下面的实证研究中,我们采用简单的成交量进程时间线性转换函数:
(2)
其中: 为一常数; 。
为了满足 ,我们取 ,即取
的最小值为实证样本区间内最大成交量与最小成交量比率的倒数,大于零且远远小于 1。这
样,我们求得:
式(2)所表示的成交量进程时间转换函数 ,可满足上面提出的 5 个条件。
3 基于成交量标度的股价动力学分析
基于成交量标度的股价动力学分析的基本思想
传统的基于时间标度的股价动力学
在金融市场中,有三个最基本的要素:时间、价格和成交量。对于这三个要素,时间为
一个标度,用于记录价格和成交量,价格和成交量随着时间的前进而推进。通过时间的标度,
我们得到两个时间序列(基于时间标度的序列):价格序列 和成交量序列 。目前所
有的理论研究和实务分析,围绕着这两个序列可分成三类:①单独研究价格序列 的行为;①
单独研究成交量序列 的行为;①研究 和 之间的行为。例如:传统的资产定价模
型,研究的就是股票价格 的衍生变量收益率 的结构和动力学关系。
传统的基于时间标度的股价动力学可用下式(3)表示:
(3)
其中: 为 时刻的股价; 表示 时刻之前可获取的信息,比如 时刻之前的股价; 表
示股价与其前期信息之间的函数关系; 为随机误差项。
t
)(tg ))(( tg
ty ty ))(( tg )1()()( tgtgtg
1t t )(tg
)(tg
)(tg ty
∞<)(≤0 tg t
)(tg
0)0( g 1)( tgE
tVoltftg ≤= ),,()(
tVol t
)(tg )(tg
1)( tg
)(1)( zzctg t
c tt Volz Ln
∞<)(≤0 tg )max/()min()(min
111
tntnt
VolVoltg
)(tg
)min/()max/min1( ttt zzVolVolc
)(tg
tP tVol
tP
tVol tP tVol
tP tr
ttt IfP )( 1
tP t 1tI t t f
t
式(3)刻划的股价动力学模型,比如当 , 为线性函数时,即为随机游走
模型。自回归 AR 模型、移动平均 MA 模型、自回归移动平均 ARMA 模型等都是常用的线
性动力学模型,非线性模型如神经网络模型等。
从时间标度到成交量标度
由于按照时间标度得到的股价序列 进行分析可能就会很困难,即式(3)中 为非线
性函数。现在我们放弃原来的时间标度,而使用成交量标度来分析股价动力学:
(4)
其中: 为 时刻的股价; 表示 时刻之前可获取的信息,比如 时刻之前
的股价; 表示基于成交量标度的股价与其前期信息之间的函数关系; 为随机误差项。
对于式(4),我们使用成交量标度进行股价动力学分析包括三个步骤:①标度成交量时
刻;①构造基于成交量标度的股价序列;①进行基于成交量标度的股价动力学分析,即求解
函数 。
特别地,当成交量标度等于原来的时间标度时,基于成交量标度的股价就是原来的基于
时间标度的股价。
从时间标度到成交量标度,我们把按照日历时间推进的股价序列动力学分析转换到基于
成交量标度的动力学分析,解决了两个问题:第一、从成交量标度考虑得到的价格序列自然
地把成交量的信息融入到价格序列中,避免了原来的价格和成交量两个变量分离难以结合研
究的问题。第二、按成交量推进的思想,也符合市场交易本身的推进方式。由于市场交易不
按固定的日历时间推进,而是按其交易本身的时间推进,按影响交易的信息流过程推进,那
么成交量作为市场重要事件的“信息含量”的度量标志,很自然地可以作为市场交易本身时间
的一个替代。
基于成交量标度的股价动力学分析的基本方法
确定成交量标度
由于放弃了传统的时间标度,我们需要重新给定股价的标度。标度确定的是否适当直接
影响基于成交量标度的股价的行为特征。在成交量进程时间假设下,日历时间伸缩了,股价
以成交量进程时间形式推进,在实证研究中我们使用成交量进程时间来确定成交量标度。因
为成交量进程时间的均值等于 1,即刚好等于一个平均时间刻度单位,那么成交量标度的单
位设定为成交量进程时间的均值。
下面说明如何求得成交量标度 时的时间标度 值。假设 时刻的成交量进程时间
为 ,则 时刻的累积成交量进程时间为 。 时的时间标度 值由下式
中的 确定:
(5)
时的时间标度 值就介于 时刻和 时刻之间。
基于成交量标度的股价序列的构造
由于现有存在的股价序列都是基于日历时间标度的,为了进行基于成交量标度的股价序
列动力学分析,我们必须重新构造股价序列。
就象时间标度一样,一般我们所取的标度值都是固定间隔的整数,而式(5)中累积成
交量进程时间刚好等于整数值的时间标度往往介于两个整数时间标度之间。所以,基于成交
11 tt PI f
tP f
VolVolVol IfP )( 1
VolP Vol 1VolI Vol Vol
f Vol
f
kVol t t
)(tg t
t
s
sg
1
)( kVol t
i
∑
1
)(1
i
s
ksgk
kVol t 1i i
量标度的股价就是这种介于两个整数时间标度之间的股票价格,在这种精确的时间标度的股
价获取有困难的情况下(现存的可获取的数据库可能没有每笔的成交数据记录),我们常常
采取替代的方式。
如果我们对日数据进行实证研究,而无法得到每笔成交数据,那么可使用日数据的加权
平均法。这里的权是成交量进程时间,而股价则用平均成交价替代。假设 为 日的成交
金额, 为 日的成交总股数,则 日的平均成交价为:
(6)
记基于成交量标度的价格序列为 ,假设前 s 个基于成交量标度的股价已经产生,
下面求第 s+1 个价格。若下式满足:
(7)
则第(s+1)个成交量标度的股价 为:
(8)
基于成交量标度的股价动力学分析的基本方法
在生成基于成交量标度的股价序列后,我们就可以进行动力学分析。传统的基于时间标
度的股价动力学分析方法都可应用于基于成交量标度的股价序列,比如 ARIMA 模型分析、
GARCH 模型分析和人工神经网络分析等。
4 实证研究
下面我们对上证综合指数进行实证分析,通过基于时间标度的股价收盘价序列和基于成
交量标度的股价序列进行 ARIMA 模型比较分析,来说明基于成交量标度能降低股价行为的
复杂性,从而简化股价行为的分析。
数据样本:1998 年 1 月 1 日至 1999 年 12 月 31 日的上证综合指数,共 485 个交易日
误差分析
为了比较模型拟合样本序列的程度,我们使用下面几个误差项分析。设 和 分
别表示实际值和模型的预测值,n 为样本数。
(1)均方差:
(9)
(2)平均绝对值误差:
(10)
(3)最大绝对值误差:
(11)
(4)最小绝对误差:
(12)
(5)绝对值误差小于 %比例:
tVal t
tVol t t
ttt VolValP /=
}{ sPT
∑
∑
1
1
)2()(≤)1(
)1()(≤
l
t
k
t
stgs
stgs
1+sPT
l
l
t
l
kt
tk
k
t
PsPPs *g(t))1(*g(t)*g(t) ∑∑
1
1
1
11
}{ jY }{ jO
∑
1
2]/)[(
1
_
n
j
jjj YOYn
errormsv
∑
1
/)-(
1
_
n
j
jjj YOYn
erroravg
jjjj
YOYerror /)-(maxmax_
jjjj
YOYerror /)-(minmin_
(13)
模型识别
先按照前面的成交量进程时间线性转换函数式(2)生成成交量进程时间,再根据日数
据加权替代法式(8)生成基于成交量标度的股价序列,其中上证综合指数的成交量用日成
交金额度量。记 CLSPRC 为原来的基于时间标度的收盘价序列,PRC_L 为基于成交量标度
的股价序列。
我们把 485 个样本分成两段,第 1 至 405 个样本用于系统识别和参数估计,第 406 至 485
个样本用于测试。
按照 AIC 和 BIC 信息准则以及模型的参数的显著性进行模型的辨识,我们得到两个序
列的 ARIMA 模型的阶数,见表 1。
表 1 两个序列的 ARIMA 模型
模型的拟合情况 残差的自相关性检验
序列 ARIMA(p,d,q)
AIC BIC
阶
数
Chi-Square
显著性
概率
CLSPR
C (3,1,0) 6
PRC_L (2,1,0) 6
注:①第二列的 p,d,q 分别表示自回归项、差分项和移动平均项的阶数。
①第三列的 为调整的误差平方和。
①第四列、第五列分别为赤池信息准则值和 Scharwz-Bayes 信息准则值。
分析:
(1)从残差的自相关性检验看,两个模型的残差的直至 6 阶滞后的自相关系数都没有
显著不为零的,说明两个模型拟合得都不错。
(2)从阶数上看,基于成交量标度的指数序列的阶数都比收盘价序列的小。
(3)从 、AIC 和 BIC 值看,基于成交量标度的指数序列的值都要小于收盘价序
列,说明基于成交量标度的指数序列要比收盘价序列拟合的更好一些。
两个序列的拟合效果分析
由前面识别出的两个序列的 ARIMA 模型及其参数值,我们对后面的 80 个样本进行预
测,再根据前面的误差分析项计算出辨识阶段和测试阶段的各个误差值,见表 2。
表 2 两个序列的 ARIMA 模型的误差分析表
辨识阶段:样本数 405
序列 均方差 平均绝对值误
差
最 大 绝 对 值
误差
最 小 绝 对 值
误差
绝对值误差小于
%的比例
CLSPRC
PRC_L -6
预测阶段:样本数 80
CLSPRC
PRC_L
otherwise:0
/_
jjj
j
j
j
YOY
per
npererrorper
分析
(1)在模型辨识阶段,从各个误差分析值看,不管是均方差、平均绝对值误差,还是
最小绝对值误差、绝对值误差小于 %的比例,基于成交量标度的指数序列都要优于收盘
价序列。
(2)在模型测试阶段,各个误差分析值也是基于成交量标度的指数序列要比收盘价序
列好。
(3)模型测试阶段的误差分析值与辨识阶段相比,其拟合效果并没有变差,说明模型
的参数的时间平稳性得到了很好的保证。
5 结论
根据前面的基于成交量标度的股价序列的分析方法,我们对上证综合指数的日数据进行
了实证分析。按照赤池信息准则 AIC、Scharwz-Bayes 信息准则 BIC 和参数值的显著性,我
们对两个序列进行了 ARIMA 模型辨识,发现基于成交量标度的指数序列的自回归项阶数要
小于收盘价序列,而且 AIC 和 BIC 值也要小于收盘价序列。这说明基于成交量的指数序列
的 ARIMA 模型的拟合情况要优于收盘价序列。再由辨识阶段得到的 ARIMA 模型的参数值
对后面的样本进行了测试,从各个误差分析项(包括均方差、平均绝对值误差、绝对值误差
小于 %的百分比等)也可以看出,基于成交量标度的指数序列用 ARIMA 模型拟合要好
于收盘价序列。
上面的实证结果表明,基于成交量标度的股价动力学分析方法是可行的,也是有效的。