第一章
金融计量学介绍
金融计量学
本章要点
金融计量学的方法论与应用步骤。
金融数据的特点和来源
金融计量学软件的使用
金融计量学
第一节 金融计量学的含义及建模步骤
一、金融计量学的含义
金融计量学就是把计量经济学中的方法和技术应用到金融领域,即应用统计方法和统计技术解决金融问题。
金融计量学
二、金融计量建模的主要步骤
经济理论或金融理论
建立金融计量模型
数据收集
模型估计
模型检验
不通过 通过
重新建立模型 模型的应用
金融计量学
第一步,把需要研究的金融问题模型化;
第二步,收集样本数据;
第三步,选择合适的估计方法来估计模型;
第四步,对模型进行检验;
第五步,对模型进行相应的应用。
金融计量学
三、金融数据的主要类型、特点和来源
1.金融数据的主要类型
时间序列数据(Time series data)
是按照一定的时间间隔对某一变量在不同时间的取值进行观测得到的一组数据,例如每天的股票价格、每月的货币供应量、每季度的GDP、每年用于表示通货膨胀率的GDP平减指数等。
金融计量学
在分析时间序列数据时,应注意以下几点:
(1)在利用时间序列数据回归模型时,各变量数据的频率应该是相同的;
(2)不同时间的样本点之间的可比性问题;
(3)使用时间序列数据回归模型时,往往会导致模型随机误差项产生序列相关;
(4)使用时间序列数据回归模型时应特别注意数据序列的平稳性问题。
金融计量学
横截面数据(Cross-sectional data)
是指对变量在某一时点上收集的数据的集合,例如,某一时间点上海证券交易所所有股票的收益率,2004年世界上发展中国家的外汇储备等。
平行数据(Panel data)
是指多个个体同样变量的时间序列数据按照一定顺序排列得到的集合,例如30家蓝筹股过去3年每日的收盘价。
金融计量学
2.金融数据的特点
与一般宏观经济数据相比,金融数据在频率、准确性、周期性等方面具有自己特有的性质:
(1)金融数据可以更频繁地观察到,可用于计量分析的数据观测值个数可以成千上万,数量十分巨大;
(2)金融数据一般都能在交易时准确记录下来;
(3)金融数据一般也是不平稳的,但难以区分金融数据序列的随机游走、趋势以及其他的一些特征。
金融计量学
3.金融数据的主要来源
政府部门和国际组织的出版物及网站
专业信息数据公司,
抽样调查
金融计量学
第二节 金融计量学软件简介
一、金融计量学主要软件简介
1.金融计量分析的主要任务
从反映金融问题的大量数据中提取和归纳金融问题的客观规律性,进行解释和预测,为金融政策和金融实践提供依据。
为此,必须合理、科学地组织管理大量的数据信息,并用计量经济学或金融计量学的方法对这些数据进行一系列复杂的数值计算处理。
金融计量学
2.分类(按操作的互动性与否分为)
菜单模式,如Microfit
命令行模式,如Eviews
及介于二者之间的中间模式
金融计量学
3.主要计量经济学软件
Eviews软件
GAUSS软件
LIMDEP软件
Mathematica软件
Matlab软件
Microfit软件
Minitab软件
RATS软件
SAS软件
SHAZMA软件
S-PLUS软件
SPSS软件
STATA软件
TSP软件
金融计量学
二、本课程所用软件-和
使用简介
以版本为例。
1 .数据输入、修改及保存
金融计量学
图1-2 Microfit 主界面
金融计量学
图1-3 数据录入设定界面
金融计量学
图1-4 变量定义、修改窗口
金融计量学
图1-5 数据录入界面
金融计量学
2.命令窗口及绘图
图1-6 Microfit 命令窗口
金融计量学
图1-7 1962~1972年辞职率和失业率线性图
金融计量学
图1-8 1962~1972年辞职率和失业率散点图
金融计量学
3.一个回归分析案例
图1-9 Microfit 单方程回归分析窗口
金融计量学
图1-10 最小二乘估计结果及相关统计量
金融计量学
图1-11 四种假设检验的结果
金融计量学
(二)Eviews 使用简介
1.数据输入、修改及保存
图1-12 Eviews新工作文件数据设定窗口
金融计量学
图1-13 空白新工作文件
金融计量学
(二)使用简介
1.数据输入、修改及保存
图1-14 新工作文件数据导入窗口
金融计量学
图1-15 数据导入后工作文件
金融计量学
图1-16 察看数据窗口
金融计量学
图1-17 GDP和M1线性图
金融计量学
图1-18 方程设定窗口
金融计量学
图1-19 回归结果
金融计量学
本章小节
金融计量学是金融学的一个重要分支,金融问题的数量化研究是金融计量学的目的,包括金融模型的设计、建立、估计、检验及使用模型进行预测和政策策划的系列过程。金融理论的迅速发展、金融模型的不断推出、计算机技术的日益发展和计量软件的多样化都为现代金融的数量化研究提供了有力的工具,这些条件的结合形成了金融计量分析的基础。
金融计量学
本章简要阐述了金融计量学的方法和一般应用步骤,着重介绍了金融数据的类型和特点,简要评述了主要的计量和统计软件包,对常用的Microfit和Eviews计量软件的使用方法进行了详细讲解并举例说明。本章旨在使学生理解金融计量模型思想,了解金融数据的特点与来源,掌握常用的金融计量软件。
金融计量学
第二章
最小二乘法(OLS)
和线性回归模型
金融计量学
本章要点
最小二乘法的基本原理和计算方法
经典线性回归模型的基本假定
BLUE统计量的性质
t检验和置信区间检验的原理及步骤
多变量模型的回归系数的F检验
预测的类型及评判预测的标准
好模型具有的特征
金融计量学
第一节 最小二乘法的基本属性
一、有关回归的基本介绍
金融、经济变量之间的关系,大体上可以分为两种:
(1)函数关系:Y=f(X1,X2,….,XP),其中Y的值是由Xi(i=1,2….p)所唯一确定的。
(2)相关关系: Y=f(X1,X2,….,XP) ,这里Y的值不能由Xi(i=1,2….p)精确的唯一确定。
金融计量学
图2-1 货币供应量和GDP散点图
金融计量学
图2-1表示的是我国货币供应量M2(y)与经过季节调整的GDP(x)之间的关系(数据为1995年第一季度到2004年第二季度的季度数据)。
金融计量学
但有时候我们想知道当x变化一单位时,y平均变化多少,可以看到,由于图中所有的点都相对的集中在图中直线周围,因此我们可以以这条直线大致代表x与y之间的关系。如果我们能够确定这条直线,我们就可以用直线的斜率来表示当x变化一单位时y的变化程度,由图中的点确定线的过程就是回归。
金融计量学
对于变量间的相关关系,我们可以根据大量的统计资料,找出它们在数量变化方面的规律(即“平均”的规律),这种统计规律所揭示的关系就是回归关系(regressive relationship),所表示的数学方程就是回归方程(regression equation)或回归模型(regression model)。
金融计量学
图2-1中的直线可表示为
()
根据上式,在确定α、β的情况下,给定一个x值,我们就能够得到一个确定的y值,然而根据式()得到的y值与实际的y值存在一个误差(即图2-1中点到直线的距离)。
金融计量学
如果我们以u表示误差,则方程()变为:
即:
其中t(=1,2,3,…..,T)表示观测数。
()
()
式()即为一个简单的双变量回归模型(因其仅具有两个变量x, y)的基本形式。
金融计量学
其中yt被称作因变量
(dependent variable)、
被解释变量
(explained variable)、
结果变量
(effect variable);
xt被称作自变量
(independent variable)、解释变量
(explanatory variable)、
原因变量
(causal variable)
金融计量学
α、β为参数(parameters),或称回归系数(regression coefficients);
ut通常被称为随机误差项(stochastic error term),或随机扰动项(random disturbance term),简称误差项,
在回归模型中它是不确定的,服从随机分布(相应的,yt也是不确定的,服从随机分布)。
金融计量学
为什么将ut 包含在模型中?
(1)有些变量是观测不到的或者是无法度量的,又或者影响因变量yt的因素太多;
(2)在yt的度量过程中会发生偏误,这些偏误在模型中是表示不出来的;
(3)外界随机因素对yt的影响也很难模型化,比如:恐怖事件、自然灾害、设备故障等。
金融计量学
二、参数的最小二乘估计
(一) 方法介绍
本章所介绍的是普通最小二乘法(ordinary least squares,简记OLS);
最小二乘法的基本原则是:最优拟合直线应该使各点到直线的距离的和最小,也可表述为距离的平方和最小。
假定根据这一原理得到的α、β估计值为 、 ,则直线可表示为 。
金融计量学
直线上的yt值,记为 ,称为拟合值(fitted value),实际值与拟合值的差,记为 ,称为残差(residual) ,可以看作是随机误差项 的估计值。
根据OLS的基本原则,使直线与各散点的距离的平方和最小,实际上是使残差平方和(residual sum of squares, 简记RSS) 最小,即最小化:
RSS= = ()
金融计量学
根据最小化的一阶条件,将式分别对、求偏导,并令其为零,即可求得结果如下 :
()
()
金融计量学
(二)一些基本概念
1.总体(the population)和样本(the sample)
总体是指待研究变量的所有数据集合,可以是有限的,也可以是无限的;而样本是总体的一个子集。
2、总体回归方程(the population regression function,简记PRF),样本回归方程(the sample regression function,简记SRF)。
金融计量学
总体回归方程(PRF)表示变量之间的真实关系,有时也被称为数据生成过程(DGP),PRF中的α、β值是真实值,方程为:
+
(2. 7)
样本回归方程(SRF)是根据所选样本估算的变量之间的关系函数,方程为:
注意:SRF中没有误差项,根据这一方程得到的是总体因变量的期望值
()
金融计量学
于是方程()可以写为:
()
总体y值被分解为两部分:模型拟合值( )和残差项( )。
金融计量学
3.线性关系
对线性的第一种解释是指:y是x的线性函数,比如,y= 。
对线性的第二种解释是指:y是参数的一个线性函数,它可以不是变量x的线性函数。 比如,y= 就是一个线性回归模型, 但 则不是。
在本课程中,线性回归一词总是对指参数β为线性的一种回归(即参数只以一次方出现),对解释变量x则可以是或不是线性的。
金融计量学
有些模型看起来不是线性回归,但经过一些基本代数变换可以转换成线性回归模型。例如,
()
可以进行如下变换:
()
令 、 、 ,则方程
(2. 11)变为:
()
可以看到,模型即为一线性模型。
金融计量学
4.估计量(estimator)和估计值(estimate)
估计量是指计算系数的方程;而估计值是指估计出来的系数的数值。
金融计量学
三、最小二乘估计量的性质和分布
(一) 经典线性回归模型的基本假设
(1) ,即残差具有零均值;
(2)var <∞,即残差具有常数方差,且对于所有x值是有限的;
(3)cov ,即残差项之间在统计意义上是相互独立的;
(4)cov ,即残差项与变量x无关;
(5)ut~N ,即残差项服从正态分布
金融计量学
(二)最小二乘估计量的性质
如果满足假设(1)-(4),由最小二乘法得到的估计量 、 具有一些特性,它们是最优线性无偏估计量(Best Linear Unbiased Estimators,简记BLUE)。
金融计量学
估计量(estimator):意味着 、 是包含着真实α、β值的估计量;
线性(linear):意味着 、 与随机变量y之间是线性函数关系;
无偏(unbiased):意味着平均而言,实际得到的 、 值与其真实值是一致的;
最优(best):意味着在所有线性无偏估计量里,OLS估计量 具有最小方差。
金融计量学
(三) OLS估计量的方差、标准差和其概率分布
估计量的方差、标准差。
给定假设(1)-(4),估计量的标准差计算方程如下 :
其中, 是残差的估计标准差。
()
()
金融计量学
参数估计量的标准差具有如下的性质:
(1)样本容量T越大,参数估计值的标准差越小;
(2) 和 都取决于s2。 s2是残差的方差估计量。 s2越大,残差的分布就越分散,这样模型的不确定性也就越大。如果s2很大,这意味着估计直线不能很好地拟合散点;
金融计量学
(3)参数估计值的方差与 成反比。 其值越小,散点越集中,这样就越难准确地估计拟合直线;相反,如果 越大,散点越分散,这样就可以容易地估计出拟合直线,并且可信度也大得多。
比较图2-2就可以清楚地看到这点。
金融计量学
图2-2 直线拟合和散点集中度的关系
金融计量学
(4) 项只影响截距的标准差,不影响斜率的标准差。理由是: 衡量的是散点与y轴的距离。 越大,散点离y轴越远,就越难准确地估计出拟合直线与y轴的交点(即截距);反之,则相反。
金融计量学
2.OLS估计量的概率分布
给定假设条件(5),即 ~ ,则 也服从正态分布
系数估计量也是服从正态分布的:
()
()
金融计量学
需要注意的是:如果残差不服从正态分布,即假设(5)不成立,但只要CLRM的其他假设条件还成立,且样本容量足够大,则通常认为系数估计量还是服从正态分布的。
其标准正态分布为:
()
()
金融计量学
但是,总体回归方程中的系数的真实标准差是得不到的,只能得到样本的系数标准差( 、 )。用样本的标准差去替代总体标准差会产生不确定性,并且
、 将不再服从正态分布,而服从自由度为T-2的t分布,其中T为样本容量
即:
~ ()
~
()
金融计量学
3.正态分布和t分布的关系
图2-3 正态分布和t分布形状比较
金融计量学
从图形上来看,t分布的尾比较厚,均值处的最大值小于正态分布。
随着t分布自由度的增大,其对应临界值显著减小,当自由度趋向于无穷时,t分布就服从标准正态分布了。
所以正态分布可以看作是t分布的一个特例。
金融计量学
第二节 一元线性回归模型的统计检验
一、拟合优度(goodness of fit statistics)检验
拟合优度可用R2 表示:模型所要解释的
是y相对于其均值的波动性,即
(总平方和,the total sum of squares,
简记TSS),这一平方和可以分成两部分:
金融计量学
= + ()
是被模型所解释的部分,称为回归平方和(the explained sum of squares,简记ESS);
是不能被模型所解释的残差平方和(RSS),即 =
金融计量学
TSS、ESS、RSS的关系以下图来表示更加直观一些:
图2-4 TSS、ESS、RSS的关系
金融计量学
拟合优度 =
因为 TSS=ESS+RSS
所以 R2= ()
()
()
R2越大,说明回归线拟合程度越好;R2越小,说明回归线拟合程度越差。由上可知,通过考察R2的大小,我们就能粗略地看出回归线的优劣。
金融计量学
但是,R2作为拟合优度的一个衡量标准也存在一些问题:
(1)如果模型被重新组合,被解释变量发生了变化,那么R2也将随之改变,因此具有不同被解释变量的模型之间是无法来比较R2的大小的。
金融计量学
(2)增加了一个解释变量以后, R2只会增大而不会减小,除非增加的那个解释变量之前的系数为零,但在通常情况下该系数是不为零的,因此只要增加解释变量, R2就会不断的增大,这样我们就无法判断出这些解释变量是否应该包含在模型中。
(3)R2的值经常会很高,达到或更高,所以我们无法判断模型之间到底孰优孰劣。
金融计量学
为了解决上面第二个问题,我们通常用调整过的R2来代替未调整过的R2 。对R2进行调整主要是考虑到在引进一个解释变量时,会失去相应的自由度。调整过的R2用 来表示,公式为:
其中T为样本容量 ,K为自变量个数
()
金融计量学
二、假设检验
假设检验的基本任务是根据样本所提供的信息,对未知总体分布某些方面的假设做出合理解释
假设检验的程序是,先根据实际问题的要求提出一个论断,称为零假设(null hypothesis)或原假设,记为H0(一般并列的有一个备择假设(alternative hypothesis),记为H1 )
然后根据样本的有关信息,对H0的真伪进行判断,做出拒绝H0或不能拒绝H0的决策。
金融计量学
假设检验的基本思想是概率性质的反证法。
概率性质的反证法的根据是小概率事件原理。该原理认为“小概率事件在一次实验中几乎是不可能发生的”。在原假设H0下构造一个事件(即检验统计量),这个事件在“原假设H0是正确的”的条件下是一个小概率事件,如果该事件发生了,说明“原假设H0是正确的”是错误的,因为不应该出现的小概率事件出现了,应该拒绝原假设H0 。
金融计量学
假设检验有两种方法:
置信区间检验法(confidence interval approach)和显著性检验法(test of significance approach)。
显著性检验法中最常用的是t检验和F检验,前者是对单个变量系数的显著性检验,后者是对多个变量系数的联合显著性检验。
金融计量学
(一)t检验
下面我们具体介绍对方程()的系数进行t检验的主要步骤。
(1)用OLS方法回归方程(),得到β的估计值 及其标准差 。
(2)假定我们建立的零假设是: ,备则假设是 (这是一个双侧检验)。
金融计量学
则我们建立的统计量
服从自由度为T-2的t分布。
(3)选择一个显著性水平(通常是5%),我们就可以在t分布中确定拒绝区域和非拒绝区域,如图2-5。如果选择显著性水平为5%,则表明有5%的分布将落在拒绝区域
金融计量学
图2-5 双侧检验拒绝区域和非拒绝区域分布
金融计量学
(4)选定显著性水平后,我们就可以根据t分布表求得自由度为T-2的临界值,当检验统计值的绝对值大于临界值时,它就落在拒绝区域,因此我们拒绝的原假设,而接受备则假设。反之则相反。
可以看到,t检验的基本原理是如果参数的假设值与估计值差别很大,就会导致小概率事件的发生,从而导致我们拒绝参数的假设值。
金融计量学
(二)置信区间法
仍以方程的系数β为例,置信区间法的基本思想是建立围绕估计值 的一定的限制范围,推断总体参数β是否在一定的置信度下落在此区间范围内。
置信区间检验的主要步骤(所建立的零假设同 t检验)。
金融计量学
(1)用OLS法回归方程(),得到β的估计值 及其标准差 。
(2)选择一个显著性水平(通常为5%),这相当于选择95%的置信度。查t分布表,获得自由度为T-2的临界值 。
(3)所建立的置信区间为( , ) ()
金融计量学
(4)如果零假设值 落在置信区间外,我们就拒绝 的原假设;反之,则不能拒绝。
需要注意的是,置信区间检验都是双侧检验,尽管在理论上建立单侧检验也是可行的。
金融计量学
(三)t检验与置信区间检验的关系
在显著性检验法下,当 的绝对值小于临界值时,即:
()
时,我们不能拒绝原假设。
对式()变形,我们可以得到:
()
可以看到,式()恰好是置信区间法的置信区间式(),因此,实际上t检验法与置信区间法提供的结果是完全一样的。
金融计量学
(四)第一类错误和第二类错误
如果有一个零假设在5%的显著性水平下被拒绝了,有可能这个拒绝是不正确的,这种错误被称为第一类错误,它发生的概率为5%。
另外一种情况是,我们得到95%的一个置信区间,落在这个区间的零假设我们都不能拒绝,当我们接受一个零假设的时候也可能犯错误,因为回归系数的真实值可能是该区间内的另外一个值,这一错误被称为第二类错误。
在选择显著性水平时人们面临抉择:降低犯第一类错误的概率就会增加犯第二类错误的概率。
金融计量学
(五)P值
P值是计量经济结果对应的精确的显著性水平。
P值度量的是犯第一类错误的概率,即拒绝正确的零假设的概率。P值越大,错误地拒绝零假设的可能性就越大;p值越小,拒绝零假设时就越放心。现在许多统计软件都能计算各种统计量的p值,如Eviews、Stata等。
金融计量学
第三节 多变量线性回归模型的统计检验
一、多变量模型的简单介绍
考察下面这个方程:
t=1,2,3….T ()
对y产生影响的解释变量共有k-1(x2t,x3t…,xkt)个,系数(β1’β2’…..βk)分别衡量了解释变量对因变量y的边际影响的程度。
金融计量学
方程()的矩阵形式为
这里:y是T×1矩阵,X是T×k矩阵,β是k×1矩阵,u是T×1矩阵
()
金融计量学
在多变量回归中残差向量为:
()
残差平方和为:
()
金融计量学
可以得到多变量回归系数的估计表达式
()
同样我们可以得到多变量回归模型残差的样本方差
()
参数的协方差矩阵 ()
金融计量学
二、拟合优度检验
在多变量模型中,我们想知道解释变量一起对因变量y变动的解释程度。我们将度量这个信息的量称为多元判定系数R2。
在多变量模型中,下面这个等式也成立:
TSS=ESS+RSS ()
其中,TSS为总离差平方和;ESS为回归平方和;RSS为残差平方和。
金融计量学
与双变量模型类似,定义如下:
即,R2是回归平方和与总离差平方和的比值;与双变量模型唯一不同的是,ESS值与多个解释变量有关。
R2的值在0与1之间,越接近于1,说明估计的回归直线拟合得越好。
()
金融计量学
可以证明:
()
因此,
()
金融计量学
三、假设检验
(一)、t检验
在多元回归模型中,t统计量为:
……
()
均服从自由度为(n-k)的t分布。下面的检验过程跟双变量线性回归模型的检验过程一样。
金融计量学
(二)、F检验
F检验的第一个用途是对所有的回归系数全为0的零假设的检验。第二个用途是用来检验有关部分回归系数的联合检验,就方法而言,两种用途是完全没有差别的,下面我们将以第二个用途为例,对F检验进行介绍。
金融计量学
为了解联合检验是如何进行的,考虑如下多元回归模型:
()
这个模型称为无约束回归模型(unrestricted regression),因为关于回归系数没有任何限制。
金融计量学
假设我们想检验其中q个回归系数是否同时为零,为此改写公式(),将所有变量分为两组,第一组包含k-q个变量(包括常项),第二组包含q个变量:
()
金融计量学
如果假定所有后q个系数都为零,即建立零假设: ,则修正的模型将变为有约束回归模型(restricted regression)(零系数条件):
()
金融计量学
关于上述零假设的检验很简单。若从模型中去掉这q个变量,对有约束回归方程()进行估计的话,得到的误差平方和 肯定会比相应的无约束回归方程的误差平方和 大。如果零假设正确,去掉这q个变量对方程的解释能力影响不大。当然,零假设的检验依赖于限制条件的数目,即被设定为零的系数个数,以及无约束回归模型的自由度。
金融计量学
检验的统计量为:
()
在这里,分子是误差平方和的增加与零假设所隐含的参数限制条件的个数之比;分母是模型的误差平方和与无条件模型的自由度之比。如果零假设为真,式()中的统计量将服从分子自由度为q,分母自由度为N-K的F分布。
金融计量学
对回归系数的子集的F检验与对整个回归方程的F检验做法一样。选定显著性水平,比如1%或5%,然后将检验统计量的值与F分布的临界值进行比较。如果统计量的值大于临界值,我们拒绝零假设,认为这组变量在统计上是显著的。一般的原则是,必须对两个方程分别进行估计,以便正确地运用这种F检验。
金融计量学
F检验与R2有密切的联系。回想 ,则
, ()
两个统计量具有相同的因变量,因此 将上面的两个方程代入(),检验的统计量可以写成:
()
金融计量学
第四节 预测
一、预测的概念和类型
(一)预测的概念
金融计量学中,所谓预测就是根据金融经济变量的过去和现在的发展规律,借助计量模型对其未来的发展趋势和状况进行描述、分析,形成科学的假设和判断。
金融计量学
(二)预测原理
条件期望(conditional expectations),在t期Y的t+1期的条件期望值记作 ,它表示的是在所有已知的t期的信息的条件下,Y在t+1期的期望值。
假定在t期,我们要对因变量Y的下一期(即t+1期)值进行预测,则记作 。
金融计量学
在t期对Y的下一期的所有预测值中,Y的条件期望值是最优的(即具有最小方差),因此,我们有:
()
金融计量学
(三)预测的类型:
(1)无条件预测和有条件预测
所谓无条件预测,是指预测模型中所有的解释变量的值都是已知的,在此条件下所进行的预测。
所谓有条件预测,是指预测模型中某些解释变量的值是未知的,因此想要对被解释变量进行预测,必须首先预测解释变量的值。
金融计量学
(2)样本内(in-sample)预测和样本外(out-of-sample)预测
所谓样本内预测是指用全部观测值来估计模型,然后用估计得到的模型对其中的一部分观测值进行预测。
样本外预测是指将全部观测值分为两部分,一部分用来估计模型,然后用估计得到的模型对另一部分数据进行预测。
金融计量学
(3)事前预测和事后模拟
顾名思义,事后模拟就是我们已经获得要预测的值的实际值,进行预测是为了评价预测模型的好坏。
事前预测是我们在不知道因变量真实值的情况下对其的预测。
金融计量学
(4)一步向前(one-step-ahead)预测和多步向前(multi-step-ahead)预测
所谓一步向前预测,是指仅对下一期的变量值进行预测,例如在t期对t+1期的值进行预测,在t+1期对t+2期的值进行的预测等。
多步向前预测则不仅是对下一期的值进行预测,也对更下期值进行预测,例如在t期对t+1期、t+2期、…t+r期的值进行预测。
金融计量学
二、预测的评价标准
1、平均预测误差平方和(mean squared error,简记MSE)平均预测误差绝对值(mean absolute error,简记MAE)。
变量的MSE定义为:
MSE= ()
其中 ― 的预测值, ―实际值,T―时段数
金融计量学
变量的MAE定义如下:
MAE= ,变量的定义同前 ()
可以看到,MSE和MAE度量的是误差的绝对大小,只能通过与该变量平均值的比较来判断误差的大小,误差越大,说明模型的预测效果越不理想。
金融计量学
2、Theil不相等系数
其定义为: ()
注意,U的分子就是MSE的平方根,而分母使得U总在0与1之间。如果U=0,则对所有的t, 完全拟合;如果U=1,则模型的预测能力最差。因此,Theil不等系数度量的是误差的相对大小。
金融计量学
Theil不等系数可以分解成如下有用的形式:
其中 分别是序列 和 的平均值和标准差, 是它们的相关系数,即:
()
金融计量学
定义不相等比例如下:
()
()
()
金融计量学
偏误比例 表示系统误差,因为它度量的是模拟序列与实际序列之间的偏离程度。
方差比例 表示的是模型中的变量重复其实际变化程度的能力。
协方差比例 度量的是非系统误差,即反映的是考虑了与平均值的离差之后剩下的误差。
理想的不相等比例的分布是 。
比例 分别称为U的偏误比例,方差比例,协方差比例。它们是将模型误差按特征来源分解的有效方法( )。
金融计量学
第五节:模型选择
一、“好”模型具有的特性
1、节省性(parsimony)
一个好的模型应在相对精确反应现实的基础上尽可能的简单。
2、可识别性(identifiability)
对于给定的一组数据,估计的参数要有唯一确定值。
金融计量学
3、高拟合性(goodness of fit)
回归分析的基本思想是用模型中包含的变量来解释被解释变量的变化,因此解释能力的高低就成为衡量模型好坏的重要的标准。
4、理论一致性(theoretical consistency)
即使模型的拟合性很高,但是如果模型中某一变量系数的估计值符号与经济理论不符,那么这个模型就是失败的。
金融计量学
5、预测能力(predictive power)
著名经济学家弗里德曼()认为:“对假设(模型)的真实性唯一有效的检验就是将预测值与经验值相比较”。因此一个好的模型必须有对未来的较强的预测能力。
金融计量学
二、用于预测的模型的选择
因为R2将随着模型解释变量的增多而不断增加,按照此标准我们将不会得到最佳的预测模型。
因此必须对由于解释变量增多而造成自由度丢失施加一个惩罚项,其中的一个标准就是:
金融计量学
对自由度丢失惩罚更为严格的标准:
Akaike的信息准则(Akaike information criterion,简记为AIC)和Schwarz的信息准则(Schwarz information criterion,简记为SC)
金融计量学
其中 是方程随机误差项方差的估计值,k是解释变量的个数,T是样本容量。
可以看到,AIC和SC 的惩罚项 、 比 更为严厉,而且相对来说SC标准对自由度的惩罚比AIC更为严厉。无论是AIC标准还是SC标准,从预测的角度来看,度量值越低,模型的预测会更好。
金融计量学
本章小节
本章内容在计量经济学中是最基础也是最重要的部分。在这一章中,我们首先介绍了最小二乘法及其估计量的性质和分布。在此基础上我们对一元线性回归模型的统计检验进行了详细讨论,接着将模型扩展,讨论了多元线性回归模型。在用模型进行预测时,主要有两种情况:即有条件预测和无条件预测。最后一小节我们简单介绍了模型的选择。
金融计量学
第三章 异方差和自相关
金融计量学
本章要点
异方差的定义、产生原因及后果
异方差的检验方法
异方差的修正方法
自相关的产生原因
忽略自相关的严重后果
自相关的检验
自相关的修正
金融计量学
在前面的章节里我们已经完成了对经典正态线性回归模型的讨论。但在实际中,经典线性回归模型的基本假定经常是不能得到满足的,而若在此状况下仍应用OLS进行回归,就会产生一系列的问题,因此我们就需要采取不同的方法对基本假定不满足的情况予以处理。
在本章中,我们将着重考虑假定2和假定3得不到满足,即存在异方差和自相关情况下的处理办法。
金融计量学
第一节 异方差的介绍
一、异方差的定义及产生原因
异方差(heteroscedasticy)就是对同方差假设(assumption of homoscedasticity)的违反。经典回归中同方差是指随着样本观察点X的变化,线性模型中随机误差项 的方差并不改变,保持为常数,即
i=1,2,…,n ()
如果的数值对不同的样本观察值各不相同,则称随机误差项具有异方差,即
常数 i=1,2,…n ()
金融计量学
图3-1 异方差直观图
金融计量学
为什么会产生这种异方差性呢?
一方面是因为随机误差项包括了测量误差和模型中被省略的一些因素对因变量的影响,另一方面来自不同抽样单元的因变量观察值之间可能差别很大。因此,异方差性多出现在横截面样本之中。至于时间序列,则由于因变量观察值来自不同时期的同一样本单元,通常因变量的不同观察值之间的差别不是很大,所以异方差性一般不明显。
金融计量学
二、异方差的后果
一旦随机误差项违反同方差假设,即具有异方差性,如果仍然用OLS进行参数估计,将会产生什么样的后果呢?
结论就是,OLS估计量的线性和无偏性都不会受到影响,但不再具备最优性,即在所有线性无偏估计值中我们得出的估计值的方差并非是最小的。
所以,当回归模型中随机项具有异方差性时,OLS法已不再适用。
金融计量学
第二节 异方差的检验
由于异方差的存在会导致OLS估计量的最佳性丧失,降低精确度。所以,对所取得的样本数据(尤其是横截面数据)判断是否存在异方差,是我们在进行正确回归分析之前要考虑的事情。异方差的检验主要有图示法和解析法,下面我们将介绍几种常用的检验方法。
金融计量学
一、图示法
图示法是检验异方差的一种直观方法,通常有下列两种思路:
(一)因变量y与解释变量x的散点图:若随着x的增加,图中散点分布的区域逐渐变宽或变窄,或出现了偏离带状区域的复杂变化,则随机项可能出现了异方差。
(二)残差图。残差图即残差平方 ( 的估计值)与x的散点图,或者在有多个解释变量时可作残差 与y的散点图或残差 和可能与异方差有关的x的散点图。具体做法:先在同方差的假设下对原模型应用OLS法,求出和残差平方 ,再绘制残差图( , )。
金融计量学
二、解析法
检验异方差的解析方法的共同思想是,由于不同的观察值随机误差项具有不同的方差,因此检验异方差的主要问题是判断随机误差项的方差与解释变量之间的相关性,下列这些方法都是围绕这个思路,通过建立不同的模型和验判标准来检验异方差。
金融计量学
(一)Goldfeld-Quandt检验法
Goldfeld-Quandt检验法是由和于1965年提出的。这种检验方法以F检验为基础,适用于大样本情形(n>30),并且要求满足条件:观测值的数目至少是参数的二倍;随机项没有自相关并且服从正态分布。
统计假设:零假设 : 是同方差(i=1,2,…,n)
备择假设 : 具有异方差
金融计量学
Goldfeld-Quandt检验法涉及对两个最小二乘回归直线的计算,一个回归直线采用我们认为随机项方差较小的数据,另一个采用我们认为随机项方差较大的数据。如果各回归直线残差的方差大致相等,则不能拒绝同方差的原假设,但是如果残差的方差增加很多,就可能拒绝原假设。步骤为:
金融计量学
第一步,处理观测值。
将某个解释变量的观测值按由小到大的顺序排列,然后将居中的d项观测数据除去,其中d的大小可以选择,比如取样本容量的1/4。再将剩余的(n-d)个数据分为数目相等的二组。
金融计量学
第二步,建立回归方程求残差平方和。
拟合两个回归模型,第一个是关于较小x值的那部分数据,第二个是关于较大x值的那部分数据。每一个回归模型都有(n-d)/2个数据以及[(n-d)/2]-2的自由度。d必须足够小以保证有足够的自由度,从而能够对每一个回归模型进行适当的估计。
对每一个回归模型,计算残差平方和:记 值较小的一组子样本的残差平方和为 = , 值较大的一组子样本的残差平方和为 = 。
金融计量学
第三步,建立统计量。
用所得出的两个子样本的残差平方和构成F统计量:
若零假设为真,则上式中n为样本容量(观测值总数),d为被去掉的观测值数目,k为模型中自变量的个数。
金融计量学
第四步,得出结论。
假设随机项服从正态分布(并且不存在序列相关),则统计量 / 将服从分子自由度和分母自由度均为( )的F分布。
对于给定的显著性水平,如果统计量的值大于上述F分布的临界值,我们就拒绝原假设,认为残差具有异方差性。否则,就不能拒绝原假设。
金融计量学
(二)Spearman rank correlation 检验法
首先引入定义Spearman的等级检验系数:
其中 表示第i个单元或现象的两种不同特性所处的等级之差,而n表示带有级别的单元或现象的个数。
在这里,我们假设模型为:
金融计量学
第一步,运用OLS法对原方程进行回归,计算残差 = ,i=1,2…n。
第二步,计算Spearman等级相关系数。将 和解释变量观察值 按从小到大或从大到小的顺序分成等级。等级的大小可以人为规定,一般取大小顺序中的序号。如有两个值相等,则规定这个值的等级取相继等级的算术平均值。
然后,计算 与 的等级差 ,= 的等级- 的等级。最后根据公式计算Spearman等级相关系数。
金融计量学
第三步,对总体等级相关系数 进行显著性检验 : =0, : 0。样本 的显著性可通过t检验按下述方法加以检验:
t=
对给定的显著水平 ,查t分布表得 的值,若 > ,表明样本数据异方差性显著,否则,认为不存在异方差性。
对于多元回归模型,可分别计算 与每个解释变量的等级相关系数,再分别进行上述检验。
金融计量学
(三)Park检验法
Park检验法就是将残差图法公式化,提出 是解释变量 的某个函数,然后通过检验这个函数形式是否显著,来判定是否具有异方差性及其异方差性的函数结构。该方法的主要步骤如下:
第一步,建立被解释变量y对所有解释变量x的回归方程,然后计算残差 (i=1,2,…,n)
第二步,取异方差结构的函数形式为 = ,其中, 和 是两个未知参数, 是随机变量。写成对数形式则为: = 。
金融计量学
第三步,建立方差结构回归模型,同时用 来代替 ,即 = 。对此模型运用OLS法。对 进行t检验,如果不显著,则没有异方差性。否则表明存在异方差。
Park检验法的优点是不但能确定有无异方差性,而且还能给出异方差性的具体函数形式。但也有质疑,认为 仍可能有异方差性,因而结果的真实性要受到影响。
金融计量学
(四)Glejser检验法
这种方法类似于Park检验。首先从OLS回归取得残差 之后,用 的绝对值对被认为与 密切相关的X变量作回归。
有如下几种函数形式(其中 是误差项):
金融计量学
Glejser检验方法的优点是允许在更大的范围内寻找异方差性的结构函数。缺点是难于确定 的适当的幂次,这往往需要进行大量的计算。从实际方面考虑,该方法可用于大样本,而在小样本中,则仅可作为异方差摸索的一种定性技巧。
金融计量学
(五)Breusch-Pagan检验法
该方法的基本思想是构造残差平方序列与解释变量之间的辅助函数,得到回归平方和ESS,从而判断异方差性存在的显著性。
设模型为:
()
并且
()
在式()中 表示是某个解释变量或全部。
金融计量学
提出原假设为 ,
具体步骤如下:
第一步,用OLS方法估计式()中的未知参数,得
()
和 (n为样本容量) ()
第二步,构造辅助回归函数
()
式中 为随机误差项。
金融计量学
第三步,用OLS方法估计式()中的未知参数,计算解释的平方和ESS,可以证明当有同方差性,且n无限增大时有
第四步,对于给定显著性水平 ,查 分布表得 ,比较 与 ,如果
> ,则拒绝原假设,表明模型中存在异方差。
金融计量学
(六)White检验
White检验的提出避免了Breusch-Pagan检验一定要已知随机误差的方差产生的原因,并且要求随机误差服从正态分布。White检验与Breusch-Pagan检验很相似,但它不需要关于异方差的任何先验知识,只要求在大样本的情况下。
下面是White检验的基本步骤:
设二元线性回归模型为
()
金融计量学
异方差与解释变量的一般线性关系为
第一步,用OLS法估计式的参数 。
第二步,计算残差序列 和 。
第三步,求 对 , , , , 的线性回归估计式,即构造辅助回归函数。
第四步,计算统计量 ,其中n为样本容量, 为辅助回归函数中的决定系数。
金融计量学
第五步,在的 原假设下,服从自由度为5的 分布,给定显著性水平 ,查分布表得临界值 ,比较 与 ,如果前者大于后者,则拒绝原假设,表明式()中随机误差存在异方差。
此外,由于金融问题研究中经常需要处理时间序列数据,当存在异方差性的时候,可考虑用ARCH方法检验。检验异方差的方法多种多样,可以根据所研究问题的需要加以选择,也可以同时选择不同的方法,对检验结果进行分析比较,以求得出更准确的结论。
金融计量学
第三节 异方差的修正
异方差性虽然不损坏OLS估计量的无偏性和一致性,但却使它们不再是有效的,甚至不是渐近(即在大样本中)有效的。参数的显著性检验失效,降低了预测精度。故而直接运用普通最小二乘法进行估计不再是恰当的,需要采取相应的修正补救办法以克服异方差的不利影响。
其基本思路是变异方差为同方差,或者尽量缓解方差变异的程度。
在这里,我们将会遇到的情形分为两种:当误差项方差为已知和当为未知。
金融计量学
一、当为 已知:加权最小二乘法
(weighted least squares,WLS
在同方差的假定下,对不同的 , 偏离均值的程度相同,取相同权数的做法是合理的。但在异方差情况下,则是显而易见的错误,因为的 方差在不同的 上是不同的。比如在递增异方差中,对应于较大的x值的估计值的偏差就比较大,残差所反映的信息应打折扣;而对于较小的x值,偏差较小,应给予重视。
金融计量学
所以在这里我们的办法就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。这样对残差所提供信息的重要程度作一番校正,以提高参数估计的精度。
金融计量学
可以考虑用 作为 的权数。
于是加权最小二乘法可以表述成使加权残差平方和
达到最小。
金融计量学
二、当 为未知
已知真实的 可以用WLS得到BLUE估计量。但现实中多数情况下是未知的,所以还要考虑别的方法来消除异方差。一般来讲,可以将异方差的表现分为这样几种类别。我们以
为模型。
(一) 正比于 :
可对原方程做如下变换:
金融计量学
(二) 正比于 :
就可将原始的模型进行入下变换
(三) 正比于Y均值的平方:
将原模型进行如下变换:
金融计量学
在上述变换中,都可以看到对的形式采取的是一种猜测的态度,即我们也不能肯定采取哪种变换更有效。同时这些变换可能还有其他的一些问题:
1.当解释变量多于1个时,也许先验上不知道应选择哪一个X去进行变换;
2.当 无法直接得知而要从前面讨论的一个或多个变换中做出估计时,所有用到t检验F检验等的检验程序,都只有在大样本中有效。
3.谬误相关的问题。
金融计量学
三、模型对数变换法
仍以模型 为例,变量 和 分别用 和 代替,则对模型
进行估计,通常可以降低异方差性的影响。
原因?
金融计量学
第四节 金融实例分析
[例3-1]纽约股票交易所(NYSE)与美国证券交易委员会(SEC)关于经济佣金率放松管制的争论,其中异方差的检验与修正在证明规模效应存在与否起着重要的作用。
金融计量学
下面通过一个具体金融案例来讨论异方差的检验与修正过程 :
根据北京市1978-1998年人均储蓄与人均收入的数据资料,若假定X为人均收入(元),Y为人均储蓄(元),分析人均储蓄受人均收入的线性影响,可建立一元线性回归模型进行分析。
设模型为
金融计量学
图3-3 Eviews回归结果
1 用OLS估计法估计参数
金融计量学
图3-4 残差图
(1)图示法
金融计量学
(2)Goldfeld-Quandt检验
按前述检验方法,对1978~1985与1991~1998年时间段的数据进行OLS方法检验,求出F统计量,查表得是否存在异方差
金融计量学
(3)ARCH检验
图3-5 ARCH检验结果
金融计量学
异方差的修正 :WLS法
图3-6 WLS估计结果
金融计量学
对数变换法
图3-7 对数变换估计结果
金融计量学
第五节 自相关的概念和产生原因
为了能更好地说明自相关问题,我们以一个金融案例来开始本章余下三节的学习,并将在下面反复用到这个例子。
例:利率的变化
我们将用工业生产指数(IP),货币供应量增长率(GM2),以及通胀率(GPW)的函数来解释国债利率R的变化。
金融计量学
R=3个月期美国国债利率。为年利率的某一百分比
IP=联邦储备委员会的工业生产指数(1987=100)
M2=名义货币供给、以十亿美元为单位
PW=所有商品的生产价格指数(1982=100)
金融计量学
用于回归模型的货币与价格变量是:
回归方程是:(括号中为t统计量)
()()() ()
= DW= S= Mean=
金融计量学
一、滞后值与自相关的概念
在阐释自相关概念之前,先介绍滞后值的概念。一个变量的滞后值是这个变量在一段时间前的取值。举个例子: 滞后一期的取值,记为 。
y的一阶差分,记为 ,是用y的当期值减去前一期的值: ,以此类推,可以得到滞后二期,滞后三期值。
金融计量学
表3-1 当期值、滞后值、差分的关系
…
…
…
…
——
——
金融计量学
回到自相关问题,在回归模型:
经典线性回归模型(CLRM)的基本假设第三条是:
若此假设被破坏,即 , 随机误差项u的取值与它的前一期或前几期的取值(滞后值)有关,则称误差项存在序列相关或自相关。
自相关有正相关和负相关之分。实证表明:在经济数据中,常见的是正自相关。
金融计量学
(a)正自相关
金融计量学
(b)负自相关
金融计量学
(c)无自相关
金融计量学
二、自相关产生的原因
1.经济数据的固有的惯性(inertia)带来的相关
2.模型设定误差带来的相关
3.数据的加工带来的相关
金融计量学
第六节 自相关的度量与后果
一、自相关的度量
假定存在自相关,若 的取值仅与前一期 有关,即 =f( ),则称这种自相关为一阶自相关。对于一般经济现象而言,两个随机项在时间上相隔越远,前者对后者的影响越小。如果存在自相关的话,最强的自相关应该是一阶自相关。这里,我们只讨论一阶自相关,并且假定这是一种线性自相关,具有一阶线性自回归AR(1)的形式:
金融计量学
式中 为常数,称为自相关系数。 是一个新随机项,它满足经典回归的全部假定。
上式可以看成是一个一元回归模型。 是因变量, 是自变量, 是回归系数。可用OLS法估计 :
金融计量学
当 >0时,为正相关, <0为负相关。当 =0时,由上式知, = ,此时为一个没有自相关的随机变量。当 =1或 =-1时, 与 之间的相关性最强: =1表示完全一阶正相关; =-1表示完全一阶负相关。由此可见,自相关系数 是一阶线性自相关强度的一个度量,其绝对值大小决定自相关的强弱。
金融计量学
二、出现自相关后的后果
(1)最小二乘估计量仍然是线性的和无偏的,但却不是有效的。
(2)OLS估计量的方差是有偏的。
因此,在随机项存在自相关的情况下,t检验失效,同样对F检验也有类似的结果。
金融计量学
第七节 自相关的检验与修正
一、自相关的检验方法
检验自相关的方法也可以分为两种:一种是图示法,另一种是解析法。
(一)图示法
由于回归残差 可以作为随机项 的估计量, 的性质可以从 的性质中反映出来。我们可以通过观察残差是否存在自相关来判断随机项是否存在自相关。
金融计量学
1.按时间顺序绘制残差图
图3-9 利率残差
金融计量学
2.绘制 , 散点图
图3-10 利率残差 、 散点图
金融计量学
(二)解析法
通过图示法我们只能粗略的判断是否存在自相关,如果要精确地探测序列相关性,需要使用解析法。解析法是通过假设检验来探测序列相关性的,下面我们将介绍其中的几种方法。
金融计量学
-W(Durbin-Watson)检验
D-W检验的基本思想:
对一阶自相关 :
当 =0时, 不具有一阶自相关,当 时,具有一阶自相关。
D-W检验构造的统计量 :
d
金融计量学
上式可表示为:
金融计量学
图3-11 Durbin-Watson d 统计量
Durbin-Watson证明了d的实际分布介于两个极限分布之间。一个是下极限分布,其下临界值为 ,上临界值为4- ;另一个是上极限分布,其下临界值为 ,上临界值为4- 。
金融计量学
D-W检验的步骤:
(1)建立假设 :
(2)进行OLS回归并获得残差;
(3)计算d值,大多数计算软件已能够实现。比如:Eviews软件就直接可以获得;
(4)给定样本容量及解释变量的个数,从D—W表中查到临界值 和 ;
(5)将d的现实值与临界值进行比较:具体的比较过程可参见上图所示。
金融计量学
D-W检验的局限性
(1)D-W检验不适合用于自回归模型。
(2)D-W检验只适用于一阶线性自相关 。
(3)d统计量无法用来判定那些通过原点的回归模型的自相关问题。
(4)利用D-W检验检验自相关时,一般要求样本容量至少为15,否则很难对自相关的存在性做明确的结论。
金融计量学
2、杜宾-h(Durbin-h)统计量
经济学的研究过程中,遇上解释变量中包含有因变量的滞后值的情况很多,为克服这样的困境,杜宾提出了一个基于h统计量的渐近检验:
在没有自相关的原假设之下,统计量是渐近正态的,其均值为0,方差为1。当检验一阶自回归的误差时,即使X包含有多个因变量的滞后值,统计量检验仍然有效。
金融计量学
-Godfrey 检验
当序列可能存在高阶自相关,或者我们需要同时检验残差与它的若干滞后项之间是否存在相关性,此时我们可以用Breusch-Godfrey检验(简记BG检验法)。BG检验法假定误差项是由如下的阶自回归过程产生的:
建立的零假设是: =0
金融计量学
BG检验法的步骤
(1)用最小二乘法估计回归模型并得到残差
(2)将 对第一步中的所有解释变量及 的r个滞后值( )进行回归,并取得 值。由于我们取了 的r阶滞后值,所以在这次回归中我们只有 个观测值(其中T为原方程观测值个数)。
(3)BG检验建立的检验统计量是 ,在大样本的条件下,它服从自由度为p的 分布,即 。若 大于临界值,则拒绝不存在自相关的零假设,反之则不能拒绝。
金融计量学
二、自相关的修正方法
(一)已知的情况下——广义差分法:
一般在实践中,往往假定残差项存在一阶自回归方式,即:
若自相关系数 已知,自相关问题就解决。
回到前例,经过DW检验发现随机项具有正的自相关现象,并且d=。因此,直接用OLS估计就不适合了,必须先消除自相关的影响:
已知 ,则
金融计量学
我们的回归模型是:
假设随机项u具有一阶线性自相关的形式: , 满足经典回归的全部假定。
将上式滞后一期并乘以 = 得到:
金融计量学
上二式相减,得到:
令
称为广义差分变换.
金融计量学
故
满足经典回归的全部假定,变换后的模型(上式)称为广义差分模型,已经没有自相关。
以上过程就是将原回归模型进行广义差分变换得到广义差分模型,对广义差分模型应用普通最小二乘法估计,这种方法称为广义差分法。
金融计量学
(二) 未知的情况下——杜宾两步法
杜宾两步法的主要步骤如下:
第一步:对模型
进行变换得到:
金融计量学
对上式用OLS进行估计,得到:
得到的 的系数就是自相关系数 的估计值 :
金融计量学
第二步:用 对原始数据进行差分变换:
得到:
金融计量学
对上式进行OLS估计,得到:
() () ()
d=
=
所以,用杜宾两步法修正的结果为:
金融计量学
本章小结
在金融计量和经济计量诸多分析中都要面对异方差问题,异方差问题是金融计量和经济计量时不满足经典回归条件的几个主要问题之一。本章首先明确了异方差的定义,并简要说明了其产生原因及后果,在此基础上从图示法和解析法两个方面介绍了诸多异方差的检验方法,然后具体介绍了修正异方差的方法,并辅以实例详细说明了异方差检验到修正的过程。
金融计量学
另外,作为经典线性回归模型(CLRM)五个假设的有一个破坏——自相关,本章从案例出发,逐步引出自相关问题的解决思路。其中,观测是否存在自相关,可以选择图示法或者解析法;如何解决自相关问题,可以通过广义差分法或者杜宾两步法等等。如何正确、快速的选择合适的方法,不仅因具体的数据而不同,也取决于解决问题者的敏锐感觉和熟练程度。
金融计量学
第四章 多重共线性和
虚拟变量的应用
金融计量学
本章要点
多重共线性的含义
多重共线性产生的原因
多重共线性的后果
判断多重共线性的方法及其修正方法
虚拟变量的设置原则
虚拟变量模型的应用
邹氏检验的做法及缺陷
虚拟变量法检验结构稳定性的优点
金融计量学
多重共线性的概念
多重共线性(multicollinearity)一词最早由挪威经济学家弗瑞希()于1934年提出。
其原义是指回归模型中的一些或全部解释变量中存在的一种完全(perfect)或准确(exact)的线性关系。而现在所说的多重共线性,除指上述提到的完全多重共线性(perfect multicollinearity ),也包括近似多重共线性(near multicollinearity)。
金融计量学
为对上述两概念加以区别,我们以一组解释变量
为例
如果存在一组不完全为零的常数
满足 ,即任一变量都可以由其它变量的线性组合推出,则这组变量满足完全多重共线性。
若变量组 , 满足如下关系式
,其中u表示随机误差项,即某一变量不仅取决于其它变量的线性组合,也取决于随机误差项,此时变量组之间存在非严格但近似的线性关系,解释变量之间高度相关,也即变量组存在近似多重共线性关系。
金融计量学
多重共线性产生的原因
多重共线性问题在金融数据中是普遍存在的,不仅存在于时间序列数据中,也存在于横截面数据中。具体而言,多重共线性产生的原因主要有以下几点:
(1)数据收集及计算方法。
(2)模型或从中取样的总体受到限制。
(3)模型设定偏误。
此外,在观测值个数较少,以至于小于解释变量个数时,也会产生多重共线性;时间序列数据中,若同时使用解释变量的当期值和滞后值,由于当期值和滞后值之间往往高度相关,也容易产生多重共线性。
金融计量学
多重共线性的后果
多重共线性不会改变最小二乘估计的无偏性,但在解释变量之间存在严重的多重共线性而被忽略时,会对模型的估计、检验与预测产生严重的不良后果。以某一离差形式(即 )表示的二元线性回归模型 为例
若存在完全多重共线性,假设存在关系
常数 。则 的估计值
同理 也是无法确定的,即不能求得参数估计值。
金融计量学
而对于参数估计值的方差,有
同理, 的方差也是无限大的。因此,当存在完全多重共线性时,我们将不能求得参数估计值,参数估计值的方差无限大。
当存在近似多重共线性时,尽管可以求得参数估计值,但它们是不稳定的,同时参数估计值的方差将变大,变大的程度取决于多重共线性的严重程度。
金融计量学
在实际金融数据中,完全多重共线性只是一种极端情况,各种解释变量之间存在的往往是近似多重共线性,因此通常所说多重共线性造成的后果是指近似多重共线性造成的后果,具体而言,它将造成如下的后果:
(1)回归方程参数估计值将变得不精确,因为 较大的方差将会导致置信区间变宽。
(2)由于参数估计值的标准差变大,t值将缩小,使得t检验有可能得出错误的结论 。
(3)将无法区分单个变量对被解释变量的影响作用。
金融计量学
多重共线性的检验
如前所述,多重共线性普遍存在于金融、经济数据中,因此对多重共线性的检验并不是要确定其是否存在,而是要确定多重共线性的程度。
由于多重共线性是对被假定为非随机变量的解释变量的情况而言的,所以它是一种样本而非总体特征,这决定了我们只能以某些经验法则(rules of thumb)来检验模型的多重共线性。
对多重共线性的检验主要包括以下内容:
(1)检验多重共线性问题是否严重
(2)多重共线性的存在范围,即确定多重共线性
是由哪些主要变量引起的。
(3)多重共线性的表现形式,即找出与主要变量
有共线性的解释变量。
金融计量学
检验多重共线性问题是否严重
若回归模型的 值高(如 >),或F检验值显著,但单个解释变量系数估计值却不显著;或从金融理论知某个解释变量对因变量有重要影响,但其估计值却不显著,则可以认为存在严重的多重共线性问题。
若两个解释变量之间的相关系数高,比如说大于,则可以认为存在严重的多重共线性。
金融计量学
判断多重共线性的存在范围
要确定多重共线性是由哪些主要变量引起的,可以采用辅助回归法(auxiliary regression method)。所谓辅助回归是指某一解释变量对其余解释变量的回归,区别于因变量对所有解释变量回归的主回归(main regression)。
辅助回归法构造的检验统计量定义如下:
服从自由度为k-1与n-k的F分布
其中 (i=1,2,…k)为第i个解释变量 关于其余解释变量的辅助回归的拟和优度,k为解释变量的个数,n代表样本容量。
金融计量学
检验多重共线性的表现形式
当确定多重共线性是由哪些主要变量引起后,若要找出与主要变量有共线性的解释变量,即确定多重共线性的表现形式,可采用偏相关系数法。解释变量 与 偏相关系数即是在其它的解释变量固定的情况下它们之间的相关系数。
偏相关系数法构造的检验统计量定义如下:
,服从自由度为n-k-1的t分布
其中n为样本容量,k为解释变量的个数, 为 与 的偏相关系数。若 显著不为零,则认为 、 是引起多重共线性的原因,否则不是。
金融计量学
多重共线性的修正
如前所述,多重共线性在金融数据中是普遍存在的,是否对多重共线性采取修正措施取决于多重共线性的严重程度。
若多重共线性程度较轻微,并不严重影响系数估计值(符号正确,t值显著),则可以忽略多重共线性问题。若多重共线性对重要因素的系数估计值有严重的影响,则必须进行补救。
采取何种补救措施,则取决于多重共线性因素的重要性、其它数据来源的可用性、所估计模型的目的以及其它需要考虑的事项。以下将介绍几种补救措施。
金融计量学
多重共线性的修正
一、删除不必要的变量
如果在产生多重共线性的因素中有相对不重要的变量,则可试着将其删除,这是解决多重共线性最简单的方法,但删除变量也可能会导致新问题的产生:
(1)被删除变量对因变量的影响将被其它解释变量和随机误差项所吸收,这可能一方面解决了一部分变量的多重共线性问题,但另一方面却又同时增强了另一部分变量的多重共线性问题,而且,还可能使随机误差项的自相关程度增强。
(2)删除某个变量可能会导致模型设定误差(specification error)。所谓模型设定误差,指的是在建立回归模型的过程中,因为错误设定模型结构而产生的误差。错误的删除解释变量将会导致最小二乘估计值是有偏的。
金融计量学
二、改变解释变量的形式。
1、差分法 对于时间序列数据而言,若原始变量存在严重的多重共线性,则可以考虑对变量取差分形式,可在一定程度上降低多重共线性的程度。例如对于模型 ,可把变量变换为差分形式:
2、指数增长率方法 例如研究三种指数 关系时,可用如下模型:
金融计量学
3、以比率代替高度相关的变量 若模型中存在高度相关的变量,在不违反金融理论的前提下,可以求得两者之间的比率,并以此比率代替相应变量出现在模型中。
例如对于模型 ,若 与 之间高度相关,且模型的目的是用于预测,则可令 ,则
可在一定程度上消除多重共线性
此外,当模型中有 较多解释变量的滞后值,并存在严重多重共线性时,可以考虑用被解释变量的滞后值代替解释变量的滞后值;以人均形式的变量代替总体变量在某些状况下也可以在一定程度上降低多重共线性的程度。
金融计量学
多重共线性的修正
三、补充新数据。
由于多重共线性是一样本特征,故有可能在关于同样变量的另一样本中共线性没有第一个样本那么严重。Christ(1966)认为:解释变量之间的相关程度与样本容量成反比,即样本容量越小,相关程度越高;样本容量越大,相关程度越小。因此,收集更多观测值,增加样本容量,就可以避免或减轻多重共线性的危害。
金融计量学
多重共线性的修正
四、利用先验信息法。
这里的先验信息,包括从金融理论以及实际统计资料所获得的解释变量或所估计参数之间的关系。若发生多重共线性的那些解释变量之间的关系可由先验信息得到,则在所研究的模型中利用这种关系,便可以减轻多重共线性的程度。
金融计量学
金融数据的多重共线性处理 :示例
理论上,股票代表着对公司未来现金流的所有权,因此,公司未来的收益以及利息是股票价格的决定因素。而宏观经济形势能够影响到公司未来的收益,进而对股票价格产生影响。同时宏观经济形势也能够通过其它的一些渠道直接对股票价格产生影响。我们将以整个股票市场为研究对象,来考虑影响股票价格指数的宏观经济因素以及它们的影响程度。我们将采取从一般到特别的建模方式,即首先将模型中包含尽可能多的变量,然后通过各种检验逐步剔出对因变量没有解释能力的变量。
金融计量学
对影响股票价格指数宏观经济因素
的实证分析
我们选择上证综指(以Y表示)作为股票价格指数的代表。对于影响股票价格指数的宏观经济因素,初步选定如下的十个宏观变量:居民消费物价指数、商品零售物价指数、企业商品价格指数、工业增加值、固定资产投资、社会消费品零售总额、股市成交量、外汇市场交易量、汇率、货币供应量m1、进出口额。分别以 至 代表。其中前三个价格指数从不同侧面反映了我国的市场环境,而则从不同侧面反映了整体经济状况,反映了我国金融环境的影响,股市成交量从一个侧面反映了股市状况。我们采用的数据是从-月的月度数据,对于价格指数变量以及汇率,我们以原变量形式进入模型,而对于其它变量,我们取其对数形势进入模型。
金融计量学
在对数据调整后,我们建立如下的模型:
利用普通最小二乘法回归方程,得到如下的结果:
去掉不显著的变量,对模型重新回归得到:
金融计量学
在10%的显著性水平下,变量系数估计值的t值都是显著的,模型的 =, =,总体上看模型是不错的。尽管估计值的t值是显著的,我们仍来检验该模型解释变量之间是否存在多重共线性,因为若两个变量之间存在高度相关并且符号相反,他们的作用就会相互抵消,从而有可能两个变量都是显著的。
首先,根据 和 t 值,我们无法发现多重共线性,因此我们将利用变量之间的相关系数来判断。
金融计量学
在Eviews 软件中,要获得检验解释变量两两之间的相关系数矩阵是很容易的,我们只需在命令窗口中键入“COR”命令以及相应的解释变量。
图4-1 相关系数矩阵
金融计量学
分别删除 、 再进行回归得到的结果如下:
图4-2 删除 后的回归结果
金融计量学
图4-3 删除 后的回归结果
金融计量学
分别删除X6 、 X10后得到的结果如下:
图 4-4 删除X6 后的回归结果
金融计量学
图4-5 删除X10后的回归结果
金融计量学
最后得到的模型是:
我们之所以在原回归方程系数估计值都显著的情况下仍进行多重共线性检验,并删除一些变量,是因为在金融计量学中,在保证模型一定解释能力的情况下,尽可能的使模型简洁,是我们应该始终坚持的一个原则。
在这个例子中,我们仅考虑了对模型解释变量的多重共线性检验,在实际建模以及估计过程中,还应该考虑模型的自相关性、异方差性等的检验。
金融计量学
虚拟变量模型
在本章余下的四节中,我们将讨论虚拟变量在回归分析中的应用。
虚 拟变量既可以作为解释变量出现在模型中,也可以作为因变量出现在模型中,我们统称这类含虚拟变量的经济计量模型为虚拟变量模型。
金融计量学
虚拟变量的性质
在金融计量学中,所考虑的变量除了可以直接度量的数量变量(如价格、收益、收入等)之外,还有实质上是定性性质的变量,如性别、国家、战争及政府经济政策的变动等。这类定性变量常指某一性质、属性出现或不出现,例如男性或女性,中国人或外国人,战争期间或非战争期间等。由于其不能直接度量,为研究方便,可构造一个变量,令其取值为1或为0,取值为0时表示某一性质出现(不出现),取值为1时表示某性质不出现(出现),该变量即为虚拟变量(dummy variables)。
金融计量学
一般的,在虚拟变量的设置中,基础类型、否定类型取值为“0”,称为基底(base)类、基准(benchmark)类或参考(reference)类;而比较类型、肯定类型取值“1”。
虚拟变量和定量变量在回归模型中的应用是一样的。若一个模型中的解释变量全部都是虚拟变量,则此模型被称为方差分析模型(Analysis of Variance Model);若解释变量中既有定量变量,又有虚拟变量,则该线性回归模型可称为协方差分析模型(Analysis of Covariance Model)。
金融计量学
例子
在我国上市公司中,个人做第一大股东的现象还非常少,主要是国家或法人作为公司的第一大股东。而国家作为第一大股东与法人相比,除了公司业绩,还有其它考虑,例如就业、形象工程、负责人升迁、上缴利税等,这些目标都或多或少有悖于公司利润最大化的目标。另外,国家控股的公司由国家选择代理人,而这些代理人往往是行政人员或官僚出身,没有经营管理的特长,进一步制约上市公司绩效的发挥。因此,总体而言,国家作为第一大股东的上市公司的绩效要低于法人做第一大股东的上市公司的绩效。为验证上述结论,我们建立如下的模型:
金融计量学
其中 为每股收益,用以代表公司绩效。 的定义方式如下:
1,国家是公司i的第一大股东
=
0,法人是公司i的第一大股东
由模型可以得到:
国家为第一大股东平均每股收益: ︱ =
法人为第一大股东平均每股收益: ︱ =0)=
金融计量学
虚拟变量的设置原则
许多金融现象表明,金融数据特别是时间序列数据常因某些非正常因素(如战争、自然灾害等)而产生较大的波动,这种波动使得被解释变量与解释变量之间的数量依存关系在某一期或暑期内同其它各期相比具有显著的差异。这种差异表现为描述变量之间关系的回归线(面)在不同时期内或截距项移动,或斜率移动,或截距项和斜率同时移动。
金融计量学
相应的,为表述这种移动,虚拟变量的引入方式也有如下的三种:
(1)加法方式:
(2)乘法方式:
(3)同时以加法方式及乘法方式引入:
在同一个模型中,可以引入多个虚拟变量,但其设置必须遵循如下的原则:如果一个定性变量有m个类别,则仅要引入m-1个虚拟变量。
金融计量学
虚拟变量模型的运用
1、虚拟变量模型在调整季节波动中的运用
许多按月度或季度数据表示的金融时间序列,常呈现出季节变化的规律性,如公司销售额、通货膨胀率、节假日储蓄额等。在研究中,有时需要消除季节性因素的影响,即需要进行季节调整(seasonal adjustment)。进行季节调整有多种方法,而利用虚拟变量进行季节调整是较为简单的一种。
原模型:
引入虚拟变量:
金融计量学
2、虚拟变量模型在分段线性回归中的应用
在金融理论中,常常会出现一种情况:当某影响因素越过某一临界值,或时间过了某一临界点之后,因变量对影响因素的变化率将发生变化,在图形中就表现为斜率不同的两段连续折线。对构成折线的数据的回归即为分段线性回归。 例如:
利用虚拟变量,我们可以建立如下的回归模型:
金融计量学
图4-6 有两个转折点的联系折线
金融计量学
3、利用虚拟变量模型对平行数据进行混合回归
假定要研究某一类型上市公司资本结构与影响因素之间的关系,我们以总负债率(以Y表示)代表资本结构,其影响因素假设只有股权结构(以表示)、公司治理结构(以表示)、成长性(以表示)三个因素;遗憾的是,假设这一类型的上市公司只有两家,而每家也只有从1991-2004年共14年的年度数据。很明显,对每一年利用横截面数据回归是不能的(观测值个数小于待估参数的个数)。
金融计量学
而对每家公司利用时间序列数据回归,尽管可以得到系数估计值,但实际上由于两家公司类型相同,可能受某些相同因素的影响,所以两方程的随机误差项可能是同期相关的,对每个方程分别应用普通最小二乘回归是不合适的。
在此情况下,我们可以利用虚拟变量模型对时间序列和横截面数据的混合数据做出回归:
金融计量学
回归模型的结构稳定性检验—邹氏检验
一、邹氏检验的过程:
邹氏检验所依据的理论前提包括:在可能发生的结构变化前后,随机误差项具有相同的方差;随机误差项满足独立正态分布。在这些假定下,可按如下的步骤进行邹氏检验:
1、将数据以可能发生结构变化的点为界分为两部分。分别利用全部数据、两分样本对模型进行回归,并获得三次回归的残差平方和。
金融计量学
2、此时,对全部数据进行回归得到的模型是一个受约束的模型(假定模型在整段数据中不发生结构性变化,即假定系数估计值在整个样本期间是稳定的),而对两分段数据的回归则是不受约束的模型(利用两个分样本分别得到的系数估计值可以是不同的),因此对整段数据回归得到的残差平方和大于对两分样本进行回归得到的残差平方和之和,可建立如下的F检验:
它服从F(k,T-2k) 分布
金融计量学
3、查表求得在一定显著性水平下的F临界值。如果第二步计算出的F值大于临界F值,则拒绝模型结构稳定的假设;如果小于临界F值,则不能拒绝模型结构稳定性假设。
应用邹氏检验的过程中应注意以下几点:
⑴必须满足前提假设条件。
⑵邹氏检验仅仅告诉我们模型结构是否稳定,而 不能告诉我们如果结构不稳定,到底是截距还是斜率抑或两者都发生了变化,在下一节中我们将引入虚拟变量来解决这个问题。
⑶邹氏检验需要知道结构可能发生的时间点,如果不知道,则需要使用其它方法。
金融计量学
在Eviews 软件中如何做邹氏检验
货币政策往往根据宏观经济形势的变化而发生变化,这就会导致货币供应量等货币政策的中间目标可能在某个时间点发生结构性变化。
例如,以我国为例,1995-1997货币政策的主要目标是抑制通货膨胀,而1998年后由于亚洲金融危机的冲击等我国反而出现了通货紧缩,这时的货币政策也转变为“稳健的货币政策”,主要目标变为防止通货紧缩,刺激经济增长,因此货币供应量的增长在1998年可能会发生结构性的变化。为检验上述猜想,我们利用1995年第一季度到2004年第二季度的季度数据,以M2代表货币供应量,通过对GDP进行回归(因GDP增长相对稳定),并选定1998年第二季度为可能发生结构变化的转折点,来进行邹氏检验。
金融计量学
在Eviews中对下面模型进行回归
其中 、 分别表示广义货币供应量M2和GDP.
图4-7 回归方程设定
,
金融计量学
图4-8 回归结果
金融计量学
图4-9 选择邹氏检验
金融计量学
图4-10 确定邹氏检验转折点
图4-11 邹氏检验结果
金融计量学
回归模型的结构稳定性检验
——虚拟变量法
邹氏检验只能告诉我们结构是否发生变化,而不能告诉我们到底是截距还是斜率发生了变化,虚拟变量法则能有效地解决这一问题。下面我们将通过一个例子来说明如何运用虚拟变量法对模型进行结构稳定性检验。
对于一元线形模型 ,假定在时刻,由于外部事件的冲击,我们怀疑模型的结构可能发生了变化。为验证这一观点,我们可以建立如下的虚拟变量模型
金融计量学
1
其中 =
0
可见, ︱ =0, )= ,表示的是发生结构变化前的关系;
︱ =1, )=
表示的是可能的结构变化发生后的关系。
利用全部数据对上述虚拟变量模型进行最小二乘回归,并对参数估计值进行显著性检验 。
金融计量学
可见,与邹氏检验相比,在检验模型结构稳定性方面虚拟变量法具有如下的优点:
(1)较之邹氏检验的三次回归,虚拟变量法只需作一次总的回归,因而显得简单。
(2)能够清楚表明是截距或斜率抑或两者都发生了变化。
(3)由于合并两个回归而减少了虚拟变量的个数,增加了自由度,从而参数估计的准确性也有所改进。
金融计量学
实例—虚拟变量在金融数据处理中的作用
根据Fama的有效市场理论,在有效市场中,由于股票价格能够及时地反映所有的信息,因此股价将会呈现出随机波动的特征。并且,在有效市场中,由于投资者能够随时获取所需要的信息,因此将不存在套利的机会,股票的价格将反映价值。按照有效市场理论,一周内每天的收益率将是随机波动、没有规律的。因为如果假设某天的收益率比其他各天的收益率高或者低,由于投资者可随时掌握所需要的信息,并且做出理性的选择,因此他们将充分利用这个套利机会来获取超额收益率。而随着套利过程的进行,超额收益率也会逐渐减少直至消失,从而每天的收益率又将会呈现出无规律的波动。
金融计量学
下面我们将利用虚拟变量模型对这一现象进行实证检验:
数据描述:我们利用的是上海股票市场上证指数1997年1月1日到2004年12月31日的日收盘价数据,共1926个观测值。收益率的计算我们采用的是连续收益率法,计算公式如下
我们建立如下的虚拟变量模型:
金融计量学
图4-12 上证指数日收益线性图
金融计量学
使用软件对上述模型进行OLS回归,得到如下结果(括号内为相应的t值):
对模型各系数估计值进行联合F检验,看各系数值是否同时为零,结果的到F值为,其概率值为,因此不能拒绝各系数值同时为零的假设,则可以得出结论,上海股票市场不存在周内效应。
金融计量学
本章小结
本章主要分为两部分,在第一部分中我们主要讨论了金融数据中存在的多重共线性现象。第二部分我们主要介绍了虚拟变量的应用。在接下来的部分中,我们主要介绍了如何进行模型的结构稳定性检验的两种方法:邹氏检验和虚拟变量法 。
金融计量学
第五章
时间序列数据的平稳性检验
金融计量学
本章要点
平稳性的定义
平稳性的检验方法(ADF检验)
伪回归的定义
协整的定义及检验方法(AEG方法)
误差修正模型的含义及表示形式
金融计量学
第一节 随机过程和平稳性原理
一、随机过程
一般称依赖于参数时间t的随机变量集合{ }为随机过程。
例如,假设样本观察值y1,y2…,yt是来自无穷随机变量序列…y-2, y-1,y0 ,y1 ,y2 …的一部分,则这个无穷随机序列称为随机过程。
金融计量学
随机过程中有一特殊情况叫白噪音,其定义如下:如果随机过程服从的分布不随时间改变,且
(对所有t)
(对所有t)
( )
那么,这一随机过程称为白噪声。
金融计量学
二、平稳性原理
如果一个随机过程的均值和方差在时间过程上都是常数,并且在任何两时期的协方差值仅依赖于该两时期间的距离或滞后,而不依赖于计算这个协方差的实际时间,就称它为平稳的。
金融计量学
平稳随机过程的性质:
均值 (对所有t)
方差 (对所有t)
协方差 (对所有t)
其中 即滞后k的协方差[或自(身)协方差], 是 和 ,也就是相隔k期的两值之间的协方差。
金融计量学
三、伪回归现象
将一个随机游走变量(即非平稳数据)对另一个随机游走变量进行回归可能导致荒谬的结果,传统的显著性检验将告知我们变量之间的关系是不存在的。
有时候时间序列的高度相关仅仅是因为二者同时随时间有向上或向下变动的趋势,并没有真正的联系。这种情况就称为“伪回归”(Spurious Regression)。
金融计量学
第二节 平稳性检验的具体方法
一、单位根检验
(一)单位根检验的基本原理
David Dickey和Wayne Fuller的单位根检验(unit root test)即迪基——富勒(DF)检验,是在对数据进行平稳性检验中比较经常用到的一种方法。
金融计量学
DF检验的基本思想:
从考虑如下模型开始:
()
其中 即前面提到的白噪音(零均值、恒定方差、非自相关)的随机误差项。
金融计量学
由式(),我们可以得到:
()
()
…
()
金融计量学
依次将式()…()、()代入相邻的上式,并整理,可得:
()
根据 值的不同,可以分三种情况考虑:
(1)若 <1,则当T→∞时, →0,即对序列的冲击将随着时间的推移其影响逐渐减弱,此时序列是稳定的。
金融计量学
(2)若 >1,则当T→∞时, →∞,即对序列的冲击随着时间的推移其影响反而是逐渐增大的,很显然,此时序列是不稳定的。
(3 )若 =1,则当T→∞时, =1,即对序列的冲击随着时间的推移其影响是不变的,很显然,序列也是不稳定的。
金融计量学
对于式(),DF检验相当于对其系数的显著性检验,所建立的零假设是:H0 : 如果拒绝零假设,则称Yt没有单位根,此时Yt是平稳的;如果不能拒绝零假设,我们就说Yt具有单位根,此时Yt被称为随机游走序列(random walk series)是不稳定的。
金融计量学
方程()也可以表达成:
()
其中 = - , △是一阶差分运算因子。此时的零假设变为:H0: =0。注意到如果不能拒绝H0,则 = 是一个平稳序列,即 一阶差分后是一个平稳序列,此时我们称一阶单整过程(integrated of order 1)序列,记为I (1)。
金融计量学
I (1)过程在金融、经济时间序列数据中是最普遍的,而I (0)则表示平稳时间序列。
从理论与应用的角度,DF检验的检验模型有如下的三个:
()
()
()
金融计量学
其中t是时间或趋势变量,在每一种形式中,建立的零假设都是:H0: 或H0: ,即存在一单位根。( )和另外两个回归模型的差别在于是否包含有常数(截距)和趋势项。如果误差项是自相关的,就把()修改如下:
()
金融计量学
式()中增加了 的滞后项,建立在式()基础上的DF检验又被称为增广的DF检验(augmented Dickey-Fuller,简记ADF)。ADF检验统计量和DF统计量有同样的渐近分布,使用相同的临界值。
金融计量学
(二)ADF检验模型的确定
首先,我们来看如何判断检验模型是否应该包含常数项和时间趋势项。解决这一问题的经验做法是:考察数据图形
其次,我们来看如何判断滞后项数m。在实证中,常用的方法有两种:
金融计量学
(1)渐进t检验。该种方法是首先选择一个较大的m值,然后用t检验确定系数是否显著,如果是显著的,则选择滞后项数为m;如果不显著,则减少m直到对应的系数值是显著的。
(2)信息准则。常用的信息准则有AIC信息准则、SC信息准则,一般而言,我们选择给出了最小信息准则值的m值
金融计量学
二、非平稳性数据的处理
一般是通过差分处理来消除数据的不平稳性。即对时间序列进行差分,然后对差分序列进行回归。对于金融数据做一阶差分后,即由总量数据变为增长率,一般会平稳。但这样会让我们丢失总量数据的长期信息,而这些信息对分析问题来说又是必要的。这就是通常我们所说的时间序列检验的两难问题。
金融计量学
第三节 协整的概念和检验
一、协整的概念和原理
有时虽然两个变量都是随机游走的,但它们的某个线形组合却可能是平稳的。在这种情况下,我们称这两个变量是协整的。
比如:变量Xt和Yt是随机游走的,但变量Zt=Xt+Yt可能是平稳的。在这种情况下,我们称Xt和Yt是协整的,其中 称为协整参数(cointegrating parameter)。
金融计量学
为什么会有协整关系存在呢?
这是因为虽然很多金融、经济时间序列数据都是不平稳的,但它们可能受某些共同因素的影响,从而在时间上表现出共同的趋势,即变量之间存在一种稳定的关系,它们的变化受到这种关系的制约,因此它们的某种线性组合可能是平稳的,即存在协整关系。
金融计量学
假如有序列Xt和Yt,一般有如下性质存在:
(1) 如果Xt~ I (0),即Xt是平稳序列,则a+bXt也是I (0);
(2) 如果Xt~ I (1),这表示Xt只需经过一次差分就可变成平稳序列。那么a+bXt也是I (1);
(3) 如果Xt和Yt都是I (0),则aXt+bYt是I (0) ;
金融计量学
(4)如果Xt~ I (0),Yt~ I (1),则aXt+bYt是I (1),即I (1)具有占优势的性质。
(5)如果Xt和Yt都是I (1),则aXt+bYt一般情况下是I (1),但不保证一定是I (1)。如果该线性组合是I (0),Xt和Yt就是协整的,a、b就是协整参数。
金融计量学
二、协整检验的具体方法
(一)EG检验和CRDW检验
假如Xt和Yt都是I (1),如何检验它们之间是否存在协整关系,我们可以遵循以下思路:
首先用OLS对协整回归方程 进行估计。
然后,检验残差 是否是平稳的。因为如果Xt和Yt没有协整关系,那么它们的任一线性组合都是非平稳的,残差 也将是非平稳的。
金融计量学
检验 是否平稳可以采用前文提到的单位根检验,但需要注意的是,此时的临界值不能再用(A)DF检验的临界值,而是要用恩格尔和格兰杰(Engle and Granger)提供的临界值,故这种协整检验又称为(扩展的)恩格尔格兰杰检验(简记(A)EG检验)。
金融计量学
此外,也可以用协整回归的Durbin-Watson统计检验(Cointegration regression Durbin-Watson test,简记CRDW)进行。CRDW检验构造的统计量是:
对应的零假设是:DW=0
金融计量学
若 是随机游走的,则 的数学期望为0,所以Durbin-Watson统计量应接近于0,即不能拒绝零假设;如果拒绝零假设,我们就可以认为变量间存在协整关系。
上述两种方法存在如下的缺点:
(1)CRDW检验对于带常数项或时间趋势加上常数项的随机游走是不适合的,因此这一检验一般仅作为大致判断是否存在协整的标准。
(2)对于EG检验,它主要有如下的缺点:
金融计量学
①当一个系统中有两个以上的变量时,除非我们知道该系统中存在的协整关系的个数,否则是很难用EG法来估计和检验的。因此,一般而言,EG检验仅适用于包含两个变量、即存在单一协整关系的系统。
②仿真试验结果表明,即使在样本长度为100时,协整向量的OLS估计仍然是有偏的,这将会导致犯第二类错误的可能性增加,因此在小样本下EG检验结论是不可靠的。
金融计量学
(二)Johansen协整检验。
(1)Johansen协整检验的基本思想
其基本思想是基于VAR模型将一个求极大似然函数的问题转化为一个求特征根和对应的特征向量的问题。
下面我们简要介绍一下Johansen协整检验的基本思想和内容:
金融计量学
对于如下的包含g个变量,k阶滞后项的VAR模型:
()
假定所有的g个变量都是I(1)即一阶单整过程。其中,yt、yt-1…yt-k为g×1列向量,β1β2…βk为g×g系数矩阵, 为白噪音过程的随机误差项组成的g×1列向量。
金融计量学
对式做适当的变换,可以得到如下的以VECM形式表示的模型:
()
其中 ,Ig为g阶单位矩阵,
金融计量学
我们所感兴趣的是 系数矩阵,它可以看作是一个代表变量间长期关系的系数矩阵。因为在长期达到均衡时,式所有的差分变量都是零向量, 中随机误差项的期望值为零,因此我们有 =0,表示的是长期均衡时变量间的关系。
金融计量学
对变量之间协整关系的检验可以通过计算 系数矩阵的秩及特征值来判断。将 系数矩阵的特征值按照从大到小的顺序排列,即: 。如果变量间不存在协整关系(即长期关系),则的秩就为零 。
金融计量学
Johansen协整检验有两个检验统计量:
①迹检验统计量 :
,其中r为假设的协整关系的个数, 为 的第i个特征值的估计值(下同)。对应的零假设是:H0:协整关系个数小于等于r;被择假设:H1:协整关系个数大于r。
②最大特征值检验统计量 :
对应的零假设:H0:协整关系个数等于r;相应的被择假设:H1:协整关系个数为r+1。
金融计量学
首先看 ,
迹检验实际上是一个联合检验: ,因为当 时, 也为零,且在 范围内, 越大, 越小, 越大。如果 大于临界值,则拒绝零假设,说明存在的协整个数大于r,这时应继续检验新的零假设:协整关系个数小于等于r+1…直至 小于临界值。
金融计量学
再来看 。当 大于临界值时,我们拒绝协整关系个数等于r的原假设,然后继续检验新的假设:协整关系个数为r+1,…,直到 小于临界值 。
Johansen协整检验的临界值已由Johansen给出。在实际应用中,上述两个检验可以同时使用,一般而言,两种检验给出的结果是相同的,但也可能会给出不同的结论。
金融计量学
(2)Johansen协整检验模型形式的确定。
Johansen协整检验方程形式的确定包括两部分:一是确定VECM模型和 是否应包含常数项和时间趋势项;二是确定滞后项数(即k值)。 对于前者,我们可以根据变量的数据图形来检验(同ADF检验);对于后者,我们可以利用前面ADF检验中提到的渐进t检验和信息准则法。
金融计量学
(3)如何在Eviews软件中做Johansen协整检验
下面我们通过一个例子说明如何在Eviews软件中做Johansen协整检验。
[例]:对我国货币政策传导机制信贷渠道的实证检验
金融计量学
利用我国的数据对信贷渠道进行实证分析,来看变量之间是否存在长期稳定的关系,即协整关系。我们以货币供应量M1和M2作为货币政策的起始变量,以金融机构贷款余额(DEBT)表示信贷量,以其作为中间变量,以GDP和零售物价指数(CPI)作为货币政策的效果变量。
金融计量学
1、对原始数据进行适当的处理,如季节调整、对数化等。
2、对变量进行平稳性检验。
3、如果变量水平值是不平稳的,我们就要对它的一阶差分进行平稳性检验 。
4、进行协整检验 ,并进行济济学意义上的分析。
金融计量学
第四节 误差修正模型
Engle和Granger于1987年提出了误差修正模型的完整定义并加以推广。
假设Yt和Xt之间的长期关系式为:
()
式中,K和 为估计常量。例如,Y可以是商品的需求量,X则是价格。 就是Y对X的长期弹性。
金融计量学
对式()两边取对数可得:
所以当y不处在均衡值的时候,等式两边就会有一个差额存在,即
()
来衡量两个变量之间的偏离程度。当X、Y处于均衡的时候,这时误差值为零。
()
我们用小写字母表示对数,其中 =ln(K)。但是这种均衡情况在经济体系中是很少存在的。
金融计量学
由于X和Y通常处于非均衡状态,可以建立一个包含X和Y滞后项的短期或非均衡关系,假设采取如下形式:
()
()式是基础的形式,只包括一阶滞后项,说明对于变量X的变化,变量Y需要一段时间进行调整。
金融计量学
在对()进行估计的时候,其中的变量可能是不平稳的,不能运用OLS估计,否则将出现伪回归现象。对此,重新进行转化。两边分别减去yt-1 :得
并进一步进行变化:
即,
()
()
金融计量学
并进一步进行变化:
,即:
()
在这里 。我们对上式进行重新整理,得到:
金融计量学
在这里 。我们对上式进行重新整理,得到:
()
其中定义新变量β1=(b1+b2)/ ,并进一步进行变换得到:
()
其中定义第二个新变量β0=b0/ 。
金融计量学
根据式(),Y的当前变化决定于X的变换以及前期的非均衡程度,也就是说前期的误差项对当期的Y值进行调整。所以()就是一阶误差修正模型,也是最简单的形式。
表示系统对均衡状态的偏离程度,可以称之为“均衡误差”。
在模型()中, 描述了对均衡关系偏离的一种长期调解。这样在误差修正模型中,长期调节和短期调节的过程同样被考虑进去。因而,误差修正模型的优点在于它提供了解释长期关系和短期调节的途径。
金融计量学
当 且 的时候,后者意味着 比均衡值高出太多。由于 ,那么 ,因此 。换句话说,如果 高于均衡值水平,那么在下一个时间段, 会开始下降,误差值就会被慢慢修正,这就是所说的误差修正模型。当 ,则是完全相反的情况,整个机制是相同的。
金融计量学
误差修正模型包含了长期和短期的信息。长期的信息包含在 项里,因为β仍然是长期乘数,且误差项来自x和y的回归方程。短期信息一部分显示在均衡误差项中,即当y处于非均衡状态时,在下一期里会由于误差项的调整慢慢向均衡值靠拢;另一部分信息来自△Xt,解释变量的概括。这一项表明,当x发生变化,y也会相应的发生变化。
金融计量学
第五节 因果检验
因果关系检验主要有两种:格兰杰(Granger)因果检验和希姆斯(Sims)检验
一、格兰杰因果检验
该理论的基本思想是:变量x和y,如果x的变化引起了y的变化,x的变化应当发生在y的变化之前。即如果说“x是引起y变化的原因”,则必须满足两个条件:
金融计量学
第一,x应该有助于预测y,即在y关于y的过去值的回归中,添加x的过去值作为独立变量应当显著的增加回归的解释能力。
第二,y不应当有助于预测x,其原因是如果x有助于预测y,y也有助于预测x,则很可能存在一个或几个其他的变量,它们既是引起x变化的原因,也是引起y变化的原因。
金融计量学
要检验这两个条件是否成立,我们需要检验一个变量对预测另一个变量没有帮助的原假设。首先,检验“x不是引起y变化的原因”的原假设,对下列两个回归模型进行估计:
无假设条件回归:
有假设条件回归:
()
()
金融计量学
然后用各回归的残差平方和计算F统计值,检验系数β1,β2,…,βm是否同时显著的不为0。如果是这样,我们就拒绝“x不是引起y变化的原因”的原假设。
金融计量学
其中F统计值的构成为:
()
其中 和 分别为有限制条件回归和无限制条件回归的残差平方和;N是观察个数;K是无限制条件回归参数个数;q是参数限制个数。该统计量服从F(q, N-K)分布。
金融计量学
显然,如果F统计值大于临界值,我们就拒绝原假设,得到x是引起y变化的原因。反之,接受原假设。
接下来,检验“y不是引起x变化的原因”的原假设,做同样的回归估计,但是交换x与y,检验y的滞后项是否显著的不为0。
要得到x是引起y变化的原因的结论,我们必须拒绝原假设“x不是引起y变化的原因”,同时接受原假设“y不是引起x变化的原因”。
金融计量学
需要注意的是,格兰杰因果检验的结果对式()中滞后项数m是非常敏感的,m值不同,得到的结果也有可能不同。为保证结果的正确性,一般来说,最好多试验几个不同的m值,以保证结果不受m选择的影响。还要注意这个因果关系检验的一个不足之处是第三个变量z也可能是引起y变化的原因,而且同时又与x相关。
金融计量学
二.希姆斯检验
希姆斯检验的思想是认为未来发生的变化不能影响现在。和格兰杰检验一样,有着比较直观的解释。其非限制性方程如下:
()
注意上式中X是因变量而非自变量。其中零假设是Y不是X的原因,采用了 ,若Y是X 的原因,则 不成立。希姆斯检验方法的缺点在于m的确定,m多增加一个,自由度就会相应减少一个。
金融计量学
第六节 实例—金融数据的平稳性检验
下面我们借用Eviews来分析一下上海证券市场A股成份指数(简记SHA)和深圳证券市场A股成份指数(简记AZA)之间的关系,同时也通过这个实例来回顾一下Eviews的使用。
金融计量学
步骤如下:
1、对数据进行平稳性检验
2、协整检验
3、因果检验
4、误差纠正机制ECM(error correction mechanism)
5、经济学分析
金融计量学
本章小节
本章主要介绍了经济时间序列存在的不平稳性,并提供了DF和ADF两种检验平稳性的方法。不平稳的序列容易导致伪回归问题,为解决伪回归问题引出了协整检验,详细介绍了协整的概念和具体的协整检验过程。协整描述了变量之间的长期关系,为了进一步研究变量之间的短期均衡的存在,介绍了误差纠正模型。在讨论变量之间的因果关系的时候,介绍了格兰杰和希姆斯因果检验两种方法。
金融计量学
第六章 动态模型
金融计量学
本章要点
ARDL模型的概念、优点、结构与构造
ARIMA类模型的概念
AR模型稳定性的条件,AR模型和MA模型的相互转化
AR模型、MA模型、ARMA模型自相关函数、偏自相关函数的特点
信息准则的基本原理
VAR模型的概念、构造及格兰杰因果检验、脉冲响应
GARCH类模型的概念
ARCH效应的检验
金融计量学
第一节
ARDL模型的概念和构造
金融计量学
ARDL模型的概念
ARDL(autoregressive distributed lag)称为自回归分布滞后模型。
计量软件Microfit,可用来对ARDL模型进行方便的估计.
ARDL模型的优点
相比于标准的协整检验,不论变量是否同为过程,或同为过程,既不需要变量同阶单整,都可以用ARDL模型来检验变量之间的长期关系。
金融计量学
ARDL模型的的结构
一个典型的 模型的结构如下:
其中
表示 滞后的阶数, 表示第i个自变量 滞后的阶数, 。L是滞后算子(lag operator),它可用下式定义: , 是s行、1列的确定向量
金融计量学
ARDL建模的基本方法
ARDL建模的方法包括两个阶段:
第一阶段,建立与该ARDL模型相对应的误差修正模型(ECM),并计算出ECM模型中的F统计量。以此判断变量间是否存在长期稳定的关系。
第二阶段,运用ARDL模型,估计变量之间长期关系的系数。
金融计量学
实例-ARDL模型在金融数据中的应用
研究对象
美国非耐用消费品支出LC与真实可支配收入LY,通胀率DP之间的关系
数据
1960年1季度到1994年1季度的季度数据
金融计量学
首先,我们调用Microfit软件读入该数据文件。对原始数据进行取对数作差分的处理。
对应于ARDL(4,4,4)中变量LC,LY和DP的误差修正模型(ECM)如下:
原假设:变量间不存在稳定的长期关系,即:
择备假设: 或 或
金融计量学
图 6-3 假设检验的结果
计算F统计量,检验三者之间是否具有长期关系
金融计量学
图6-5 ARDL(1,2,0)估计结果
用Microfit软件中的ARDL选项来估计变量间的长期系数以及相应的误差修正模型ECM
金融计量学
图6-6 ARDL(2,2,3)估计结果
金融计量学
图6-8 AIC准则选定的误差修正模型结果
金融计量学
图6-10 预测结果
金融计量学
第二节
ARIMA模型的概念和构造
金融计量学
ARIMA模型的概念
所谓ARIMA模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。
ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA)、自回归过程(AR)、自回归移动平均过程(ARMA)以及ARIMA过程。
金融计量学
移动平均过程
一个q阶的移动平均(MA)过程可用下式表示:
其中u为常数项, 为白噪音过程
引入滞后算子L,原式可以写成:
或者
其中
金融计量学
MA(q)过程的特征
1、
2、
3、自协方差
①当k>q时 =0
②当k<q时
对于任意的,MA(q)是平稳的。
金融计量学
自回归过程
一个p阶自回归(AR)过程可以用下式表示:
其中, 为白噪音过程
引入滞后算子,则原式可写成
或者
其中
金融计量学
AR(p)过程平稳的条件
如果特征方程:
的根全部落在单位圆之外,则该AR(p)过程是平稳的。
金融计量学
AR(p)过程的特征
=0, 的无条件期望是相等的,若设为u,则得到 :
金融计量学
再看方差和协方差
……
将上述p+1个方程联立,得到所谓的Yule-Walker方程组,共p+1个方程,p+1个未知数,得出AR(p)过程的方差及各级协方差。
金融计量学
自回归移动平均(ARMA)过程
将MA(q)过程与AR(p) 过程合并,我们就可以得
到一个ARMA(p,q)过程,其形式如下:
其中 为白噪音过程。
若引入滞后算子,可以写成
其中
金融计量学
ARMA过程平稳性的条件
ARMA过程的平稳性取决于它的自回归部分。
当满足条件:
特征方程的根全部落在单位圆以外时,ARMA(p,q)是一个平稳过程。
金融计量学
ARMA(p, q)过程的特征
1、
2、 对于ARMA(p, q)过程的方差和协方差,由于
其较复杂,我们不再涉及。
金融计量学
自回归单整移动平均过程
如果序列 经过 d 次差分得到平稳序列 ,并且用ARMA(p,q)过程对W t建立模型,即W t为一个ARMA(p,q)过程,则我们称Y t为(p,d,q)阶自回归单整移动平均过程,简称ARIMA(p,d,q)。
引入滞后算子L, ARIMA(p,d,q)过程可表示为:
其中, 为白噪音过程,
金融计量学
AR、MA过程的相互转化
结论一:对于一个平稳的AR(p)过程,它可以转化为一个MA(∞)过程,可采用递归迭代法完成转化。
结论二:对于一个MA(q)过程,
其中
若其特征方程
的根都落在单位圆外,则称该 MA(q)过程具有可逆性,此时MA(q)过程可转化为AR(∞)。
注意:平稳性和可逆性的概念在数学语言上是完全等价的,所不同的是,前者是对AR过程而言的,而后者是对MA过程而言的。
金融计量学
Box-Jenkins方法论
建立回归模型时,应遵循节俭性(parsimony)的原则 。
博克斯和詹金斯(Box and Jenkins)提出了在节俭性原则下建立ARIMA模型的系统方法论,即Box-Jenkins方法论 。
Box-Jenkins方法论 的步骤:
步骤1:模型识别
步骤2:模型估计,
步骤3:模型的诊断检验
步骤4:模型预测。
金融计量学
ARIMA模型的识别
在ARIMA模型的识别过程中,我们主要用到两个工具:自相关函数(autocorrelation function,简称ACF),偏自相关函数(partial autocorrelation function,简称PACF)以及它们各自的相关图(即ACF、PACF相对于滞后长度描图)。
我们首先介绍自相关函数和偏自相关函数的定义。
金融计量学
自相关函数和偏自相关函数
(1)自相关函数
对于一个序列 来说,它的第j阶自相关系数(记作 )定义为它的j阶自协方差除以它的方差,即 , 的取值范围是 。
可以看到, (j=0,1,2...)可看作是关于j的函数,因此我们也称之为自相关函数,通常记ACF(j)
(2)偏自相关函数
偏自相关系数度量了消除中间滞后项影响后两滞后变量之间的相关关系。偏自相关函数记为PACF(j) 。
金融计量学
(3)自相关函数和偏自相关函数的联系
2阶以上的偏自相关函数计算公式较为复杂,这里不再给出。
金融计量学
MA、AR、ARMA过程自相关函数及偏自相关函数的特点
⑴MA(q)过程的自相关函数
1≤j≤q
j>q时,ACF(j)=0,此现象为截尾,是MA(q)过程的一个特征
如下图:
金融计量学
图6-11 MA(2)过程
金融计量学
⑵ AR(p)过程的偏自相关函数
时,偏自相关函数的取值不为0
时,偏自相关函数的取值为0
AR(p)过程的偏自相关函数p阶截尾
如下图:
金融计量学
图6-12 AR(1)过程
金融计量学
图6-13 AR(1)过程
金融计量学
⑶AR(p)过程的自相关函数以及MA(q)过程的偏自相关函数
平稳的AR(p)过程可以转化为一个MA(∞)过程,则AR(p)过程的自相关函数是拖尾的
一个可逆的MA(q)过程可转化为一个AR(∞)过程,因此其偏自相关函数是拖尾的。
金融计量学
图6-14 ARMA(1,1)过程
⑷ARMA(p,q)过程的自相关函数和偏自相关函数
ARMA过程的自相关函数和偏自相关函数都是拖尾的
金融计量学
利用自相关函数、偏自相关函数
对ARIMA模型进行识别
对ARIMA(p,d,q)过程进行识别,我们首先要确定的是该过程是否是平稳的,如果不是,通过几次差分可以得到平稳序列,即首先我们需要确定d的值。对此,我们可以用前面一章提到的ADF检验,也可以通过自相关函数来判断。如果d次差分后的序列其自相关函数很快下降为0,则说明差分后的序列是平稳的,反之则不平稳。
金融计量学
在确定d的值后,接下来我们利用自相关函数、偏自相关函数以及它们的图形来确定p, q的值。一般而言,可遵循如下的经验准则:
(1)如果某序列的自相关函数是截尾的,即过了某一滞后项数(设为q)后,自相关函数值变得不显著,接近于0,并且偏自相关函数是拖尾的,则我们可以把该序列设为MA(q)过程。
金融计量学
(2)如果某序列的偏自相关函数是截尾的,即过了某一滞后项数(设为p)后,偏自相关函数值变得不显著,接近于0,并且自相关函数是拖尾的,则我们可以把该序列设为AR(P)过程。
(3)如果某序列的自相关函数、偏自相关函数都是拖尾的,则可以把该序列设为ARMA(p,q)过程。而关于p, q的值需要不断地从低阶试探,但一般而言,ARMA(1,1)过程在文献中是最常见的。
金融计量学
ARIMA模型的估计
矩估计 这种方法就是利用样本自协方差函数和
样本自相关函数,对模型的参数作估计。
极大似然估计 它又包括无条件极大似然估计、条件极大似然估计、精确似然估计等方法。
非线性估计 它主要是利用了迭代搜索的思想。
最小二乘估计 对于不包含MA部分的ARIMA模型(即AR模型),我们可以利用普通最小二乘法对参数进行估计。
金融计量学
ARIMA模型的诊断
在对模型参数进行估计后,下一步我们要对所估计的模型是否很好的拟合了数据进行诊断。如果模型很好的拟合了数据,那么残差应该是一个白噪音过程,即不同时期的残差是不相关的。
为检验残差是否各期不相关,我们可以求得残差各阶的自相关系数 、 …, 然后对联合假设:
进行检验。如果不能拒绝原假设,说明残差是各期不相关的;如果拒绝原假设,则说明残差存在自相关,原模型没有很好的拟合数据。
金融计量学
在上述检验中,经常用到的一个检验统计量是Box和Pierce提出的Q统计量,它的定义如下:
,近似服从(大样本中) 分布
其中n为样本容量,m为滞后长度。
需要注意的是,Box和Pierce提出的Q统计量具有不佳的小样本性质,于是Ljung和Box(1978)提出了一个具有更好小样本性质的统计量,称之为LB统计量。 定义如下:
服从分布 ,其中n为样本容量,m为滞后长度。
金融计量学
对ARIMA模型的诊断还有另一方面,即尽管现在的模型能够很好的拟合数据,但我们想知道是否还存在一个更好的模型,能够更好的拟合数据和进行预测。
一般的做法是在模型中增加滞后项(因为我们是从低阶试起的),然后根据信息准则(information criteria)来判断。
金融计量学
常用的信息准则有以下几个:
Akaike 信息准则
Schwarz 信息准则
Hannan-Quinn 信息准则
其中 为残差平方, 是所有估计参数的个数,T为样本容量。
金融计量学
ARIMA模型的预测
以平稳的AR(2)过程为例:
其中 为零均值白噪音过程
由模型的平稳性,我们有:
……
金融计量学
在t时刻,预测 的值:
=
在t时刻,预测 的值:
同理:
…
可以看到,在应用AR(2)模型进行预测时,除向前一步预测是无条件预测外,其它的预测都要用到前期的预测值。
另外,我们不加证明的给出下面的结论:随着预测时间的增大,AR过程的预测值将趋向于序列的均值。
金融计量学
下面我们再来看利用MA过程进行的预测。以一
个MA(2)过程为例:
我们可以求得:
…
可以看到,对于MA(2)过程,2期以后的预测值都
是常数项,即MA(2)过程仅有2期的记忆力。而如
果常数项为0的话,那么2期之后的预测都将为0。
金融计量学
利用ARMA过程进行预测
利用ARMA过程进行预测的过程,实际上相当于对AR过程和MA过程进行预测的结合,方法与分别利用AR过程和MA过程进行预测是相同的,我们不再介绍。
由于ARMA(p,q)过程中MA(q)过程仅有q期的记忆力,因此利用ARMA(p, q)向前进行q期以外的预测,结果与利用AR(p)过程预测的结果是一样的。随着预测期数的增加,预测值将趋向于均值。
因此,ARMA模型一般用于短期预测(即预测期数不大于p+q太多)。而对于ARIMA模型,只需将平稳序列ARMA过程的预测结果进行反向d次(差分次数)求和,就可以得到原序列的预测值。
金融计量学
实例:ARIMA模型在金融数据中的应用
数据:
1991年1月到2005年1月的我国货币供应量(广义货币M2)的月度时间序列数据
目的:
说明在 软件中利用B-J方法论建立合适的ARIMA(p,d,q)模型
金融计量学
第三节
VAR模型的概念和构造
金融计量学
VAR模型的起源
巨大的模型均未预测到20世纪70年代早期由于石油危机而引发的世界经济的衰退和随之而来的滞胀,也未能就治理滞胀开出有效的“药方”。由此导致了对结构模型的批判,其中最具影响的便是著名的“卢卡斯批判(the Lucas critique)”。
卢卡斯指出:使用计量经济模型(结构模型)预测未来经济政策的变化所产生的效用是不可信的。他认为,如果一个模型的某些参数所反映的是私人行为对以前的经济政策的反应函数的适应性,如果政策反应函数被改变,则私人行为对新的反应函数将再适应,其结果是,所估计的参数将不再描述这种适应。
卢卡斯批判所隐含的是,如果政策反应函数出现变化,这种变化也将改变模型的参数,于是,联立方程的简约形式也将随之发生变化。
金融计量学
此外,在联立方程模型设定过程中,必须人为的假定一些外生变量,并且假定外生变量事先给定,不受模型中内生变量的影响;为达到识别的目的,常常假定某些前定变量仅仅出现在某些方程中,这些假定也招致了希姆斯()的严厉批判。
希姆斯认为,为使结构模型可识别而施加了许多约束,这种约束是不可信的。他认为,如果在一组变量之间有真实的联立性,那么就应该对这些变量平等的加以对待,而不应事先区分内生变量和外生变量。
本着这一精神,希姆斯提出了VAR(Vector Autoregressive)模型。在VAR模型中,没有内生变量和外生变量之分,而是所有的变量都被看作内生变量,初始对模型系数不施加任何约束,即每个方程都有相同的解释变量——所有被解释变量若干期的滞后值。
金融计量学
VAR模型的形式和特点
在一个含有n个方程(被解释变量)的VAR模型中,每个被解释变量都对自身以及其它被解释变量的若干期滞后值回归,若令滞后阶数为k,则VAR模型的一般形式可用下式表示:
其中, 表示由第t期观测值构成的n维列向量, 为n*n系数矩阵, 是由随机误差项构成的n维列向量,其中随机误差项 (i=1,2,…n)为白噪音过程,且满足(i,j=1,2,…,n,且ij)。
金融计量学
为便于直观理解,我们假定n=2,k=2,则VAR模型可写成:
即被解释变量分别对自身以及对方的2阶滞后值回归
金融计量学
VAR模型的识别、估计、检验和预测
(一)VAR模型的识别
前面提到,建立VAR模型的一个难点就是确定滞后项数。通常,金融理论知识给出滞后项数的一个大致范围,例如货币政策的时滞一般为6-12个月,因此若应用VAR模型对货币政策效应进行分析时,如果是月度数据我们就可以确定滞后阶数应小于12。如果要具体得确定滞后项数,就需要用到其它的一些方法,下面我们将介绍其中的几种方法:
金融计量学
VAR模型的识别
⑴似然比检验法(likelihood ratio test)
似然比检验构造的检验统计量如下:
它服从自由度为m的分布。
其中, 表示的是有约束回归模型估计残差的方差-协方差矩阵的行列式, 表示的是无约束回归模型估计残差的方差-协方差矩阵的行列式;自由度m等于所加约束的个数,
例如,如果某VAR模型有a个方程,要检验所有方程最后b
个滞后项系数是否为0,则一共有 个约束。
金融计量学
⑵信息准则法
Akaike 信息准则:AIC=
Schwartz 信息准则: SC=
其中, 代表由估计残差的方差和协方差组成的矩阵的行列式,T代表样本容量, 表示的是所有方程中回归项的个数(包括常数项)。例如,对于一个含有a个方程,滞后项数为b的VAR模型, 。
金融计量学
(二)VAR模型的估计
前面我们提到,如果VAR模型中变量是平稳的,并且方程右边包含相同的解释变量,随机误差项满足基本假定,则我们可以分别应用普通最小二乘法对单个方程予以估计,所得到的估计值是一致的、渐进有效的。当上述条件不满足时,我们需要用到估计联立方程模型的其它方法。
由于所用到的数学知识已经超出了本书的范围,并且在Eviews软件中可以方便的实现对VAR模型的估计(我们会在例子中予以介绍),在此我们不再多做介绍。
金融计量学
(三) VAR模型的检验
前面已经提到,VAR模型是缺乏理论依据的。在VAR模型中,很难逐一解释各个变量系数的意义,特别是在很多情况下,解释变量系数会随滞后期数的变化而改变符号,同时模型内部不同方程之间也存在联系,因此很难判断当某个变量发生变化时,其他变量的未来值会有什么样的变化。
为弥补上述VAR模型的缺陷,发挥VAR模型的作用,应用中一般做如下的检验:
金融计量学
1、对某变量全部滞后项系数的联合检验
在VAR模型中,单个变量系数的意义是很难确认的,但有时我们会对如下的问题感兴趣:即对于模型内的某一方程,某变量的全部滞后值是否对被解释变量有显著的解释作用。
我们可以发现,如果VAR模型仅包含两个方程,这实际上就是我们在第五章提到的因果检验:如果该变量的所有滞后值对被解释变量有显著的解释作用,则就说该变量是被解释变量的“格兰杰原因”,反之则不是。
金融计量学
2、脉冲响应
脉冲响应度量的是被解释变量对单位冲击的响应。例如假定某误差项仅在第t期发生突变,而后各期重新恢复平静,脉冲响应测量的是各期(t,t+1,t+2…)的被解释变量对该冲击的反应。
通过测量脉冲响应,我们能够清楚地看到某一时期的冲击对未来各期被解释变量的影响。在实际中,对于拥有多个方程、滞后项数较多的VAR模型,一般采用的是将VAR模型转变为VMA(vector moving average,向量移动平均)模型,并得出脉冲响应函数 。
金融计量学
(四)VAR模型的预测
前面提到,一个较小的VAR模型产生的预测结果甚至要好于一个大的联立方程模型产生的预测结果,因此VAR模型的一个主要作用就是预测,下面通过一个例子说明如何在VAR模型中进行预测。
金融计量学
考虑一个含有两个方程、滞后阶数为2的VAR模型:
首先我们来考虑一步向前预测(one-step-ahead-forecast)。如果我们要在第n期预测 、 ,由于在第n期,所有的解释变量的值已经知道,所以这是一个无条件预测:
接下来我们来考虑多步向前预测,由于在第n期,有些解释变量的值是未知的,因此预测为有条件预测,我们可以以解释变量的预测值来代表未知解释变量的条件期望。
金融计量学
同理,可得出在第n期的预测值为
可以看到,在向前两步预测时要用到我们在向前一步预测时
得到的预测值,这与前一节中我们用AR模型预测是一样
的。类似的,我们可以利用前一期的预测值进行向前三步、
四步…预测。
金融计量学
VAR模型的补充说明——VAR模型的发展
(一)结构VAR模型
即模型中方程左边不仅包括内生变量,也包括一些仅作为解释变量的外生变量;不仅包括内生变量的滞后值,也包括内生变量的当期值。
(二)VECM模型
即模型内方程的右边不仅包括变量的差分项,也包括变量之间的协整关系项,从而使模型能够同时反映系统内变量间的长期均衡关系和短期动态特征,保持信息的完整性。
金融计量学
实例——VAR模型在金融数据中的运用
VAR模型的一个经典应用是检验货币政策的有效性。即研究货币供应量与产出、物价水平之间的关系。下面,我们就在Eviews软件中利用VAR模型对我国货币政策的有效性进行检验。
我们的样本取我国1994年第一季度到2004年第二季度的季度数据,变量包括狭义货币供应量M1,商品零售物价指数P,以及代表产出水平的国内生产总值GDP。
所有的数据我们都取它们的增长率,以保证序列的平稳性。
金融计量学
图 6-24 VAR模型设定
金融计量学
图6-25 VAR模型估计结果
金融计量学
图6-26 VAR脉冲响应设定
金融计量学
第四节
(G)ARCH模型的概念和构造
金融计量学
(G)ARCH模型的概念
自回归条件异方差(autoregressive conditional heteroscedasticity ,简称ARCH)模型是近年来新发展起来的时间序列模型,它反映了随机过程的一种特殊特性:即方差随时间变化而变化,且具有丛集性、波动性。ARCH模型已广泛地应用于金融领域的建模及研究过程中。
金融计量学
一、ARCH模型
由均值方程和条件方差方程给出:
表示t-1时刻所有可得信息的集合,
为条件方差
用极大似然估计法对方程进行估计
金融计量学
二、GARCH模型
一般的GARCH(p,q)模型如下表示
可用极大似然估计法估计
GARCH(p,q)的推广
金融计量学
(G)ARCH模型的识别、估计、
类型和预测
一、 ARCH效应的识别—ARCH LM Test
1. ARCH效应的识别的含义
通常是对于残差项中是否存在自回归条件异方差现象的拉格朗日乘数检验(Lagrange multiplier test, Engle 1982)
2. ARCH LM Test 中的统计量
F统计量
Obs*R-squared 统计量
金融计量学
(一)ARCH效应的识别
原假设 :
辅助回归方程
其中e是残差
ARCH LM Test 对最小二乘法,两阶段最小二乘法,非线性最小二乘法都适用
金融计量学
(二)(G)ARCH模型的估计
方法:
最大似然估计法(以建立对数似然方程来实现,见下例)
金融计量学
(G)ARCH模型的估计(例)
对于AR(1)- GARCH (1,1)模型:
可以通过最大化下述对数函数来估计模型参数
金融计量学
(三)(G)ARCH模型的类型
1. GARCH-M模型
2. TARCH模型
3. EGARCH模型
金融计量学
(四)(G)ARCH模型的预测
1. 主要作用
预测时间序列的方差,从而研究时间序列的波动性
结合动态模型组成方程组来模拟一些金融问题的特性,例如
ARMA-EGARCH(1,1)-M模型
金融计量学
实例 (G)ARCH模型在金融数据中的应用
研究对象
我国股市收益的波动性、波动的非对称性以及溢出效应
样本范围
1997年1月2日到2002年12月31日每个交易日上证指数和深证成份指数的,共计6年1444个观察值
数据表示
收盘价以 表示
收益率定义为: ,沪市收益率用rh表示,深市收益率为rz。
金融计量学
(一)沪深股市收益率的波动性研究
1. 收益率 的描述性统计
2. 的平稳性检验
金融计量学
沪深股市收益率的波动性研究
3.均值方程的确定及残差序列自相关检验
金融计量学
沪深股市收益率的波动性研究
类模型建模
对两市收益率{ }序列分别用GARCH(1,1),和GARCH-M(1,1)建模
金融计量学
图6-31 Equation Specification窗口
金融计量学
(二)股市收益波动非对称性的研究
使用TARCH和EGARCH模型度量非对称性问题
金融计量学
(三)沪深股市波动溢出效应的研究
溢出效应的涵义
当某个资本市场出现大幅波动而引起投资者在另外的资本市场的投资行为的改变,既所谓的“溢出效应”
金融计量学
实例结论
沪深股市收益率都存在明显的GARCH效应
沪深股市都存在明显的GARCH-M效应,而且沪市的正向风险溢价要高于深市
深股市都存在明显的杠杆效应
沪深股市之间波动存在溢出效应,而且是单向的,深市的波动将引起沪市的波动
金融计量学
本章小节
本章介绍了在处理金融时间序列数据时构造动态模型的方法。首先第一节介绍ARDL模型的概念、优点及构造过程,着重介绍了AEDL模型检验不同阶变量之间长期关系的方法。在第二节中我们主要介绍了如何利用B-J建模方法建立ARIMA模型,并介绍了ARIMA模型的一些特点。我们可以看到,ARIMA模型可广泛的应用于时间序列数据,并在预测方面有独特的优势。
我们在第三节中主要介绍了VAR模型,它是一种不同于结构联立方程组的多方程模型,同ARIMA模型一样,它也是缺乏理论依据的,主要用于预测,VAR模型的出现使得现在的文献中已经很少看到利用联立方程模型建模。最后一节介绍了(G)ARCH模型,(G)ARCH模型在金融领域的应用极为广泛,本书中介绍了(G)ARCH模型多种形式,着重以实例说明(G)ARCH模型的作用。
金融计量学
第七章
联立方程模型的概念和构造
金融计量学
本章要点
联立性偏误的定义
识别的定义及识别的阶条件和秩条件
内生变量和外生变量的定义及联立性检验的步骤
联立方程模型的估计方法(单一方程法和系统方程法)
递归模型的特点及普通最小二乘估计方法
金融计量学
第一节
联立方程模型的基本概念
金融计量学
首先考虑一个由三个方程组成的简单的市场供需模型(假定市场总是出清):
供给方程:
需求方程:
均衡方程:
其中 、 分别表示t期、t-1期某商品的价格, 、 分别表示t期该商品的供给量和需求量, 代表t期的收入。按照经济理论,对于一般商品,应满足 >0, <0。
以下将利用该模型说明联立方程模型的几组概念。
金融计量学
内生变量、外生变量、前定变量
(一) 内生变量
由模型系统决定其取值的变量称为内生变量(endogenous variables) 。内生变量受模型中其它变量的影响,也可能影响其它内生变量,即内生变量既可以是被解释变量,也可以是解释变量。内生变量受模型内随机误差项的影响,是随机变量。
在模型中, 、 、 的值是由模型决定的,因而是内生变量。
金融计量学
(二)外生变量
由模型系统以外的因素决定其取值的变量称为外生变量(exogenous variables)。外生变量也可以表述为:独立于该变量所在方程前期、当期、未来各期随机误差项的变量。
外生变量只影响系统内的其它变量,而不受其它变量的影响,因此在方程中只能做解释变量,不能做被解释变量。由定义可以看出,外生变量不受模型中随机误差项的影响。
在模型中,t期的收入 是由模型外的因素决定的,因而在该模型中 是外生变量。
金融计量学
(三)前定变量
所谓前定变量(predetermined variables) 是指独立于变量所在方程当期和未来各期随机误差项的变量。由定义可知,外生变量属于前定变量,另外还有一类变量也属于前定变量,即滞后的内生变量,因为滞后的内生变量仅与方程前期的随机误差项相关而与方程当期、未来各期的随机误差项无关。前定变量也只能在现期的方程中做解释变量,并且不受随机误差项的影响。
在模型中, 作为滞后的内生变量, 作为外生变量都属于前定变量。
金融计量学
完备方程组
如果一个模型中方程的个数等于内生变量的个数,则称这个模型为完备方程组(complete system of equations)。
我们可以估计完备方程组中的所有参数,但对于非完备方程组,我们不能估计或只能估计它的一部分参数。
在上述市场供需模型中,共有 、 、 三个内生变量,同时有三个方程,因此该模型是一完备方程组,所有参数均可估计。
金融计量学
随机方程式、非随机方程式
联立方程模型中的方程可以分为两类,一类是含有随机误差项和未知参数的方程,称为随机方程式,也即行为方程(behavior equation),它主要是描述了金融、经济模型中某一部分的行为,随机方程式中的参数需要估计;
另一类是不含随机误差项和未知参数的方程,称为非随机方程式,主要是恒等式(identity),非随机方程式不需要估计参数。
在模型中,供给方程、需求方程中含有随机误差项和未知参数,并且分别描述了某商品市场供给方和需求方的行为,因此是随机方程式,即行为方程。而均衡方程则属于非随机方程式。
金融计量学
结构式模型、简化式模型
联立方程模型有两种形式:结构式模型(structural form model)和简化式模型(reduced form model)。
所谓结构式模型,是指在一定的经济理论基础上建立的,能够反映经济变量之间结构形式的一类联立方程模型。模型即为结构式模型。结构式模型中的方程称为结构方程(structural equation),结构方程中变量的系数成为结构参数(structural parameters),它表示的是结构方程中的解释变量对被解释变量的直接影响。所有的结构参数组成的矩阵成为结构参数矩阵。
金融计量学
对于模型,若将常数项看作变量1的系数,则模型可以表示为:
因此结构参数矩阵为:
1
金融计量学
对于模型,若以 表示t时刻供给量 和需求量 的均衡值,则模型可表示为
供给方程:
需求方程: (模型)
若将模型中的内生变量 、 只用模型中的前定变量和随机误差项表示出来,则可得到就是结构式模型所对应的简化式模型 :
金融计量学
一般的,简化式模型就是把结构式模型中的内生变量表示为前定变量和随机误差项的函数的联立方程模型。同结构参数矩阵的表示方法一样,模型中的简化式参数矩阵可表示为:
金融计量学
联立性偏误
用普通最小二乘法(OLS)对经典线形回归模型进行回归将得到最优线性无偏估计量。
但在结构式模型中,由于内生变量既可作为解释变量又可作为被解释变量,经典线性回归模型的一个基本假设——解释变量与随机误差项不相关——将得不到满足,因此若仍对结构式模型中的每个结构方程分别运用OLS进行估计,所得到的参数估计值将是有偏和不一致的,即存在联立性偏误(simultaneity bias)或联立方程偏误(simultaneous equations bias)。
金融计量学
第二节
联立方程模型的识别
金融计量学
识别问题
所谓识别问题,是指结构方程参数的数值估计,是否能够从估计的简化式参数求得。如果能够求得,我们就说此结构方程是可以识别的,特别的,如果能够得到结构参数估计值的唯一解,则称该结构方程是恰好识别的;
如果可以得到结构参数估计值的多个解,则称该结构方程是过度识别;
如果不能够通过简化式参数估计值求得结构式参数值,则称该结构方程是不可识别的或不足识别的。
金融计量学
不可识别和过度识别
对于模型做修改,该商品的供给量仅受当期价格影响,而不再受前一期价格的影响。而该商品的需求量则不仅受当期价格和当期收入的影响,还受前一期价格的影响。于是可以得到以下模型:
供给方程:
需求方程: (模型)
金融计量学
其所对应的简化式模型
根据上述关系式,若已知
则可得:
无法求得估计值
金融计量学
恰好识别
让我们回到模型
供给方程:
需求方程:
其对应的简化式模型
金融计量学
分别用OLS估计简化式模型的两个方程,可以得到最优无偏估计值 、 、 、 、 、 ,则
可得一致性估计量 、 、 、 、 、
识别性问题对于联立方程模型来说是非常重要的。因为若某个结构方程是不可识别的,则无法对其进行估计求得参数估计值。
因此在对联立方程模型进行估计之前,首先要对模型中方程的可识别性进行判断,由此简单有效的判断可识别性的规则或方法就显得必要,我们接下来将介绍识别规则。
金融计量学
识别规则
(一)阶条件
可识别性的阶条件是一个必要但非充分条件,也即有时方程虽然满足阶条件,但仍有可能是不可识别的。
表述1:令G表示模型中结构方程的个数,如果某结构方程中所不包含的内生变量和前定变量的个数为G-1,则该方程是恰好识别的;若不包含的变量个数大于G-1,则该方程是过度识别的;若不包含的变量个数小于G-1,则该方程是不可识别的。
金融计量学
表述2:在一个线性联立方程模型中,某方程可识别的一个必要条件(阶条件)是:该方程所不包含的前定变量的个数必须不少于方程右边所包含的内生变量的个数。若该方程所不包含的前定变量的个数等于方程右边所包含的内生变量的个数,则该方程是恰好识别的;若大于,则该方程是过度识别的。
金融计量学
识别规则
(二)秩条件
阶条件是判断可识别性的必要但非充分条件,即有时候某方程满足可识别性的阶条件但实际上却是不可识别的,在此情况下,判断可识别性的充分条件就显得必要。而秩条件正是判断可识别性的充分必要条件。
秩条件的表述如下:对于一个由G个方程组成的联立方程模型中的某个结构方程而言,如果模型中其他方程所含而该方程不含的诸变量的系数矩阵的秩为G-1,则该结构方程是可识别的,若秩小于G-1,则该结构方程是不可识别的。
金融计量学
对某结构式模型中的第i个方程利用秩条件判断其可识别性,可按以下步骤进行:
⑴写出结构模型对应的结构参数矩阵(常数项可看作变量1的系数,不包含在方程中的变量的参数取作0)。
⑵删去第i个结构方程对应系数所在的一行。
⑶删去第i个结构方程对应系数所在行中非零系数所在的各列。
⑷对余下的子矩阵,如果它的秩等于方程个数减去1,则第i个结构方程就是可识别的;如果它的秩小于方程个数减1,则第i个结构方程就是不可识别的。
金融计量学
联立性检验
由于某些内生变量作解释变量,从而与随机误差项存在相关性而产生的,因而联立性检验就归结为可能是内生变量的解释变量与随机误差项的相关性检验。通常用Hausman设定误差检验(Hausman specification test)检验联立性。
金融计量学
第三节
联立方程模型的估计
金融计量学
根据是否同时对所有的结构方程进行估计,可把常用的估计方法分为单一方程法与系统方程法两类。
单一方程法又称有限信息法(limited information method),是对结构方程逐个进行估计的方法。
系统方程法又称为完全信息法,是对整个联立方程模型中的所有结构方程同时进行估计,一次估计出模型全部系数的方法,包括三阶段最小二乘法(简称3SLS)和完全信息极大似然法(简称FIML)等。
金融计量学
单一方程法
单一方程法我们将主要介绍间接最小二乘法、工具变量法、两阶段最小二乘法。前者只适用于恰好识别的结构方程,后两者还可应用于结构方程过度识别的情况。
(一)普通最小二乘法在递归模型中的应用。
考虑如下的模型: (模型)
其中 表示内生变量, 表示外生变量,假定同期各方程的随机误差项互不相关。
金融计量学
该模型中实际并不存在联立方程系统中各内生变量之间的相互依赖性,而是存在一种单向的因果依赖性,这种模型被称为递归模型或三角模型,也因其单向因果性而被称为因果性模型。
(二) 间接最小二乘法
间接最小二乘法的基本思想是:尽管不可以直接对结构方程应用普通最小二乘法,但对于由结构式方程导出的简化式方程,可以应用普通最小二乘法得到参数估计值,然后利用简化式参数估计值和参数关系式求得结构参数的估计值。
金融计量学
应用间接最小二乘法的具体步骤如下:
第一步:将结构式模型转化为简化式模型。
第二步:对每个简化式方程应用普通最小二乘法,得到简化式参数的估计值。
第三步:根据简化式参数与结构式参数之间的关系式以及简化式参数估计值求得结构式参数估计值。
金融计量学
(三) 工具变量法
工具变量法的基本思想是:用适当的前定变量作为工具变量代替结构方程中作为解释变量的内生变量,从而降低解释变量与随机误差项之间的相关程度,再利用普通最小二乘法进行估计。
工具变量法的关键是工具变量的选取,一般而言,工具变量应满足如下的条件:
⑴工具变量与所替代的内生变量之间高度相关。
⑵工具变量是联立方程模型中真正的外生变量,即它与结构方程中的随机误差项不相关。
⑶同一方程使用多个工具变量时,它们之间的多重共线性程度要低。
⑷工具变量与结构方程中其它解释变量的多重共线性程度也要低。
金融计量学
(四)两阶段最小二乘法
两阶段最小二乘法的基本思想是:利用简化式模型求得内生变量的拟合值,以消除随机误差项的影响,然后将结构方程右边的内生变量替换为相应的拟合值,并对替换后的结构方程分别运用普通最小二乘法估计参数。
应用两阶段最小二乘法应满足如下的条件:
⑴所考虑的结构方程是可以识别的。
⑵结构方程中的随机误差项满足零均值,方差为常数,序列不相关。
⑶前定变量多重共线性程度低。
⑷样本容量要足够大,至少要不少于方程中出现的前定变量的个数。
金融计量学
间接最小二乘法、工具变量法、
两阶段最小二乘法的比较
⑴两阶段最小二乘法实际上是工具变量法的一种特殊形式,在两阶段最小二乘法中,工具变量是第一阶段的拟合值。
⑵在恰好识别的情况下,可以证明三种方法是等价的。
⑶在过度识别的情况下,间接最小二乘法不能应用;按照工具变量选择的不同,工具变量法可以得到多个估计值;而两阶段最小二乘法则可以充分利用模型信息,得到结构参数的唯一估计值。
金融计量学
系统方程法
系统方程法,其中最重要的一种方法是三阶段最小二乘法,它的基本思想是:两阶段最小二乘法只使用了模型的部分信息,而忽视了模型结构对其它方程的参数值所施加的全部约束条件,特别是当联立方程模型各方程的随机误差项同期相关时,两阶段最小二乘法将不再有效,此时需要引入广义最小二乘法(GLS),以克服各方程之间的联立性偏误。
金融计量学
应用三阶段最小二乘法,应该满足如下的假定:
⑴每个结构式方程必须是可识别的。
⑵所有的恒等式已通过代换等方式消去。
⑶每个结构方程的随机误差项满足零均值、同方差性以及无自相关性。
⑷不同结构方程的随机误差项是同期相关的。如果不相关,三阶段最小二乘法将等价于两阶段最小二乘法。
金融计量学
应用三阶段最小二乘法的基本步骤如下:
第一阶段:利用普通最小二乘法估计结构式模型对应的简化式模型,并求得各内生变量的拟合值。
第二阶段:将结构方程右边的内生变量用其拟合值代替,再利用普通最小二乘法估计替代后的方程,得到结构参数参数估计值。然后计算各方程的残差值,利用残差值求得误差项方差以及跨方程协方差的一致估计值。
第三阶段:根据第二阶段得到的误差项方差估计值以及跨方程协方差估计值,应用广义最小二乘法得到三阶段最小二乘估计值。
金融计量学
实例——联立方程模型
在金融数据中的应用
一、理论回顾
基于理论分析,我们建立如下联立方程模型(模型)
金融计量学
二、实证分析
本文采用了从1997年1月到2004年3月各变量的月度数据。我们将分别检验流通中现金、狭义货币、广义货币作为货币量与上证指数的关系。
我们将在中利用两阶段最小二乘法估计上述联立方程模型,这个过程主要分两个步骤:首先利用普通最小二乘法求得内生变量的拟合值,然后用拟合值代替内生变量再利用两阶段最小二乘法求得结构参数估计值。
金融计量学
图 7-1 回归方程设定
我们以代表货币量说明模型,打开,建立相应的工作组并输入数据,然后在菜单中选择“Quick”→“Estimate Equation”,在“Method”中选择LS
金融计量学
然后在“Estimation settings”上方空白处首先输入被解释变量,然后输入作为解释变量的外生变量,然后点“OK”,即可以得到估计结果如下:
() () () () ()
点击“Quick”→“Generate Series”, 得到如下窗口(图7-2)
金融计量学
图7-2 快速生成序列“m0fitted”
在“Enter equation”下面的空白栏中键入如图中的方程,就可以得到的拟合值“m0fitted”。
金融计量学
图7-3 选择两阶段最小二乘法估计方程
点击“Quick” →“Estimate Equation”,在“Method”中选择“TSLS”,将出现如下的窗口
金融计量学
在“Instrument list”上方的空白栏中按结构式方程输入相应的变量,在其下方的空白栏中输入图示的工具变量,然后点击“OK”,就可以得到结构式方程参数的两阶段最小二乘估计值 :
() () ()
金融计量学
按照同样的步骤,我们可以求出作货币量时结构式方程参数的两阶段最小二乘估计值:
() () () () ()
同样的,对于狭义货币 作为货币量代表,我们可以估计模型得到
()()()
() () () () ()
金融计量学
对于广义货币作为货币量代表,同样可以得到估计模型:
() () ()
() () () ()()
金融计量学
三、分析
可以看出,无论是流通中现金、狭义货币,还是广义货币,无论是当月值还是过去第6个月的值,在对股票价格的解释中,他们的系数都是不显著的。因此,可以认为货币供应量对股票指数影响微乎其微。
另一方面,股票指数在对流通中现金、狭义货币的解释中,其系数也是不显著的,但在对广义货币的解释中,股票指数的系数则是显著的,因此,可以认为,股票指数对流通中现金、狭义货币是没有影响的,而对广义货币量则是有影响的。
金融计量学
本章小结
本章中我们介绍了联立方程模型,联立方程模型中变量之间的关系是交错的或双向的因果关系,使得经典线性回归中解释变量与随机误差项不相关的假定遭到破坏,因此在用普通最小二乘法估计结构方程时将会产生联立性偏误 。
在估计联立方程模型前一个重要的问题是识别问题,利用可识别的阶条件和秩条件来判断。
判断完模型是否可以识别,下一步就是选择合适的估计方法对模型进行估计。根据是否同时对所有的方程进行估计,可以把估计的方法分为单一方程法和系统方程法。
金融计量学
第八章
实证性文章的写作
金融计量学
一、一篇典型的实证性文章的框架
(1)简要介绍 首先大概地描述研究领域中前人的研究成果,介绍不要用专业性语言,尽量少用统计和经济术语。
(2)文献综述 介绍已研究过此方向的专家的研究成果 ,比较其中的计量模型
(3)经济学和金融学原理 因为这一部分的目标读者是作者研究领域的专家,因此这一部分中往往包括一些统计与经济金融术语。
金融计量学
(4)数据 描述数据,同时详细介绍数据来源。
(5) 模型介绍 在“模型介绍”中要为以后篇幅中使用的检验技术作铺垫,为什么使用这些检验技术,如何使用都在“模型介绍”中要有所铺垫。
(6)实证研究结果 这一部分是文章的核心,在本部分中,包含有统计信息与经济金融原理 。
(7)结论 简要地概括一下文章讨论的问题,着重强调实证研究发现和结果。
金融计量学
二、需要特别注意的地方
(1)首先,要强调的是事实上没有完全正确或者完全错误的实证研究。实证研究的结果是客观存在的,即使研究结果与我们的期望不一样,但是这不该成为继续研究的障碍。
(2)另外,实证结果往往是让人觉得迷茫的。比如,一个统计检验说明了一种情况存在,而另一个统计检验却得出不同的结论。某个解释变量在一个回归中是显著的,而在另一个回归中却是不显著的,
金融计量学
(3)对于统计研究结果的展现方式,简洁明了是毋庸置疑的要求。
(4)写作一篇好的研究报告的关键要领是要有选择性。
金融计量学
三、简单介绍典型的研究课题
以下提供了三个可以研究的课题:
1、利用协整理论检验购买力平价说(PPP)。
其基本思想是:货币的价值在于其购买力,因此不同货币之间的兑换率取决于其购买力之比。
但在实证研究中的一般的结论是:
第一,在短期内,高于或低于购买力平价的偏差经常发生,并且偏离幅度很大;
第二,从长期来看,没有明显的迹象表明购买力平价的成立;
第三,汇率变动非常剧烈,这一变动幅度远远超过价格变动的幅度。
金融计量学
我们利用1855年-1987年英国市场数据,检验每单位劳动的实际工资(即下文中的WPYE)是否平稳。按照PPP理论,其应该是存在平稳的。
利用Microfit 自带的数据库中数据,文件中给出了英国的就业人数(E)、物价(P)、工资(W)以及实际国民生产总值(Y)的对数值。
在PROCESS中,键入:
C=1;WP=W-P;YE=Y-E;WPYE=WP-YE;DWPYE=WPYE-WPYE(-1)
在本题中,协整关系的零假设检验是:WPYE=W-P-Y+E不存在协整关系,也就是WPYE包含单位根。
金融计量学
图8-1 WPYE的单位根检验结果
接着运行:ADF WPYE(4)得到结果如下(图8-3):
金融计量学
图8-2 WPYE线性图
从结果可以看出:在带有趋势项的情况下,ADF(1)的检验结果拒绝零假设。我们通过画图:PLOT WPYE 得到
金融计量学
可以看到,在二战之后,WPYE的整体水平上升了,因此WPYE不平稳,即W-P-Y+E之间不存在协整关系。这进一步验证了前人的研究理论。
金融计量学
2、资本资产定价模型(CAPM)中β系数的确定
资本资产定价模型的研究对象,是充分组合情况下风险与要求的收益率之间的均衡关系。根据投资理论将风险分为系统风险和非系统风险,知道了在高度分散化的资本市场中只有系统风险,并且会得到相应的回报。
金融计量学
度量一项资产系统风险的指标是β系数。它被定义为某个资产的收益率与市场组合之间的相关性。根据数理统计的线性回归原理,β系数可以通过同一时期内的资产收益率和市场组合收益率的历史数据,使用线性回归方程预测出来。
本文截取了上证指数以及宝钢从2000年12月13日起到2005年3月18日的日收益率,分别作为解释变量与被解释变量,利用Eviews软件进行回归。
金融计量学
其中股指的日收益率为RATE1;个股的日收益率为RATE2。
先将个股与股指的数据导入Excel中,因为派息和召开股东
大会,都有停盘的规定,因此,个股资料中残缺的部分,利
用相隔数据平均处理获得。在Eviews中建立一个新文件,并
导入两组数据,进行回归。获得的结果是(图8-3):
金融计量学
图 8-3 模型回归结果
金融计量学
宝钢作为大盘股,一直走势平稳,基于CAPM模型可知,宝钢股票的β系数应该是小于1的。事实也证明了这一点,在中 ,β系数为<1。
金融计量学
3、股价低估之谜
投资者和金融家都很想知道股市是如何对一家公司的股票定价的。
在这个研究课题中,可以使用以下的数据集来进行实证研究分析。
文件集包含了1996年在美国上市的309个公司的交易数据。有些是“季节性发售”有些是“首发”。
金融计量学
样例:一篇关于中国封闭式基金折价
的实证文章
一、引言
封闭式基金折价交易是金融领域的一个不解之谜。
封闭式基金困惑(the closed-end fund puzzle )是指:实证研究发现:封闭式基金的市场交易价格通常不等于其持有的资产组合的市场价值(即基金的资产净值)。虽然基金有时会高于资产净值溢价交易,但通常折价10%~20%已经成为一种普遍现象.
金融计量学
资金折价率定义为:
其中:D为折价率,price 为基金的市场交易价格,NAV(net asset value) 为基金投资组合的单位资产价值。
根据以上公式,D为正值表示折价,为负值表示溢价
根据Lee, Shleifer和Thaler (LST,1991)的总结,封闭式基金的价格波动往往表现为如下四个特征:
金融计量学
(1)当基金首次向投资者公开发行时(IPO),封闭式基金总是会以10%左右溢价交易。在市场上还有其他基金以折价方式交易时,投资者为什么会溢价购买新发行的基金?
(2)虽然封闭式基金刚开始时溢价交易,但是从上市交易开始之后约120天内溢价就会下降,其交易的折价超过10%并且通常一直保持折价交易。
金融计量学
(3)随后封闭式基金的交易折价会出现大幅度波动,而且呈现出均值回归(mean reverting)的特点。
(4)当基金封闭期结束,面临清算或者转为开放式基金时,基金价格上升并且折价变小,基金持有者获得正回报。然而,仍有一个小幅度的折价一直持续到最后基金清盘或是转为开放式基金 。
金融计量学
二、 基于有效市场的研究与基于行为金融学噪音交易理论的研究(即文献综述)
(一)基于有效市场的研究现状
根据有效市场假说,资产价格应该等于其内在价值,因此也应该等于未来所有现金流经过贴现以后的现值。之所以出现折价交易,是基金公司对基金的净资产值高估的结果。折价是对这种高估的合理调整。其主要有三种解释:代理成本,资产的流动性缺陷,资本利得税假说。
金融计量学
虽然每种假说都有其合理性,可以解释观测到的部分折价现
象,但即使把这三种因素综合起来,仍然不能解释基金折价
的大部分特征。
1、代理成本(Agency Cost)
该观点认为,基金的日常运作需要成本,如基金管理人的报酬,管理费用等。由于这些成本的存在,基金的市场价格应当低于其资产净值。这一观点存在以下几个问题:
金融计量学
(1)基金的管理费用占基金资产净值的比例很小而且相对固定,是一种典型的资产净值固定百分比,而封闭式基金的折价较大而且呈现较大幅度的波动;未来管理费用的现值理论上应该随利率波动,然而,LST证实了基金折价变动和利率波动之间无显著关系。
(2)代理成本不能解释为什么当理性的投资者在可以预期到基金发行后将折价交易的情况下,却愿意在初始发行时溢价购买。
金融计量学
(3)代理成本也不能解释折价率在不同类型基金,不同时期的变化。
Malkiel(1977) 证实了基金折价水平和管理费用(以及基金业绩)之间没有显著关系。
Shleifer和Thaler(1991) 证实:在折价水平和未来基金净值之间存在正相关关系。高折价的基金在下一个时期相对于低折价的基金将有更高的净值。这个结果与代理成本理论得出的结果相反。
金融计量学
2、资产的流动性缺陷
(1)“限制性股票假说”(restricted stock hypothesis)。
该观点认为,如果基金所持有的资产中有大量是在一定期限内有流通限制的股票,那么由于这些股票的流动性较差,其市值与变现值之间存在着一定的折扣。但事实上,许多封闭式基金持有这类股票非常少,所以即使这种观点对某些特定的基金成立,也不能对广泛存在的大规模基金折价做出合理的解释。
金融计量学
(2)大宗交易折扣说”(Block Discount Hypothesis)
该观点认为,基金可能过度的持有某一家公司的股票。由于大宗交易的流动性风险,这种股票的变现值必然低于公告的资产净值(NAV),从而基金应当有一定的折价。但问题在于,当封闭式基金转为开放式基金以后,基金仍可能持有较多的这种股票,而这时折价却消失了.
金融计量学
3、资本利得税(Capital Gains Tax Liabilities)
该观点认为,如果投资者购买的基金已经含有了资本升值,当基金将来卖出,实现资本升值时,必须要支付资本利得税。基金净值含有的未实现资本升值越多,则随后交易的潜在折价可能性就越大。但是,当封闭式基金转为开放式基金以后,同样的潜在税赋应该导致相似的折价交易。可是在大量实证中,当封闭式基金转为开放式基金时,折价也随即消失。
金融计量学
综上所述,以上三个理论只能部分的说明为什么存在基金的折价交易(即基金折价的第二个特征)。这些理论不能对基金折价的其它特征提供满意的解释:为什么发行时溢价,为什么折价率不断波动,为什么封闭式基金转为开放时会有巨额的超常收益。最重要的是,即使结合以上所有的理论,也不能对“封闭式基金折价之谜”提供全面解释。
金融计量学
(二)基于行为金融学噪音交易理论的研究
噪音交易者理论能对基金折价提供一个更完整,全面的解释,其理论框架如下:
(1)居于DSSW模型,市场中存在两类交易者:非理性的噪音交易者和理性的套利者。噪音交易者情绪不可预期的波动将产生出脱离资产基本价值以外的噪音交易风险。由于噪音交易者过多的承担了这种风险,他们可能获得比理性的套利者更高的收益。
金融计量学
(2)基金交易中同样存在噪音交易,噪音交易者也是基金的主要投资者。
(3)噪音交易者的情绪波动是随机的,不可预期的,他们乐观时就会大量买入基金,此时折价减小,甚至溢价;悲观时则相反。
(4)噪音交易者的情绪波动造成了基金折价率的随机波动,因此投资基金比投资基金持有的基础资产风险更大,需要补偿。
金融计量学
(5)基金折价交易就是对这种噪音交易者的情绪波动风险的补偿。
1、投资者情绪和基金折价的四个特征
该观点认为封闭式基金的平均折价仅仅是因为:持有基金的风险比直接持有投资组合的风险大。这一理论与封闭式基金折价的主要特征一致:基金折价交易。
这一理论也与折价的其它三个特征一致。
金融计量学
首先,封闭式基金发行上市时,一方面由于新基金没有可供比较的历史经营纪录;另一方面,为了保证新基金的发行成功,基金发起人通常要做大量的宣传工作,将基金的未来收益描述得非常完美,给投资者以极大的想象空间。噪音交易者对封闭式基金非常乐观,这种乐观的程度远远超过了对基金未来业绩的理性预期,从而导致基金的过渡交易,使基金的交易价格高于其资产净值,产生溢价。
金融计量学
其次,这一理论意味着:封闭式基金的折价率随着投资者关于基金未来收益预期的波动而不断波动。
最后,这一理论解释了当基金宣布由封闭转开放时,为什么基金的价格会上升。
2、 Lee, Shleifer和 Thaler的实证
通过如下关系对金融噪音的间接验证。(1)不同基金折价率变动的同步性 (2)新基金上市的时机选择 (3)小公司股票收益率变动与基金折价率的关系。
金融计量学
三、 数据来源和折价指数的构造
(一)基金数据的来源说明
本文样本分别选取2000年2月以前在上海证券交易所和深圳证券交易所上市交易的封闭式证券投资基金各10只。这些基金的特点是规模大,上市时间早,代表了市场的主力,能反映市场的整体状况。
沪市基金为:基金金泰,基金泰和,基金安信,基金汉盛,基金裕阳,基金景阳,基金兴华,基金安顺,基金金鑫,基金汉兴
金融计量学
深市基金为:基金开元,基金普惠,基金同益,基金景宏,基金裕隆,基金普丰,基金景博,基金天元,基金同盛,基金景福
实证分析的数据包括基金每周末的收盘价,每周公布一次的单位资产净值(NAV),基金的持仓结构,管理费用,以及基金的持有人结构,时间跨度从2000年2月至2003年1月。
金融计量学
(二)折价指数的构造和统计特征
在此,我们需要构造一个基金折价指数来代表整个样本所有封闭式基金折价的状态。折价指数的构造有两种方法:基金净值加权平均法(LST用此种方法)和算术平均法。加权平均法VWD它是样本期内样本基金折价率以净值为权数的加权平均:
其中: 表示在t期折价的加权系数。
算术平均法为样本期内样本基金折价率的简单算术平均:
金融计量学
关于构成折价指数中样本个数的选择
1.我们认为样本数量并非越多越好。如果折价指数中包含过多新上市基金,那么在同一个样本期中,折价指数中既包含位于溢价期的新基金,又包含折价的老基金,指数就不能真实反映出基金的折价情况。
2.“24周”的选择方法。
3.在前述沪深股市的20支样本基金中,我们选取12支在1999年7月份以前上市的基金构造折价指数。
金融计量学
四、模型介绍与实证研究结果展示
(一)基于有效市场理论的研究
1.传统理论关于封闭式基金折价的解释有三个:代理成本,未实现的资本利得,以及资产的非流动性。
考虑到我国证券市场自身的特征,我们选取了三个可能影响基金折价的因素:管理费用占基金总资产比例,基金的投资集中度,基金的机构投资者占比。
金融计量学
投资集中度定义为该基金的投资组合中持仓前10位的股票市值之和与基金总资产净值之比。它是衡量基金
流动性的替代指标,预期集中度越高,流动性越差,折价越大。
2.下面,我们列出2000年20只样本基金的周折价均值,管理费用占比,投资集中度,以及机构持有人占比,见表8-1,如下:
金融计量学
表8-1 2000年样本基金周折价率均值、管理费用占比、投资集中度、机构持有人占比的相关系数
金融计量学
3.为了检验管理费用,持股集中度等因素能否解释基金折价,我们首先用2000年的数据计算基金周折价均值,管理费用占比,投资集中度,机构持有人占比 这四个指标之间的相关系数。结果表8-2如下:
金融计量学
表8-2 2000年样本基金周折价率均值、管理费用占比、投资集中度、机构持有人占比的相关系数
金融计量学
从表8-2可见,周折价均值与管理费用之间有正相关关系,但不显著;与预期相反,周折价均值与投资集中度之间存在微弱的负相关关系,但也不显著。这初步表明传统理论无法解释基金折价。我们发现,基金周折价均值与机构持有人占比之间存在正相关关系,而且是显著的。这表明引入机构持有人占比变量的确抓住了我国基金持有人结构的这一特点。
进一步分析,我们构造回归方程 :
金融计量学
其中 表示折价率,c是截距,jzd表示投资集中度,fee表示管理费用占比,holder表示机构持有人占比。首先,在回归中只加入jzd和fee两个变量,结果如下:
表8-3 基于传统解释的横截面回归结果
金融计量学
可见,双因素模型中,两个因素都是不显著的。而且F值很小,整个回归方程都是不显著的。这与上面的相关系数检验相互印证。随后,把holder变量加入回归模型中,得到以下结果见表8-4:
表8-4 加入机构持有人占比后的横截面回归结果(2000年)
金融计量学
4、回归方程在不同时间段的检验:
我们用2001年的数据进行了回归,发现结果更显著。虽然相对于
2000年,2001年基金的折价率大幅下降,但这两年数据计算的结果
都表明:管理费和投资集中度这两个指标无法解释基金折价。而机构投
资者占比却有很强的解释能力,并与基金折价正相关。
对此我们的解释是:根据中国的市场情况,其持有基金份额的增
加,反而放大了噪音交易者风险,使折价扩大。
金融计量学
(二)基于行为金融学噪音交易理论的研究
基于有效市场假说的传统理论的确不能解释我国封闭式基金的折价,我们把研究的视角转移到行为金融学,通过验证如下关系间接验证投资者情绪波动对基金折价的影响影响:(1)不同基金折价率变动的同步性 (2)新基金上市的时机选择 。
如果不存在这种影响,那么不同基金这家的相关性应该很低,反之亦然。下面我们计算12只构成折价指数的样本基金折价率与折价指数之间的相关系数。
金融计量学
表8-5 构成折价指数的基金折价率与折价指数
的相关系数 (2000/02---2003/01)
表(8-5)
金融计量学
表(8-5)给出了12只样本基金及其折价指数之间的相关系数。可以看出各基金折价之间是高度相关的,而且折价指数VWD与构成指数的各基金的折价率也是高度相关的。
这说明折价指数VWD很好的反映了基金折价的总体状态。同时,我们考察了非构成折价指数的8只样本基金折价率与折价指数之间的相关系数,结果如下表(8-6):
金融计量学
表8-6 非指数基金折价率与折价指数之间
的相关系数 (2000/02---2003/01)
表(8-6)
金融计量学
表(8-6)给出了8只非指数基金之间,以及它们与折价指数的相关系数。除基金景博(184695)的相关系数稍低外,其他非指数基金折价率与折价指数VWD是高度相关的,而且各基金折价之间也是高度相关的。
注意这些非指数基金都是上市相对较晚的基金,它们与折价指数VWD的高度相关表明了不同上市时间基金折价率的联动性。
金融计量学
2、新基金上市的时机选择
根据噪音交易者理论,新基金是在噪音交易者对其未来收益持乐观态度时发行。如果噪音交易者情绪波动影响的范围是所有封闭式基金,那么新基金将在投资者情绪比较乐观,即已发行老基金的折价偏低的时候上市 。
一方面,我们考察从2000年2月到2002年9月期间新上市的封闭式基金数量与同期月平均折价指数的关系,来进一步验证噪音交易理论对基金折价的影响。
金融计量学
图8-4 新上市的封闭式基金数量与同期月平均折价指数关系 (2000/02~2002/09)
金融计量学
注意图中明显的一个特点----2000年的特殊情况
另一方面,我们比较了有基金发行的月份和无基金发行的月份 两者平均折价率的差异,结果见表8-7所示。
表8-7 有无基金发行的月份平均折价率的比(2000/02~2002/09)
这个结果也支持假设:新基金是在老基金折价较小的时候发行。
金融计量学
如果我们进一步剔除2000年2月到2002年9月期间所有发行的规模为5亿或8亿的小盘改制基金的影响,那么期间共发行大盘新基金6支,时间段为2001年9月到2002年9月共13个月。如下图8-5:
可以看到这6支基金大多是在折价率走势较低时发行的。
金融计量学
图8-5 新上市的大盘基金数量与同期月平均
折价指数关系 (2001/09~2002/09
金融计量学
我们同样比较了有基金发行的月份和无基金发行的月份 两者平均折价率的差异,结果见表8-8所示:
表8-8 有无基金发行的月份平均折价率的比(2001/09~2002/09)
金融计量学
五、 研究结论与建议
(一)研究结论
1.基金的折价率之间,折价率与折价指数之间高度相关的。
2.新基金大多选择在已发行老基金折价率较低时上市。
以上实证结果支持封闭式基金折价受噪音交易者情绪波动影响的假说。
金融计量学
(二)建议
1.一般认为机构投资者是理性的,能起到稳定市场的作用。但这一结论在中国不一定成立。
在允许保险公司等机构投资者通过持有基金间接入市的2000年以及随后的2001年,机构持有基金比例越高,折价越大。
作为机构主力的证券投资基金也并没有使中国股市的震荡和波动的幅度减少或舒缓,周期性的非理性恐慌反而越来越厉害。
金融计量学
2、关于开放式基金上市时机的把握
Malkiel(1977)和LST(1991)的研究都表明,封闭式基金的折价率与开放式基金的净赎回(Net Redemption)成正比。
出于对我国证券投资基金现实生存环境的考虑和对投资人利益的保护,我们认为:当前可适当放缓,或是暂停新开放式基金的上市,等封闭式基金折价率降到一个较低且稳定的水平再放松限制。
金融计量学