第四章 其他回归方法
本章讨论加权最小二乘估计,异方差性和自相关一致协方差估计,两阶段最小二乘估计(TSLS),非线性最小二乘估计和广义矩估计(GMM)。这里的大多数方法在第十二章的联立方程系统中也适用。
本章中某些估计方法中含有AR和MA误差项,这些概念将在第五章中深入介绍。
线性回归模型的基本假设
i = 1 , 2 , … , N
在普通最小二乘法中,为保证参数估计量具有良好的性质,通常对模型提出若干基本假设:
1.解释变量之间互不相关;
2.随机误差项具有0均值和同方差。即
i = 1 , 2 , … , N
即随机误差项的方差是与观测时点t无关的常数;
3.不同时点的随机误差项互不相关(序列不相关),即
s ≠ 0, i = 1 , 2 , … , N
当随机误差项满足假定1 ~ 4时,将回归模型”称为“标准回归模型”,当随机误差项满足假定1 ~ 5时,将回归模型称为“标准正态回归模型”。如果实际模型满足不了这些假定,普通最小二乘法就不再适用,而要发展其他方法来估计模型。
5.随机误差项服从0均值、同方差的正态分布。即
~
i = 1 , 2 , … , N
4.随机误差项与解释变量之间互不相关。即
j = 1 , 2 , … , k , i = 1 , 2 , … , N
古典线性回归模型的一个重要假设是总体回归方程的随机扰动项 ui 同方差,即他们具有相同的方差 2。如果随机扰动项的方差随观测值不同而异,即ui 的方差为i2,就是异方差。用符号表示异方差为E(ui2) = i2 。
异方差性在许多应用中都存在,但主要出现在截面数据分析中。例如我们调查不同规模公司的利润,会发现大公司的利润变化幅度要比小公司的利润变化幅度大,即大公司利润的方差比小公司利润的方差大。利润方差的大小取决于公司的规模、产业特点、研究开发支出多少等因素。又如在分析家庭支出模式时,我们会发现高收入家庭通常比低收入家庭对某些商品的支出有更大的方差。
§ 异方差
新 疆
河 北
四 川
山 东
广 西
湖 南
重 庆
江 苏
云 南
福 建
天 津
浙 江
北 京
上 海
广 东
甘 肃
山 西
宁 夏
吉 林
河 南
陕 西
青 海
江 西
黑龙江
内蒙古
贵 州
辽 宁
安 徽
湖 北
海 南
CUM
IN
地区
CUM
IN
地区
交通和通讯支出
可支配收入
变量
交通和通讯支出
可支配收入
变量
表1 中国1998年各地区城镇居民平均每人全年家庭可支配收入及交通和通讯支出
单位:元
例:我们研究人均家庭交通及通讯支出(cum)和可支配收入(in)的关系,考虑如下方程: cumi=0 + 1ini + ui
利用普通最小二乘法,得到如下回归模型:
cumi= + ini ()
() ()
R2= .=
从图形上可以看出,平均而言,城镇居民家庭交通和通讯支出随可支配收入的增加而增加。但是,值得注意的是:随着可支配收入的增加,交通和通讯支出的变动幅度也增大了,可能存在异方差。如果我们把回归方程中得到的残差对各个观测值作图,则可以清楚地看到这一点。
异方差的存在并不破坏普通最小二乘法的无偏性,但是估计量却不是有效的,即使对大样本也是如此,因为缺乏有效性,所以通常的假设检验值不可靠。因此怀疑存在异方差或者已经检测到异方差的存在,则采取补救措施就很重要。
§ 异方差检验
1. 图示检验法
(1) 用X-Y的散点图进行判断
观察是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中)
(2)X - ûi2的散点图进行判断
首先采用OLS方法估计模型,以求得随机误差项u的方差i2的估计量(注意,该估计量是不严格的),我们称之为“近似估计量”,用 ei2 表示。于是有
()
即用 ei2 来表示随机误差项的方差。用 解释变量x 和 ei2的散点图进行观察是否随着x增加,出现方差的逐渐增加、下降或者不规则变化。
2. White异方差性检验
White (1980) 提出了对最小二乘回归中残差的异方差性的检验。包括有交叉项和无交叉项两种检验。普通最小二乘估计虽然在存在异方差性时是一致的,但是通常计算的标准差不再有效。如果发现存在异方差性,利用加权最小二乘法可以获得更有效的估计。
检验统计量是通过利用解释变量所有可能的交叉乘积对残差进行回归来计算的。例如:假设估计如下方程
()
式中b是估计系数,ûi 是残差。检验统计量基于辅助回归:
()
EViews显示两个检验统计量:F统计量和 Obs*R2 统计量。White检验的原假设:不存在异方差性(也就是,式()中除0以外的所有系数都为0成立) 。
White证明出:
()
其中:N是样本容量,k为自由度,等于式()中解释变量个数(不包含截距项)。如果计算的2值大于给定显著性水平对应的临界值,则可以拒绝原假设,得出存在异方差的结论。也就是说,回归方程()的R2越大,说明残差平方受到解释变量影响越显著,也就越倾向于认为存在异方差。
如果原模型中包含的解释变量较多,那么辅助回归中将包含太多的变量,这会迅速降低自由度。因此,在引入变量太多时,必须谨慎一些。White检验的另外一种形式,就是辅助回归中不包含交叉项。 因此White检验有两个选项:交叉项和无交叉项。
例:人均家庭交通及通讯支出(CUM)和可支配收入(IN )的回归方程的 White 异方差检验的结果:
该结果F 统计量和 Obs*R2 统计量的P值均很小,表明拒绝原假设,即残差存在异方差性。
由于假设的异方差形式不同,使用的辅助回归也不同,导致了不同的检验方法。各不同方法的异方差形式和辅助回归方程:
① Breusch-Pagan-Godfrey (BPG)异方差检验方法
,
② Harvey异方差检验
,
③ Glejser异方差检验
,
§ 加权最小二乘估计
1.方差已知的情形
考虑一个一元回归线性方程:
()
假设已知随机误差项的真实的方差,var(ui)=i2,则令wi=1/i,将模型两端同乘wi,变换为
()
令ui*=wiui,则
()
因此,变换后的模型()不再存在异方差的问题,可以用OLS估计。加权最小化残差平方和为:
()
由此获得的估计量就是权重序列为{ wi}的加权最小二乘估计量。
假设有已知形式的异方差性,并且有序列w,其值与误差标准差的倒数成比例。这时可以采用权数序列为w 的加权最小二乘估计来修正异方差性。对加权最小化残差平方和得到估计结果 :
其中 是k 1维向量。在矩阵概念下,令权数序列 w 在权数矩阵W的对角线上,其他地方是零,即W 矩阵是对角矩阵,y 和X是因变量和自变量矩阵。则加权最小二乘估计量为:
()
估计协方差矩阵为:
()
例 加权最小二乘估计
本例考虑对由四组家庭住房支出和年收入组成的截面数据进行研究(表)。
假设住房支出模型为
其中:yi是住房支出,xi是收入。普通最小二乘估计得出如下回归结果:
t = () ()
R2= F=
对数据图形的研究及以前有关支出的研究结果都说明这个模型具有异方差现象。
对住房支出模型进行异方差修正,然后进行估计。变换后的模型为
其结果为:
t = () ()
R2= F=
注意,修改后关于收入的回归系数的估计值为,比原来普通最小二乘估计有所增加。R2下降,但是,并不能直接比较R2 ,因为因变量已经发生了变化。
使用加权最小二乘法,也可以得到:
2.方差未知的情形
由于一般不知道异方差的形式,人们通常采用的经验方法是,并不对原模型进行异方差检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。如果确实存在异方差性,则被有效地消除了;如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法。
具体步骤是:
1.选择普通最小二乘法估计原模型,得到随机误差项的近似估计量 ût ;
2.建立 wi =1/| ût | 的权数序列;
3.选择加权最小二乘法,以 wi = 1/| ût |序列作为权,进行估计得到参数估计量。实际上是以 1/| ût |乘原模型的两边,得到一个新模型,采用普通最小二乘法估计新模型。
使用加权最小二乘法估计方程,首先到主菜单中选Quick/ Estimate Equation … , 然后选择LS-Least Squares (NLS and ARMA)。在对话框中输入方程说明和样本,然后按Options钮,出现如下对话框:
单击Weighted LS/TSLS选项在Weighted 项后填写权数序列名,单击OK。例子:
例:
EViews会打开结果窗口显示标准系数结果(如上图),包括加权统计量和未加权统计量。加权统计结果是用加权数据计算得到的:
未加权结果是基于原始数据计算的残差得到的:
估计后,未加权残差存放在RESID序列中。
如果残差方差假设正确,则加权残差不应具有异方差性。如果方差假设正确的话,未加权残差应具有异方差性,残差标准差的倒数在每个时刻 t 与 w 成比例。检验加权残差的异方差性:
可以看到加权最小二乘法消除了残差的异方差性。
§ 存在异方差时参数估计量的一致协方差
当异方差性形式未知时,使用加权最小二乘法提供在异方差存在时的一致参数估计,但通常的OLS标准差将不正确。
在描述协方差估计技术之前,应注意:
使用White异方差一致协方差或Newey-West异方差一致协方差估计不会改变参数的点估计,只改变参数的估计标准差。
可以结合几种方法来计算异方差和序列相关。如把加权最小二乘估计与White 或Newey-West协方差矩阵估计相结合。
1. 异方差一致协方差估计(White)
Heteroskedasticity Consistent Covariances(White)
White(1980)得出在存在未知形式的异方差时,对系数协方差进行正确估计的异方差一致协方差估计量。White 协方差矩阵公式为:
其中N是观测值数,k是回归变量数,ûi 是最小二乘残差。
EViews在标准OLS公式中提供White协方差估计选项。打开方程对话框,说明方程,然后按Options钮。接着,单击异方差一致协方差(Heteroskedasticity Consistent Covariance),选择White 钮,接受选项估计方程。
例:在输出结果中,EViews会包含一行文字说明表明使用了White估计量。
2. HAC一致协方差(Newey-West)
前面描述的White协方差矩阵假设被估计方程的残差是序列不相关的。Newey和West (1987) 提出了一个更一般的估计量,在有未知形式的异方差和自相关存在时仍保持一致。Newey-West估计量为:
其中
q 是滞后截尾,一个用于评价OLS随机误差项 ut 的动态的自相关数目的参数。根据Newey-West 假设,EViews中令 q 为:
Newey-West异方差一致协方差估计量,不能和加权最小二乘法一起使用。 使用Newey-West 方法,在估计对话框中按Options钮。在异方差一致协方差项中选Newey-West钮。
Newey-West估计量为:
§ 二阶段最小二乘法
回归分析的一个基本假设是方程的解释变量与扰动项不相关。但是,由于解释变量测量误差的存在,用于估计模型参数的数据经常与它们的理论值不一致;或者由于遗漏了变量,使得随机误差项中含有可能与解释变量相关的变量,这些都可能导致解释变量与扰动项的相关。
出现这种问题时,OLS和WLS估计量都有偏差且不一致,因而要采用其他方法估计。最常用的估计方法是二阶段最小二乘法。
考虑多元线性回归模型的矩阵形式
()
其中:y 和 X 是因变量和解释变量数据矩阵, 是系数向量。
为简化起见,我们称与残差相关的变量为内生变量,与残差不相关的变量为外生变量或前定变量。
解决方程右边解释变量与残差相关的方法是使用工具变量回归。就是要找到一组变量满足下面两个条件:
(1)与方程解释变量相关;
(2)与扰动项不相关;
选择 zi = (z1i, z2i,…, zki) 作为工具变量,它与解释变量相关,但与扰动项不相关,即
()
这些变量就可成为工具变量。用这些工具变量来消除右边解释变量与扰动项之间的相关性。
二阶段最小二乘方法(two stage least square,TSLS)本质上属于工具变量法,它包括两个阶段:
第一个阶段,找到一组工具变量,模型中每个解释变量分别关于这组变量作最小二乘回归;
第二个阶段,所有变量用第一个阶段回归得到的拟合值来代替,对原方程进行回归,这样求得的回归系数就是TSLS估计值。可以证明二阶段最小二乘估计量是一致估计量。
不必担心TSLS估计中分离的阶段,因为EViews会使用工具变量技术同时估计两个阶段。令 Z 为工具变量矩阵,y 和 X 是因变量和解释变量矩阵。则二阶段最小二乘估计的系数由下式计算出来:
系数估计的协方差矩阵为:
其中 s2 是回归标准差(估计残差协方差)。
使用二阶段最小二乘估计,打开方程说明对话框,选择Method中的TSLS估计。随着选择的变化,方程对话框也会发生变化,包括一个工具变量列表对话框。
输入工具变量时,应注意以下问题:
1. 使用TSLS估计,方程说明必需满足识别的阶条件,即工具变量的个数至少与方程的系数一样多。参见Davidson和MacKinnon(1994)和Johnston和DiNardo(1997)的讨论。
2. 根据经济计量学理论,与扰动项不相关的解释变量可以用作工具变量。
3. 常数c是一个合适的工具变量,如果忽略了它,EViews会自动把它加进去。
TSLS估计结果:
下面我们利用美国1947年1季度1999年4季度的宏观数据计算居民消费cs关于GDP 和利率R 的TSLS估计(工具变量是净出口NX、政府支出GOV、M1、时间趋势time):
§ 非线性最小二乘估计
经典的计量经济学模型理论与方法是在线性模型的基础上发展、完善起来的,因而线性计量经济学模型领域的理论与方法已经相当成熟。但是,现实经济活动并不都能抽象为线性模型,所以非线性计量经济学模型在计量经济学模型中占据重要的位置,关于它的理论与方法的研究是计量经济学理论与方法研究的一个广泛的领域。
假设回归方程为:
其中f 是解释变量和参数 的函数。最小二乘估计就是要选择参数 的估计值 b 使残差平方和最小:
如果 f 关于参数的导数不依赖于参数,则我们称模型为参数线性的,反之,则是参数非线性的。例如,
是参数线性的,f 关于参数的导数与参数 无关。 而
其函数的导数仍依赖于参数,所以它是参数非线性的。对于这个模型,没有办法使用普通最小二乘估计来最小化残差平方和。必须使用非线性最小二乘估计技术来估计模型参数。
非线性最小二乘估计根据参数 的估计值 b 选择最小化残差平方和。最小化的一阶条件是:
其中 G(b) 是 f (X, b) 关于b 的导数。
估计协方差矩阵为:
关于非线性估计的详细讨论,参见Pindick和Rubinfeld (1991, 231 - 245页) 或Davidson和MacKinon(1993)。
即
令
估计非线性最小二乘模型很简单,对于任何系数非线性的方程,EViews自动应用非线性最小二乘估计,会使用迭代算法估计模型。
1. 说明非线性最小二乘估计
对于非线性最小二乘模型,必须使用直接包含系数约束的EViews表达式以方程形式来说明。可以使用缺省系数向量C中的元素(例如,c(1), c(2), c(34), c(87) ) ,也可以定义使用其它系数向量。例如:
Y=c(1)+c(2)*(K^c(3)+L^c(4))
就是缺省系数向量C的4个元素从c(1)到c(4)。
例:如果设定例中的消费函数为非线性形式:
()
其中:cst 是实际居民消费,inct 是实际可支配收入。利用我国1978年~2006年的年度数据估计此非线性方程,由于用迭代法计算,首先要赋初值,比如可以设 3 的估计值 b3 初值是1,则可以利用OLS估计值(例中,b1 =,b2 = ) 作为b1 ,b2 的初值。经过迭代,得到的非线性消费方程为
()
t= () () ()
R2=
非线性形式的边际消费倾向为
即
MPCt = c(2)c(3)inct (C(3)-1) = inc^(-1)
图 动态的边际消费倾向
因此,非线性情况下的MPC是时变的,根据式()计算得到的边际消费倾向序列如图所示。注意,inc 的平均值( )对应的边际消费倾向为
MPC= (-1) =
近似等于线性模型估计值,因为线性模型的参数反映的是变量之间平均意义上的影响关系。
2.估计方法选项
(1)初始值
迭代估计要求模型系数有初始值。选择参数初始值没有通用的法则。越接近于真值越好,因此,如果你对参数值有一个合理的猜测值,将是很有用的。在某些情况下,可以用最小二乘法估计严格形式的模型得到良好的初始值。总体说来,必须进行试验以找到初始值。在开始迭代估计时,EViews使用系数向量中的值。很容易检查并改变系数的初始值。要察看初始值,双击系数向量。如果初始值是合理的,可以对模型进行估计。如果想改变初始值,首先确定系数向量表使处于编辑状态,然后输入系数值。完成初始值设定后,关闭系数向量窗口,估计模型。
也可以从命令窗口使用PARAM命令设定初始系数值。只需输入关键词PARAM,然后是每个系数和想要的初值:
param c(1) c(2) c(3) 1
中设定c(1)= ,c(2)= 和c(3)=1。详情参见附录E。
(2)迭代和收敛选项
可以通过说明收敛标准和最大迭代次数来控制迭代过程。按Options钮并输入想要的数值。如果系数变化的最大值低于阈值,EViews报告估计过程已经收敛。例如,设定阈值为,则EViews会通过检查系数的最大变化是不是小于来决定是否收敛。
在大多数情况下,不许改变最大迭代次数。然而,对于某些难于估计的模型,在最大迭代次数下迭代过程不收敛。这时,只需单击Options钮,然后,增加最大迭代次数并点OK接受选项 ,开始估计。EViews会使用最后一组参数值作为初始值进行估计。
§ 广义矩方法(GMM)
Generalized Method of Moments
广义矩估计方法(GMM)是基于模型实际参数满足一些矩条件而形成的一种参数估计方法,是矩估计方法的一般化。如果模型的设定是正确的,则总能找到该模型实际参数满足的若干矩条件而采用GMM方法。GMM估计的出发点是参数应满足的一种理论关系。其思想是选择参数估计尽可能接近理论上的关系。把理论上的关系用样本近似值代替,并且估计量的选择就是要最小化理论值和实际值之间的加权距离。
由于传统的计量经济模型估计方法,例如普通最小二乘法、工具变量法、极大似然法等,都有它们的局限性,其参数估计量必须在模型满足某些假设时才具有良好的性质,如只有当模型的随机误差项服从正态分布或某一已知分布,极大似然法估计量才是可靠的估计量;而GMM估计是一个稳健估计量,因为它不要求扰动项的准确分布信息,允许随机误差项存在异方差和序列相关,所得到的参数估计量比其他参数估计方法更合乎实际;而且可以证明,GMM包容了许多常用的估计方法,普通最小二乘法、工具变量法、极大似然法都是它的特例。
矩法估计量
矩估计是基于实际参数满足一些矩条件而形成的一种参数估计方法,如果随机变量Y的期望值是,即
()
则 是满足相应的样本矩条件,即
()
现在,考虑一元古典线性回归模型中的假设条件:
()
()
其所对应的样本矩条件分别为
()
这就是OLS估计量的正规方程组。因此,OLS估计量是一个矩法估计量。
再比如二阶段普通最小二乘法中,假定解释变量与随机扰动项可能相关,找到一组与扰动项不相关的工具变量Z,因而正规方程组发生变化,由式()的矩条件:
得到了式()的参数估计量形式。
因此许多标准估计量,包括所有EViews提供的系统估计量,都可以看作GMM估计量的特例。
参数要满足的理论关系通常是参数函数 f ( ) 与工具变量 zt 之间的正则条件:
, 是被估计参数
其中m() =f()Z, A是加权矩阵;任何对称正定矩阵 A 都是 的一致估计。然而,可以推出要得到 的(渐近)有效估计的一个必要条件是令A等于样本矩 m 的协方差矩阵的逆。
GMM估计量选择参数估计的标准是使工具变量与函数 f 之间的样本相关性越接近于 0 越好。用函数表示为:
广义矩估计
下面考虑多元线性回归模型的GMM参数估计,假设回归方程为
t =1, 2, …, T ()
其中:解释变量向量 xt = (x1t ,x2t ,… ,xkt),参数向量 = (1,2,…,k ),T 是样本个数。对于 k 维单方程参数向量 的GMM估计,由于解释变量向量 xt 与随机扰动项 ut 可能相关,因此可以假设存在含有L (L k)个分量的工具变量向量 zt 与随机扰动项不相关(如果假设 xt 与随机扰动不相关,zt 就是 xt),t 时刻含有 L 个变量的向量 zt 与 ut满足 L 个正交的矩条件:
()
其中:zt =(z1t,z2t,…,zLt)是L维向量。
相应的L个样本矩为
()
其中:Z是工具变量数据矩阵, 是式()的残差序列。选择参数估计量b,使式()所示的加权距离最小。
()
样本矩的协方差矩阵为
()
可以使用White异方差一致协方差或Newey-West HAC一致协方差估计矩阵[见式()、式()],则 A = -1 。
用GMM法估计方程,从说明对话框中选择GMM估计方法,GMM对话框会变为:
要得到GMM估计,应该写出矩条件作为参数表达式和工具变量之间的正交条件。写正交条件的方法有两种:有因变量和没有因变量。
如果使用列表法或有等号的表达式法说明方程,EViews会把矩条件理解为工具变量和方程残差之间的正交条件。如果用没有等号的表达式,EViews会正交化表达式和工具变量。
在方程说明对话框的工具变量(Instrument list)列表中,必须列出工具变量名。如果要保证GMM估计量可识别,工具变量个数不能少于被估计参数个数。当然常数会自动被EViews加入工具变量表中。
例如, 方程说明: y c x
工具变量: c z w
正交条件为:
如果方程说明为: c(1)*log (y)+x^c(2)
工具变量表: c z z(-1)
则正交条件为:
在方程说明框右边是选择目标函数的权数矩阵A。如果选择基于White 协方差的加权矩阵,则GMM估计对未知形式的异方差将是稳健的。
如果选择基于HAC时间序列的加权矩阵,则GMM估计量对未知形式的异方差和自相关是稳健的。对于HAC选项,必须说明核和带宽。
例 利用中国的1978~1999的宏观经济数据,消费CS、 GDP、投资IFCK,利用GMM方法计算消费方程:
§ 多项分布滞后(PDLS)
在经济分析中人们发现,一些经济变量,它们的数值是由自身的滞后量或者其他变量的滞后量所决定的,表现在计量经济模型中,解释变量中经常包含某些滞后变量。以投资函数为例,分析中国的投资问题发现,当年的投资额除了取决于当年的收入(即国内生产总值)外,由于投资的连续性,它还受到前1 个、2个、3个…时期投资额的影响。已经开工的项目总是要继续下去的,而每个时期的投资额又取决于每个时期的收入,所以可以建立如下关于投资的计量经济方程
其中I 表示投资额,Y 表示国内生产总值。
在分析货币政策的效应时,经常会分析货币供给对产出的影响,这时要在模型中加入货币供给的多期滞后,以反映出货币政策的时滞性。再如消费理论告诉我们,人们的消费不仅是当期收入决定的,以前的收入水平和消费习惯等都对消费产生影响。因此,收入和消费的滞后变量可能都应该包含到模型中。这时的模型考虑了变量跨时期的影响关系,因此叫做动态模型(dynamic models)。
如果模型中仅包含解释变量滞后,形如式()的模型叫做分布滞后模型(distributed lag models),这是因为解释变量每单位变化的影响分布到了多个时期:
其中:wt (w1t, w2t ,…, wdt) 是独立变量构成的解释变量向量, (1, 2,…, d) 是相应的系数向量。系数 描述 x 对 y 作用的滞后。在模型中解释变量与随机误差项不相关的情况下,可以直接使用OLS估计参数。但是,一个显然的问题是解释变量之间,即 x 的当前和滞后值之间具有高度共线性,而共线性问题的一个直接后果是参数估计量失去意义,不能揭示 x 的各个滞后量对因变量的影响,所以必须寻求另外的估计方法。
()
一、多项式分布滞后模型的估计方法
可以使用多项式分布滞后(Polynomial Distributed Lags , PDLs)来减少要估计的参数个数,以此来平滑滞后系数。平滑就是要求系数服从一个相对低阶的多项式。p 阶PDLs模型限制 系数服从如下形式的 p 阶多项式
j = 0 , 1 , 2 , … , k ()
c 是事先定义常数:
PDLs有时被称为Almon分布滞后模型。常数 c 仅用来避免共线性引起的数值问题,不影响 的估计。这种定义允许仅使用参数 p 来估计一个 x 的 k 阶滞后的模型(如果 p > k,将显示“近似奇异”错误信息)。
定义一个PDL模型,EViews用()式代入到()式,将产生如下形式方程
其中
()
一旦从()式估计出 ,利用()式就可得到 的各系数。这一过程很明了,因为是 的 线性变换。定义一个PDLs要有三个元素:滞后长度k,多项式阶数(多项式最高次幂数)p和附加的约束条件。
一个近端约束限制 x 对 y 一期超前作用为零:
一个远端约束限制 x 对 y 的作用在大于定义滞后的数目衰减:
如果限制滞后算子的近端或远端,参数个数将减少一个来解释这种约束。如果对近端和远端都约束,参数个数将减少二个。
EViews缺省不加任何约束。
二、如何估计包含PDLs的模型
通过PDL项定义一个多项式分布滞后,信息在随后的括号内,按下列规则用逗号隔开:
1. 序列名
2. 滞后长度(序列滞后数)
3. 多项式阶数
4. 一个数字限制码来约束滞后多项式:
1 = 限制滞后近端为零
2 = 限制远端为零
3 = 两者都限制
如果不限制滞后多项式,可以省略限制码。方程中可以包含多个PDL项。
例如: sales c pdl(y , 8 , 3 )是用常数,解释变量 y 的当前和8阶分布滞后来拟合因变量sales,这里解释变量 y 的滞后系数服从没有约束的3阶多项式。
类似地, y c pdl(x , 12 , 4 , 2) 包含常数,解释变量 x 的当前和12阶分布滞后拟合因变量 y,这里解释变量x的系数服从带有远端约束的4阶多项式。
PDL也可用于二阶段最小二乘法TSLS。如果PDL序列是外生变量,应当在工具表中也包括序列的PDL项。为此目的,可以定义PDL(*)作为一个工具变量,则所有的PDL变量都将被作为工具变量使用。例如:如果定义TSLS方程为
sales c inc pdl(y(-1) , 12 , 4)
使用工具变量:z z(-1) pdl(*)
则 y 的分布滞后和 z,z(-1) 都被用作工具变量。
PDLs不能用于非线性定义。
例 投资INV关于关于GDP的 分布滞后模型的结果如下
逐个观察,GDP滞后的系数多数在统计上都不显著。但总体上讲回归具有一个合理的R2。这是回归自变量中多重共线的典型现象,建议拟合一个多项式分布滞后模型。估计一个无限制的3阶多项式滞后模型,输入变量列表: c INV(-1) PDL(GDP, 3, 2),窗口中显示的多项式估计系数,PDL01, PDL02, PDL03 分别对应方程()中z1, z2, z3 的系数1, 2, 3。
方程()中的系数 j 在表格底部显示。
表格底部的滞后值是分布滞后的估计系数值,并且在平稳的假设下有GDP对INV的长期影响的解释。
待估计的方程:
INV = C(1) +C(2)*INV(-1)+ C(6)*GDP + C(7)*GDP(-1)
+ C(8)*GDP(-2) +C(9)*GDP(-3)
估计的方程:
INVt= + -1 + GDPt+ -1 +-2
- -3 +-4+ ût
加了限制滞后近端为零的近端约束,显著性有明显改善。
逐步最小二乘回归
建立回归模型的时候,可能会面临很多解释变量的取舍问题,这些解释变量(包括相应的滞后变量)在经济意义上可能都对因变量有影响而难以取舍,这种情形下,可以通过逐步回归分析方法(stepwise least squares regression, STEPLS)利用各种统计准则筛选解释变量。
这种方法包含前向法(Forwards)和后向法(Backwards)两种,两种方法都是利用最大t值或者相对应的最小 p 值作为变量入选标准,即根据变量的显著性进行筛选。前向法是根据最小 p 值进行逐步回归。首先设定变量的入选 p 值标准(比如),即将入选变量的显著性水平设为5%;其次选择所有变量中 p 值最小并且小于所设定入选 p 值标准的变量加入模型,接着在剩余变量中一直筛选下去;当剩余的每个变量加入模型后其 p 值都大于设定的 p 值时,或者增加回归变量的数量达到了建模者事先设定的数值时,逐步回归运算结束。
1. 单方向筛选法(Uni-directional method)
后向法与前向法类似,只不过这种方法一开始就将全部的备选变量加入模型,然后选择p值最大的变量,如果此变量的p值大于事先设定的数值,则将其剔除掉,然后再在剩余的变量中依此做法选择剔除变量,直到模型中剩余的解释变量所对应的p值都小于设定值,或者增加回归变量的个数达到设定数值时结束筛选。
逐步筛选法是以单方向筛选法为基础的,也包含前向法(Forwards)和后向法(Backwards)两种方法。逐步前向筛选法最先是和单方向前向法完全相同,将p值最小并且小于所设定入选p值标准的变量加入模型,但不同的是,每次增加变量后还要执行单方向后向法的程序,即检查模型中包含的解释变量中是否存在最大的p值超过设定值的情况,如果存在,则剔除这个变量。每次按照单方向前向法增加一个变量的时候,都要按照单方向后向法检查是否要剔除一些不显著的变量。筛选结束规则与上述两种方法相同。
2. 逐步筛选法(Stepwise method)
这种方法基于模型整体效果,即通过判断拟合优度R2作为筛选变量的标准。首先选择能够使得方程的R2增加最大的变量入选,然后选择下一个能使回归方程R2增加最大的变量。接下来,将第一个选中的变量逐一与未选中的变量互换,一旦出现R2超过现在的数值的情况,就将新的变量换入方程中,再将另一个变量与其他未选中的变量互换,这个过程一直进行下去,直到R2无法改善的时候,再考虑加入第三个变量。加入了第三个变量后,仍然要执行类似的变量互换过程,一旦出现R2超过既有数值的情况,就换入新的变量。当入选变量的个数达到事先设定的数值时,结束筛选。
3. 互换变量法(Swapwise method)
组合方法与互换变量法作用类似,即将给定的所有变量进行组合分别进行回归,使得R2最大的变量组合即为最终的回归方程。这种方法适合于建模者事先设定了最终希望包含的变量个数的情形。
4. 组合法(Combinatorial method)
例 逐步回归模型
在本例仍然研究例的美国的投资函数,采用美国1947年1季度~1994年4季度数据。因变量是美国总投资(inv),考虑用GDP、个人消费(cs)、政府收支差额 (g_net) 和GDP平减指数 (p),以及它们滞后1期的序列作为备选解释变量,通过逐步回归方法最终选择出对投资有显著影响的解释变量。本例中,设定入选的解释变量应该满足其系数在(5%)的显著性水平下不为0,使用逐步筛选法的前向法,按照这种方法的操作步骤,最终可以得到满足要求的模型估计结果为:
t值= () () () () () () () ()
R2= . =
入选变量的 t 值对应的 p 值都远远小于,因此,通过逐步回归方法,在备选变量中,选择出了在5%显著性水平下对因变量影响显著的解释变量。
在方程估计方法设定对话框中选择方法:“STEPLS - Stepwise Least Squares”,EViews将会显示图所示窗口。在用逐步回归方法时,方程只能用列表法来设定。在上面的对话框中依次输入因变量和必须要在最终方程形式中包含的自变量,在下面的对话框中输入可能会在最终方程中出现的即备选的解释变量。
5. 在EViews中进行逐步回归估计
图 逐步最小二乘分析变量设定对话框
图 逐步最小二乘分析变量设定对话框
分位数回归
分位数回归(Quantile Regression)最早由Koenker和Bassett于1978年提出 ,它提供了回归变量X和因变量Y的分位数之间线性关系的估计方法。绝大多数的回归模型都关注因变量的条件均值,但是人们对于因变量条件分布的其他方面的模拟方法也越来越有兴趣,尤其是能够更加全面地描述因变量的条件分布的分位数回归。利用分位数回归解决经济学问题的文献越来越多,尤其是在劳动经济学中取得了广泛应用。如在教育回报和劳动市场歧视等方面都出现了很好的研究成果。在经济学中的应用研究还包括诸如财富分配不均问题、失业持续时间问题、食品支出的恩格尔曲线问题、酒精需求问题和日间用电需求问题等。在金融学领域也涌现出大量使用分位数回归的应用研究成果,主要应用领域包括风险价值(Value at Risk, VaR)研究和刻画共同基金投资类型的指数模型。
相对于最小二乘估计,分位数回归模型具有四个方面的优势:
(1)分位数模型特别适合具有异方差性的模型;
(2)对条件分布的刻画更加的细致,能给出条件分布的大体特征。每个分位点回归都赋予条件分布上某个特殊点(中央或尾部)一些特征;把不同的分位点回归集中起来就能提供一个关于条件分布的更完整的统计特征描述。并且不同分位点下所给出的参数估计本身也可能有值得进一步探讨的意义;
(3)分位数回归并不要求很强的分布假设,在扰动项非正态的情形下,分位数估计量可能比最小二乘估计量更为有效。
(4)与最小二乘法通过使误差平方和最小得到参数的估计不同,分位数回归是通过使加权误差绝对值之和最小得到参数的估计,因此估计量不容易受到异常值的影响,从而估计更加稳健。
分位数回归的基本思想和系数估计
假设随机变量 Y 的概率分布为:
()
Y 的 分位数定义为满足 F(y) 的最小y值,即:
, ()
的分位点可以由最小化关于的目标函数得到,即:
()
其中,argmin{}函数表示取函数最小值时 的取值,
(u) u( I(u < 0)) 称为检查函数(check function),依据 u 取值符号进行非对称的加权。
考察此最小化问题的一阶条件为:
()
即F() = ,也就是说F(Y)的第 个分位数是上述优化问题的解。
F(y) 可以由如下的经验分布函数替代:
()
其中 y1,y2,…,yn 为Y 的 N 个样本观测值;I(z) 是指示函数,z 是条件关系式,当 z 为真时,I(z) = 1;当 z 为假时,I(z) = 0。式()中条件关系式 z 为 yi y,当 yi y 时,I(yi y) = 1,否则取值为0。
相应地,经验分位数为:
, ()
式()可以等价地表示为下面的形式:
()
现假设Y的条件分位数由k个解释变量组成的矩阵X线性表示:
()
其中,xi =(x1i,x2i,…,xki) 为解释变量向量,( ) =(1,2,…,k )是 分位数下的系数向量。当 在 (0, 1) 上变动时,求解下面的最小化问题就可以得到分位数回归不同的参数估计:
()
特别地,当 = 时为最小绝对值离差法(Least Absolute Deviations, LAD)。另外,分位数回归的系数估计需要求解线性规划问题,很多种方法可以对此问题进行求解。
系数协方差的估计
1.独立同分布设定下协方差矩阵的直接估计方法
(1)Siddiqui 差商法
(2)稀疏度的核密度估计量
2.独立但不同分布设定下协方差矩阵的直接估计方法
3.自举法(Bootstrap)
(1)X-Y自举法
(2)残差自举方法
(3)马尔可夫链边际自举法
模型评价和检验
1.拟合优度
与传统的回归分析的拟合优度R2类似,分位数回归模型也可以计算拟合优度。在分位数回归中,参数估计是通过
()
得到的。将数据写为 xi = (1,xi1),( ) = ( 0( ), 1( )),这样式()可以写为
()
最小化 分位数回归的目标函数(objective function),得到
()
回归方程中只包含常数项情形下,最小化分位数回归的目标函数(objective function),得到
()
定义分位数回归方程的Machado拟合优度为
()
R1( )位于0~1之间,R1( )越大说明模型估计的越好,反之R1( )越小模型估计越差。可以看出,这与用普通最小二乘法估计的传统回归方程中定义的拟合优度R2类似,分位数回归拟合优度的计算是基于分位数回归方程目标函数的最小值与只用常数项作为解释变量时的分位数回归方程目标函数最小值的关系。
2.拟似然比检验(Quasi-LR Test)
3.分位数过程检验(Quantile Process Testing)
(1)斜率相等检验(Slope Equality Testing)
(2)对称检验(Symmetry Testing)
在EViews中进行分位数回归
1. 方法选择
为了使用分位数回归方法估计方程,在方程设定对话框的估计方法中选择“QREG”,打开分位数回归估计对话框:
图 分位数回归
“Quantile to estimate”后面输入值,可以输入0~1之间的任意数值,默认值是,即进行中位数回归。
例 分位数回归
利用例的消费和收入数据,我们建立如下的回归方程研究政府支出对居民消费的影响:
()
其中,cs为实际居民消费,inc为实际可支配收入,fe为财政支出,考虑到财政政策通常具有时滞的特点,模型中采用滞后一期的财政支出作为解释变量。所有变量均为剔除了价格因素的年度数据,样本区间为1978~2006年。为了进行比较,我们同时给出最小二乘法以及三个不同分位点的分位数回归估计结果(见表)。
注:括号内为弹性系数的t值; Quant20, Quant50, Quant80分别
代表20%,50%,80%分位数。
R2
()
()
()
()
()
()
()
()
()
()
()
()
()
()
()
()
Quant80
Quant50
Quant20
OLS
系数估计结果
表 最小二乘法和分位数回归结果
从估计结果可以看出,对于不同的估计方法,居民实际可支配收入、前期消费水平两个变量的弹性系数变化不大。尽管在以往的研究中,政府支出对居民消费的影响还没有得出一致的结论,但是在本例中三种估计的结果表明政府支出对居民消费的弹性值均为正,说明在我们所分析的样本区间内政府支出与居民消费之间是互补的,政府支出的增加有利于加强基础设施建设和提高社会保障水平,使居民减少储蓄,尤其是预防性储蓄,从而增加消费。最小二乘估计给出的是政府支出对消费的平均影响效果,而分位数回归给出的是消费处于不同分位水平时,政府支出对居民消费的影响。在20%,50%和80%的分位点上政府支出的弹性分别为,,,并且后两个水平的估计是不显著的,说明当消费水平较低时,政府支出的影响相对较大,而对于较高的消费水平,政府支出的影响变小,并且是不显著的。因为当消费水平较高时,进一步提升的空间变小,政府支出对其影响也变小。
例的结果输出如下(以分位数的估计结果为例):
2. 分位数回归的输出结果
Prob(Quasi-LR stat)
Quasi-LR statistic
Sparsity
Objective (const. only)
Quantile dependent var
Objective
. of regression
. dependent var
Adjusted R-squared
Mean dependent var
Pseudo R-squared
LOG(CSP(-1))
LOG(EXPFP(-1))
LOG(INC)
C
Prob.
t-Statistic
Std. Error
Coefficient
Method: Quantile Regression (tau = )
Dependent Variable: LOG(CSP)
输出结果的上方显示了设定的内容,本例中设定用“Huber Sandwich”方法估计系数协方差,用“Siddiqui(mean fitted)”方法得到稀疏度,用“Hall-Sheather”方法计算带宽。下面显示了系数估计值、标准差、t检验值和相应的p值。最下方显示了拟合优度和调整值、稀疏度数值、目标函数的最小值(“objective”)、仅包含常数的目标函数的最小值(“Objective (const. only))、因变量序列的经验分位数(“Quantile dependent var”)、拟似然比检验值(“Quasi-LR statistic”)和相应的p值(“Prob(Quasi-LR stat)”)等。
3.分位数回归中的视图和过程
分位数回归中的多数视图和过程都与用OLS法估计的方程对象中提供的功能相同,但有些地方还是值得注意,如冗余变量检验、遗漏变量检验和“Ramsey RESET”检验将都用到拟似然比检验。而在分位数过程(“Quantile process”)里,提供了分位数回归中特有的三个功能:过程系数(“Process Coefficients”)、斜率相等检验(“Slope Equality Test”)和对称检验(“Symmetric Quantiles Test”)。
(1)“Process Coefficients”:通过这个功能可以同时观察多种分位数设定下的系数估计结果。可以选择结果输出(“output”)的显示方式,即表格(“table”)或者图形(“graph”),默认状态是以表格形式显示系数估计值、标准差、t检验值和p值。如果选择以图形的方式显示,需要指定置信度,默认状态是95%。下面一栏中可以设定在何种分位数下估计模型,系统默认数值是10分位数,即对因变量的10%、20%、一直到90%分位数情形分别估计系数,如果输入20,则对因变量的5%、10%、一直到95%分位数情形分别估计系数。
(2)“Slope Equality Test”:这个功能用来检验因变量的不同分位数回归估计中斜率系数是否相同。默认状态下,只比较25%、50%、75%三种情形,当然也可以自行设定。
(3)“Symmetric Quantiles Test”检验对称的分位数回归估计出来的系数的平均值是否与中位数回归的系数估计值相等。
非参数回归模型
前面介绍的回归模型,无论是线性形式还是非线性形式,都需要明确地给出被解释变量和解释变量之间的关系,才能进行参数估计进而利用模型的估计结果分析问题。然而,变量之间关系的设定具有很强的主观性,建模者往往需要尝试多种形式的模型,才能根据统计检验和经济意义等多种因素的考虑最终选定模型的形式。本节中将要对非参数回归模型作初步的介绍。非参数模型假定变量间的关系是未知的,其所要估计的是回归函数本身。对于这个未知函数的估计通常可以采用核估计和近邻估计等方法。
密度函数的非参数估计
1.已知密度函数形式的估计
若已知密度函数的形式,可使用参数估计方法来估计模型参数。假设随机变量X1,X2,,XN 独立同分布,其密度函数为 f (x| ),其中 是未知参数,则 的最大似然估计为使X1,X2,,XN 的联合密度函数
()
达到最大。表给出一些重要的理论分布的密度函数。可以利用极大似然估计方法得到未知参数 的估计值,进而求出近似的密度函数。
2.一元密度函数的核估计
随机变量密度函数的具体形式往往是不知道的,本节在对随机变量的密度函数没有任何信息的情况下讨论密度函数的核估计。
假设随机变量X1,X2,,XN 同分布,其密度函数为 f (x) 未知。可从经验分布函数导出密度函数的核估计,经验分布函数为
()
其中N是观测值的数目,I(z) 是指标函数,z 是条件关系式,当 z为真时,I(z) = 1;当 z 为假时,I(z) = 0。式()中条件关系式 z 为Xi y,Xi 是 i 点的样本观测值,当 Xi y 时,I(Xi y) = 1,否则取值为0。
取核函数为均匀核:
()
则核密度估计为
()
其中,h是带宽(或平滑参数),将核函数放宽就得到一般的核密度估计
()
其中,K是核函数。核函数的形式参见本章节的表。
一元非参数计量经济模型
设随机变量 Y 为被解释变量,X 为解释变量,表示实际影响 Y 的一个重要因素,它既可以是确定性变量,也可以是随机变量。给定样本观测值(Y1, X1),(Y2, X2),…,(YN, XN),假定{Yi }独立同分布,可建立非参数模型:
()
其中:m() 是未知的函数,ui 为随机误差项。对于模型()有许多种非参数估计方法:核估计、局部线性估计、近邻估计、正交序列估计和样条估计等。
局部多项式核估计是对每一个x点进行局部加权最小二乘估计来拟合Y,即最小化
()
可见,核估计等价于局部加权最小二乘估计。需要注意的是对于不同的 x,各参数 的估计值不同。k 是局部多项式阶数,当 k =1 时,就是局部线性回归。
核估计的核心问题是核函数和带宽的选择。常用的核函数参见本章节的表,有均匀核、高斯核和Epanechnikov核等。通常带宽设置为
()
其中:[XL,XU] 是 X 的取值范围。
在进行局部多项式核估计时,通常指定一个点数 M,假设序列 X 的样本值范围是 [XL,XU],则在如下点进行多项式回归估计:
()
2.Nadaraya-Watson核估计
Nadaraya-Watson核估计问题等价于在式()中k =0时的情况,即下式所表示的加权残差平方和的最小化问题:
()
可以看出,Nadaraya-Watson核估计是局部多项式核估计的特殊形式,仅包含常数项,即对于每个 x,只需要估计 0。
3.邻近点加权拟合
这是一种带宽基于最邻近点的局部回归。对样本中的每一数据点x,它拟合出一条局部的并经加权的回归线。局部是说只用邻近点也就是样本的子集来一步步回归,并且邻近点越远给越小的权数。非参数回归模型()的邻近点拟合估计为:
()
其中三次方权数(Tricube):
()
其中:di = | Xi x|,选取在(0,1)之间的一个分数 做为带宽,控制拟合线的平滑程度,分数 越大拟合线越平滑。
N是总样本个数的100%,[N]表示对 N 取整。式()在给定点 x 使用[N]个观测值做局部回归,最邻近定义意味着被估计点周围点的个数不必是对称的。d([N])是距离x 最近的[N]个样本点中的最大距离。这样,距离 x 最近的[N]个样本在进行局部回归时将按照距离 x 远近而被赋予不同的权重。而其他样本点将不予考虑,即权重为0。对于给定点 x,可得
()
在EViews中进行非参数估计
1.一元密度函数的核估计
在已知随机变量的密度函数形式时,在序列对象菜单中选择“View/Graph”,出现“Graph Option”对话框,选择“Graph Type中的“Distribution”,然后在对话框的右边选择“Theore- tical Distribution”,点击右边的“Option”,出现“Distribution Plot Customize”对话框,可以按表选择相应的分布函数形式计算给定变量的密度函数,用户可以给出相应的未知参数值,如果没有给出,EViews将自动近似计算未知参数。
对于密度函数形式未知的情况下可以选择“Kernel Density”,也出现“Distribution Plot Customize”对话框,可以按表选择相应的核函数形式。
图 一元密度函数的核估计对话框
例 一元密度函数的核估计
利用一元密度函数的核密度估计方法计算例的人均家庭交通及通讯支出(cum),人均可支配收入(in)的密度函数,核函数的形式选为Biweight核形式。结果如下:
图 cum的密度函数
图 in的密度函数
例 非参数核估计和邻近点加权拟合
本例中将用核估计和邻近点加权拟合来描述变量Y和X之间的关系,其中,X是从0至1之间的均匀分布随机抽取的1000个数,Y由下式生成:
, ()
图描绘了Y与X样本散点图和这两个变量间的真实函数关系m(x)。
图 散点图和变量间真实的函数关系m(x)
分别利用核估计和邻近点加权拟合描述这两个变量的函数估计。对于核估计,如果设定带宽h=、二次多项式即k=2,并且核函数选为Epanechnikov形式,将可以得到核估计如图所示;如果设定p=300、二次多项式即k=2,将可以得到邻近点加权拟合如图所示。
图 核估计的结果 图 邻近点加权拟合的估计结果
可见,通过合适的设定,核估计和近邻估计都可以得到与真实的函数关系很相近的估计结果,但核估计的结果与真实的关系更加符合。
2.一元非参数计量经济模型估计
以例的变量来说明在EViews中如何一元非参数计量经济模型的估计。首先,建立包含X和Y的组对象,这里要注意必须按照解释变量和被解释变量这样的顺序依次选择,如本例的组中包含的第一个成员是X,第二个成员是序列Y。
(1)核估计
如果想要进行核估计,在组对象中选择:“View/Graph”,然后,在图形选项的图形类别中选择“Scatter”,右侧的详细描述将相应发生变化,在“fit lines”的下拉列表中选择“kernel fit”,然后,单击其右侧的“Option”,将出现图所示的“Scatterplot Customize”对话框。
图 核估计对话框
在这个对话框中,需要确定局部回归的多项式形式、核函数形式、带宽和其它选项。
(2)邻近点加权拟合估计
如果想要进行邻近点加权拟合估计,要在组对象中选择view/Graph/ Scatter/Scatter with nearest neighbor fit,将出现图所示的对话框。
在“Bandwidth”中要输入0~1之间的小数,它将控制局部回归中用到的样本个数,若样本总数为N,则局部回归中将包括[N]个样本数。如例中的样本总数为1000,若想在每次回归时包含300个样本,则应在带宽中输入。
EViews在近邻估计中没有提供多种核函数的选择用来进行局部加权估计,仅提供一种局部加权方式,即选择“Local Weighting(Tricube)”,将按照式 () 确定的权重进行加权。
图 邻近点加权拟合估计对话框