第十章 滞后变量回归模型 前面九章讲的回归模型,其自变量大都是固定的设计矩阵,各个自变量彼此没有关系,即使考虑自变量是随机的,也是与因变量无关的。本章考虑的回归模型则不然,要么一些自变量是另一些自变量的滞后部分,要么自变量是因变量的滞后部分。 这种回归模型考虑的一般是时间序列数据。如果在回归模型中不仅含有解释变量X的当前值而且含有X的滞后值,它就称为分布滞后模型(Distributed-Lag Model),如 Y=α+βX+βX+βX+L+βX+ε () t00t1t−12t−2Nt−Nt就是一个分布滞后模型。如果模型的滞后长度N已知,那么模型可以直接求解,只需注意由于滞后关系,实际参与计算的模型观测数等于样本观测数n减去滞后长度N,也就是说模型的自由度受了损失。如果模型的滞后长度N未知,那么需要确定它,办法是逐个添加滞后变量X,X,L,直到添加的项在模型中的作用微乎其微,即它的回归系数统计意义为0,t−N−1t−N−2此时的滞后长度就算确定了。既然直接添加滞后项越多,自由度损失越大,那么有没有间接添加的办法,能在添加同样的滞后项情况下,减少一些自由度损失呢?有限多项式回归能够在这方面有所帮助。 如果模型中包含一个或若干个因变量的滞后值,它就称为自回归模型(Autoregressive Model),如 Y=α+βX+γY+ε () ttt−1t就是一个自回归模型。 ()与()都是描写有限分布滞后的回归模型。虽然我们在实际工作中不大可能直接遇见无限分布滞后的回归模型,但是有两种滞后模型(自适应期望模型与部分调整模型)可以经过一定变换和推导,得到无限分布滞后的回归模型如()()。对于几何无限分布滞后的回归模型: 2Y=α+βX+βλX+βλX+L+ε () t0t0t−10t−2t我们一般使用Koyck变换,把它转换成一阶自回归模型,进而求得其解。 分布滞后模型与自回归模型都属于滞后变量回归模型,它在经济领域有广泛的应用。一个当前的经济指标,经常受到过去某些经济指标(包括自身的)影响,这是件很常见很容易理解的事情。我们在处理这一类问题时要考虑下列问题: 461
1.经济分析中滞后起什么作用? 2.滞后的原因是什么? 3.在实证分析中对滞后有没有什么理论判别方法? 4.自回归与分布滞后有什么关系?能否从一个导出另一个? 5.滞后变量模型中有哪一些统计问题? 6.变量之间的主滞后是否意味着灾难?如果是,如何度量它? 这些问题有些是不能给出精确定义或精确解答的,只能体会其意思。我们以下主要是从经济模型的数学形式来展开讨论。 第一节 模型概念:消费滞后、通胀滞后与存款创生 实际经济活动中,因变量Y经常是与经济自变量的过去值有关,而与当前值有关反而少一些。为了具体说明这种滞后关系,我们看一些实例。 1.消费滞后 假如一个消费者从今年起每年工资增加2000元,并将持续一段时间。他的消费行为将受到怎样的影响呢?一般来说,他不会把当年增加的收入全部花光。很可能是,他把每增加的2000元当年花掉800元,第二年花掉600元,第三年花掉400元,余下的永久储蓄起来。这样到第三年,他的消费增加额将是1800元。这样的消费函数写下就是 Y=C++++ε () ttt−1t−2t这里Y是消费开支,C是常数,X是收入。 一般地,有限分布滞后模型可以写作 Y=α+βX+βX+βX+L+βX+ε () t0t1t−12t−2kt−kt这里分布滞后k个时段。系数β称作短期系数,因为它给出X对Y同期线性作用大小。如果0X的改变维持不变,那么(β+β)给出Y在下一周期的改变,(β+β+β)给出再下一周01012期的改变,等等。这些部分和称作中期乘子。最后,经过k个周期,我们得到 kβ=β+β+L+β=β () ∑i01ki=0β称为长期分布滞后乘子。 类似地,无限分布滞后模型可以写作 462
Y=α+βX+βX+βX+L+ε () t0t1t−12t−2t它不需要确定分布滞后长度,反而数学处理方便一些。如果定义 ββiiω== () iββ∑i则ω表示一种标准化系数,ω=1。于是可以将分布滞后模型改写为 i∑iY=α+βωX+ε () t∑it−it2.通胀滞后 经济理论认为通货膨胀是一种基本的金融现象,因为在持续的经济增长中货币供给量总会超过实际需求。当然,通货膨胀与货币供应量的改变之间的联系不是实时的,总会滞后一个时期。研究显示二者之间大致滞后3-20个季度。 下表摘自Keith (1980)的研究报告:“货币供应对价格的滞后关系”。样本周期自1955年第一季度至1969年第四季度,共60个季度。滞后周期取作20(季度)。滞后方程是 20P=−+mM t∑it−ii=0表 系数值 t值 系数值 t值 920∑ 10mi 方程中M是货币M1B供应量(通货净额+存款货币)改变的百分数,P是物价上涨的百分数。从长期来看,∑=≈1,它是统计显著的(t=>t(20)=),意味着货币供应量每增加1%,价格也相应上涨了1%。从短期看,m=意味着货币供应量每增加1%,0 463
当年物价上涨%。 表是美国五、六十年代的数据,对我们只有参考价值。不过懂得通胀滞后对宏观调控的掌握是很重要的。 3.存款创生 假如央行给银行系统注入1000亿元,那么银行的储蓄总额最终可达多少呢?假如法律要求银行必须留下20%作保证金,那么银行第一次可以贷出800亿元。这800亿元在银行外流通一段时间后,必然又会被存回银行。银行对这800亿元新到的存款除留下20%作保证金外,可将其余的640亿元再贷出去,这贷出去的存款又会被别人存回银行,如此等等,最终,根据著名的乘数法则,银行储蓄总额会达到: 11000⋅=5000(亿元) 1−用滞后模型描述就是: Y=X+βX+βX+βX+L+βX+L tttt−1t−2t−k23k−1 =X+βX+βX+βX+L+βX+L ttttt这里X=1000(亿元),β=。当然这个5000亿不是一夜之间变出来的,它要经过一段时间。 t这几个例子只是经济指标之间滞后关系的一部分代表。为什么会发生滞后呢?当然主要是技术上的原因。生产过程是一环套一环的,只有等上一程序完成,才能进行下一程序。资本、技术、新产品的扩散,都需要时间。除此之外,人们的心理因素与社会习惯势力也起着滞后作用,新事物、新方法、新产品都需要示范使人信服才能普遍被接受。经济制度包括财政税收制度也使滞后现象成为必然。当然这些情况在本书不作细致讨论。 第二节 有限分布滞后模型 一、滞后长度已知时模型的估计 若要估计分布滞后模型 Y=α+βX+L+βX+ε () t0tNt−Nt这里N已知,称作滞后长度,可以使用标准记法 Y=Xβ+ε () 这里 464
Y1XXLXαε⎛⎞⎛⎞⎛⎞⎛⎞110−N+11⎜⎟⎜⎟⎜⎟⎜⎟Y1XXLXβε⎜⎟⎜⎟⎜⎟⎜⎟221−N+202 Y=,X=,β=,ε= () ⎜⎟⎜⎟⎜⎟⎜⎟MLLMM⎜⎟⎜⎟⎜⎟⎜⎟⎜⎟⎜⎟⎜⎟⎜⎟Y1XXLXβεTTT−1T−N⎝⎠⎝⎠⎝N⎠⎝T⎠注意矩阵X里包含前定样本值X,X,L,X,假定这N个观察也是可供利用−N+1−N+202的。如果ε也满足标准假设,即ε~N(0,σI),X被看作固定的,非随机的,那么基于样t−1ˆ本信息Y与X,β的最小二乘估计为β=(X'X)X'Y,它是β的无偏估计。 这样估计在分布滞后模型里存在一些问题。首先,在实际问题中滞后长度N很少已知。(M)(M)如果将某个上界M代替N(M>N),则β的LSE[β=(α,β,β,L,β)]将不是有效01M估计,因为它忽略了限制β=β=L=β=0。这个问题我们放到下段解决。 N+1N+2M第二个问题是X的某些列向量可能线性相关。这是一个典型的线性重合问题。如果分布滞后长度N较短,比如是3或4,那么线性重合问题可能不严重。然而实际问题N=10并不少见,如果X改变量不大,或者移动有规则,就会产生严重的线性重合。线性重合下的LSEt预测精确度很差,如何处理这一问题我们也放到以后解决。 二、分布滞后长度的确定 如果真实滞后长度N未知,但它有上界M,那么如何选择N是一个基本的问题。我们先谈一个简易法则,它称为分布滞后模型的特定估计(Ad Hoc Estimation)。 因为假定X是非随机的,至少是与ε不相关的,X,X等等也是如此,所以可以应ttt−1t−2用普通最小二乘(OLS)。我们可以作一个回归序列: (1)Y对X回归; tt(2)Y对X、X回归; ttt−1(3)Y对X、X、X回归; ttt−1t−2…… 这个过程一直进行到下列情况发生就停止:最后的滞后变量统计不显著;或者最后的滞后变量符号与上一个回归方程相比发生改变。 Alt和Tinbergen将美国1930-1939年石油消费量Y对新订货量X作回归,以季度为滞后 465
单位,采用Ad Hoc方法: ˆY=+ˆY=++-1tˆY=++-1t-2tˆY=+++-1t-2t-3t结果他们认为第二个回归方程是最好的。因为第三、第四个方程里X的系数是不稳定的,t−2此外系数为负对经济现象不好作出解释。于是滞后长度就取1为合适。 这就是Ad Hoc估计与Ad Hoc方法。 下面的统计检验方法思想与上面的差不多,不过顺序正好相反。 因为分布滞后回归变量X,X…有自然顺序,我们就顺其自然建立一系列假设检验: tt−111H:β=0 ↔ H:β≠0 0MaM22H:β=0 ↔ H:β≠0,β=0 0M−1aM−1M33H:β=0 ↔ H:β≠0,β=β=0 0M−2aM−2M−1M…… iiH:β=0 ↔ H:β≠0,β=L=β=0 0M−i+1aM−i+1M−i+2M这里每一个零假设检验都是在上一个零假设被接受的条件下进行的。当某一零假设被拒绝,检验过程就停止。 2假设ε~N(0,σI),则可以用F检验或t检验。下面我们构造统计量。记 α1XXLX⎛⎞⎛⎞10−n+1⎜⎟⎜⎟β1XXLX⎜⎟⎜⎟021−n+2β=,X= () nn⎜⎟⎜⎟MLL⎜⎟⎜⎟⎜⎟⎜⎟β1XXLX⎝n⎠⎝TT−1T−n⎠S2SEnˆˆˆ′σ=,S=(y−Xβ)(y−Xβ) () nSEnnnnnT−n−2'−1'ˆβ=(XX)XY () nnnni则检验第i个零假设H的似然比统计量可写作 0S−SSEM−iSEM−i+1λ= () i2σˆM−i+1 466
12i如果假设H,H,L,H为真,则这个统计量服从自由度为(1,T−M+i−3)的F分布。注000意M−i+3正是滞后长度为M−i+1的模型的参数个数。除了F检验以外,对模型 Y=Xβ+ε () M−i+1M−i+1中的最后系数β的显著性也可以用t检验。 M−i+1如果使用上述假设检验过程,则滞后长度N依赖检验水平,更准确地说是依赖于控制犯第一类错误的概率。所谓第一类错误是指零假设正确而被拒绝的错误。然而,在一系列检验中,i2全部拒绝H的概率并不是恰在第i次检验中单个的显著性水平。例如,当H为真时拒绝它00121i的概率应该是拒绝H或H的概率。如果H,…,H为真,那么统计量λ,L,λ将有相00001i应的F分布,而λ可以被证明与λ,L,λ都独立。应用基本的概率多除少补公式 i1i−1P(AUB)=P(A)+P(B)−P(AB) 可算得第i次检验时犯第一类错误的概率为 p=P{λ>F(1,T−M−3+i)ULUλ>F(1,T−M−2)} iiγi1γ1 =P{λ>F(1,T−M−3+i)}+ iγiP{λ>F(1,T−M−4+i)ULUλ>F(1,T−M−2)} i−1γ(i−1)1γ1−P{λ>F(1,T−M−3+i)} iγi⋅P{λ>F(1,T−M−4+i)ULUλ>F(1,T−M−2)} i−1γ(i−1)1γ1=γ+p−γp=γ(1−p)+p, i=1,2,L ii−1ii−1ii−1i−11i这里γ是第i次个别检验的显著性水平,p=0。全部概率是在H,…,H为真的条件下i000计算的,如果我们对每一个别检验使用同样的显著性水平,那么犯第一类错误的概率将会迅速增加。例如,如果对所有k取 γ= k则 p=,p=,p= 123等等。实际上,如果最大的滞后长度M很大,那么合适的检验策略应该是在开始检验时取很小的显著性水平。也就是说,犯第一类错误的概率应该被控制在一个合理的水平,即使滞后长度相当大的话。 467
算例有限分布滞后模型 原始数据共100个观察,自变量为1元,如下表。 表 序号 Y X 序号Y X 序号Y X 1 .0739 35 .2019 69 .5696 2 .8967 36 .9423 70 .8735 3 .0203 37 .8388 71 .7562 4 .0684 38 .9368 72 .5636 5 .9262 .3585 39 .3213 73 .7279 .1533 6 .5556 40 .6748 74 .7639 7 .7245 41 .1058 75 .7889 8 .4150 42 .6750 76 .4991 9 .0888 43 .6057 77 .1758 10 .9597 44 .4230 78 .4498 11 .3268 45 .2905 .0128 79 .5261 12 .0713 46 .8379 .7789 80 .0359 13 .8506 47 .9048 .2617 81 .7595 14 .9018 48 .9705 82 .5914 15 .7672 49 .8766 83 .9440 16 .8805 50 .5075 84 .9434 17 .6952 51 .3002 85 .3479 18 .7644 52 .7831 .6348 86 .8374 19 .4866 53 .4658 87 .1989 20 .7839 54 .9515 .4570 88 .5806 21 .3054 55 .7689 89 .9075 22 .4768 56 .6632 .2040 90 .6540 23 .3383 57 .3977 .0567 91 .7434 24 .6053 58 .8021 92 .6939 25 .9940 59 .2238 93 .3734 26 .3538 60 .6952 94 .9524 27 .8473 .4566 61 .7836 95 .3808 28 .0036 62 .9079 96 .4961 29 .8622 63 .8137 97 .9264 30 .3924 64 .3535 98 .8940 31 .4099 65 .0211 99 .4167 32 .7080 66 .9352 .0838 33 .5868 67 .8799 34 .9590 68 .7671 .3099 依据书中第10章第 2 节, 用Ad Hoc方法, 确定分布滞后长度, 同时计算回归模型。下面 468
是计算机输出的主要结果。 数据文件准备, 第一列是因变量 Y, 第二列是自变量 X, 滞后过程由程序自动完成。 例. 数据文件中, n=100, M=1 现在进行第 1 次回归, Y 对 X(t), 样本数 N=n 回归方程 Y = .7366 + X1 残差平方和: 回归平方和: 方差的估计 : .8650 标准差 = .9301 回归方程整体显著性F检验, H0:b0=b1=0 F统计量: F临界值F(1, 98) 全相关系数 R : .6264 现在进行第 2 次回归, Y 对 X(t), X(t-1), 样本数 N=n- 1 要作滞后回归, 需要决定自变量是往前移动还是往后移动。第 1 列是 X(1) 到 X(N), 第 2 列是 X(2) 到 X(N+1), 第 3 列是X(3) 到 X(N+2), 等等, 称往前移动。第 1 列是 X(1) 到 X(N), 第 2 列是 X(0) 到 X(N-1), 第 3 列是X(-1) 到 X(N-2), 等等, 称往后移动。 选择移动参数为 1 ( 1=往前移动, -1=往后移动 ),来自过程控制参数集 回归方程 Y = .7094 + X1 + X2 残差平方和: 回归平方和: 方差的估计 : .8586 标准差 = .9266 回归方程整体显著性F检验, H0:b0=b1=...=b2=0 F统计量: F临界值F(2, 96) 全相关系数 R : .6348 计算结束。 下面是第1次回归的拟合效果图,其全相关系数是。第2次滞后回归的全相关系数是,拟合效果应该还有所改进。 图 三、有限多项式滞后 为了消除线性重合的影响,Almon(1965)提出利用多项式来减少参数空间。对于有限个点,比如说n+1个,可以用一个不超过n次的多项式来通过这些点。如果降低多项式的阶数,保持曲线平滑,那么这个低阶多项式可以近似通过这些点。 469
为了说明Almon的多项式滞后方法,我们假定有4个滞后权系数β、β、β、β。有0123一个多项式 23P(n)=α+nα+nα+nα () 0123使得 2323β=α+0⋅α+0⋅α+0⋅α, β=α+1⋅α+1⋅α+1⋅α 00123101232323β=α+2⋅α+2⋅α+2⋅α, β=α+3⋅α+3⋅α+3⋅α 2012330123如果用矩阵形式记法就是 βα⎛⎞1000⎛⎞⎛⎞00⎜⎟⎜⎟⎜⎟β1111α⎜⎟⎜⎟⎜⎟11= () ⎜⎟⎜⎟⎜⎟β1248α22⎜⎟⎜⎟⎜⎟⎜⎟⎜⎟⎜⎟β13927α⎝3⎝⎠⎠⎝3⎠或 β=Wα () 这里β、W、α定义已很明显。此时多项式系数的数目等于滞后权系数的数目,没有什么约束关系强加于β。对于任何向量β,存在向量α,使β=Wα成立。因为W非奇异,故i−1α=Wβ。 要使多项式的阶数减1,可使α=0,即 3β⎛⎞100⎛⎞0⎜⎟⎜⎟α⎛⎞0⎜⎟β111⎜⎟⎜⎟1=α () ⎜⎟1⎜⎟⎜⎟β1242⎜⎟⎜⎟⎜⎟α⎝2⎠⎜⎟⎜⎟β139⎝3⎝⎠⎠类似地,要使多项式阶数再减1,可取 β⎛⎞10⎛⎞0⎜⎟⎜⎟β11α⎛⎞⎜⎟⎜⎟10=⎜⎟ () ⎜⎟⎜⎟⎜⎟β12α2⎝1⎠⎜⎟⎜⎟⎜⎟⎜⎟β133⎝⎠⎝⎠一般地,如果滞后权系数β,β,β,…β下降到Q阶多项式,即 012NQβ=P(i)=α+αi+L+αi,i=0,1,L,N () i01Q则方程组可写为 470
100L0⎛⎞αβ⎜⎟⎛⎞⎛⎞00⎜⎟⎜⎟111L1⎜⎟αβ⎜⎟⎜⎟112Q⎜⎟=122L2 () ⎜⎟⎜⎟⎜⎟MM⎜⎟⎜⎟MMMOM⎜⎟⎜⎟⎜⎟αβQ⎝N⎠⎜Q⎟2⎝⎠1NNLN⎝⎠或写成 (Q)β=Hα () Q(Q)因为α仅含Q+1个系数,我们已将参数空间从N+1维减至Q+1维。换句话说,我们已经对参数作了N−Q个约束。 将上式代入滞后模型 Y=Xβ+ε () 中,得 (Q)(Q)Y=XHα+ε=Zα+ε Q() (Q)这里Z=XH。使用这个模型,α的最小二乘估计是 Q(Q)−1ˆα=(Z'Z)Z'Y () 而β的限制最小二乘(Restricted Least Squares,RLS)估计是 (Q)−1ˆβ=Hˆα=H(Z'Z)Z'Y () QQ2因此,如果我们假定模型被正确的指定,ε~N(0,σI),则 (Q)(Q)2−1ˆα~N(α,σ(Z'Z)) () (Q)(Q)(Q)ˆ因为ˆˆE(β)=E(Hα)=HE(α)=Hα=β。进一步有 QQQ(Q)(Q)(Q)(Q)ˆˆˆˆE[(β−β)(β−β)']=E[(Hα−Hα)(Hα−Hα)'] QQQQ(Q)(Q)(Q)(Q)'ˆˆ =HE[(α−α)(α−α)']H QQ2−1' =σH(Z'Z)H () QQ因此 471
2−1'ˆβ~N(β,σH(Z'Z)H) () QQ如果我们知道了实际多项式阶数Q或者实际滞后长度N,那么多项式估计是直观的。比较困难的是当Q未知时如何估计它。下面我们来讨论多项式阶数的估计。 要确定多项式阶数Q,就要选择向量α的维数。对于固定的已知的滞后长度N,我们也来构造一个序列检验过程来确定Q。开始时可令Q=N,然后将多项式阶数逐步减少,并对参数约束作似然比检验或t检验。待检验的零假设是 1H:Q=N−1 021H:Q=N−2,在H被接受的条件下 00312H:Q=N−3,在H,H被接受的条件下 000…… i1i−1H:Q=N−i,在H,…,H被接受的条件下 000而合适的检验统计量是 S−SSEN,N−1SEN,N−i+1λ= () i2σN,N−i+1这里 (Q)(Q)ˆˆS=(Y−Zα)'(Y−Zα) () SEN,Q是误差平方和,而残差估计为 SSEN,Q2ˆα= () N,QT−Q−11i如果原假设H,…,H为真,则统计量λ服从自由度为(1,T−N+i−2)的F分布。 00i应该说,关于多项式滞后模型的目的、方法、检验等基本上是清楚了。实际应用可能还会产生一些新的问题,比如自相关、异方差、犯第一类错误概率控制等。这些需要结合以前的知识处理。 算例 有限多项式滞后回归 原始数据表如下: 表 472
Y X Y X Y X Y X 1 .0739 6 16 .8805 2 .8967 7 17 .6952 3 .0203 8 18 .7644 4 .0684 9 19 .4866 5 .9262 .3585 10 20 .7839 本项程序依据书中第10章第2节第3段, 用降低多项式次数的方法, 降低参数空间维数, 减少线性重合的可能性, 确定分布滞后长度, 同时计算好回归模型。本项计算最好与例配合进行。 本项计算先要指定滞后长度 k(书中记为 N), 然后要指定多项式阶数 Q, Q<k, 从而既能保证滞后长度, 又能降低参数个数。下面是计算机输出的主要计算结果。 数据文件准备是一元的, 第一列是因变量 Y, 第二列是自变量 X, 滞后过程由程序自动完成。例 数据文件中, n=20, M=1 滞后回归次数 k = 4 (书中为 N), 即Y对X(t), X(t-1),...,X(t-k) 回归。(K<10) 多项式滞后回归的多项式阶数 Q (Q<k) = 3 决定自变量是往前移动还是往后移动代码 1,( 1=往前移动, -1=往后移动 ) 回归方程 Y= .8270 + X1 + X2 + .2810 X3 残差平方和: 回归平方和: 方差的估计 : .7458 标准差 = .8636 回归方程整体显著性F检验, H0:b0=b1=...=b3=0 F统计量: F临界值F(3, 14) 全相关系数 R : .5980 打印多项式回归系数变换矩阵 H: Q .0 .0 回归方程 Y = + .1214 X1 + .0396 X2 残差平方和: 回归平方和: 方差的估计 : 标准差 = 回归方程整体显著性F检验, H0:b0=b1=...=b2=0 F统计量: F临界值F(2, 15) 全相关系数 R : .3472 计算结束。 下图显示的是多项式滞后回归拟合图像,可见有限多项式滞后不一定拟合效果很好。 473
图 第三节 无限分布滞后模型 无限分布滞后模型的一般形式为 Y=α+βX+βX+βX+L+ε t0t1t−12t−2t经过有限项滞后以后将无限分布滞后关系截断是合理的,但是这需要确定截断点。滞后权参数化问题,无限长度滞后问题,都需要从理论上加以考虑。这一节我们先讨论两个具体的动态经济模型,将它们化成无限滞后的几何滞后模型,再使用Koyck变换化成有限的一阶自回归模型,最后讨论它们的估计问题。 一、自适应期望模型与部分调整模型 我们先看自适应期望模型(Adaptive Expectations Model)。 *假定商品供应量Y与市场期望价格X有关,关系模型如下 *Y=α+αX+ε () t01tt这里α、α是常数,ε是随机变量。进一步假定期望价格是与前一时段期望价格与实际价01t格之差有关系,准确表示是 ***X−X=λ(X−X) () tt−1t−1t−1这里0<λ<1,X是第t−1时段的实际价格。这个情况在商品生产时间较长时是会发生的,t−1尤其是农业产品往往如此。 *为了将本段原始模型()中不可观测的X替换成可观测的变量,我们从上式中解出 474
X: t−1**λX=X−(1−λ)X () t−1tt−1引进滞后操作数L,定义作 **LX=X () tt−1则 *λX=[1−(1−λ)L]X () t−1t由于操作数[1−(1−λ)L]的逆操作数为 −12233[1−(1−λ)L]=1+(1−λ)L+(1−λ)L+(1−λ)L+L () 所以 *−1X=[1−(1−λ)L]λX tt−122=[1+(1−λ)L+(1−λ)L+L]λX t−12=λX+λ(1−λ)X+λ(1−λ)X+L () t−1t−2t−3这样自适应期望模型就成了无限分布滞后模型 2Y=α+αλ[X+(1−λ)X+(1−λ)X+L]+ε () t01t−1t−2t−3t这样的模型也称作几何滞后模型。自适应期望模型也可以转化为一阶自回归模型,我们放到下一段谈。 我们再看部分调整模型(Partial Adjustment Model)。 部分调整模型也导致无限分布滞后模型。模型的基本思想是,独立变量X的当前价值决定独立变量Y的期望价值。 *Y=α+αX+ε () t01tt而期望价值与实际值之差将对价值的增减进行部分调整: *Y−Y=γ(Y−Y) () tt−1tt−1这里0<γ<1,γ称作调整系数。例如,一个公司期望的投资可能取决于对它产品的需求。因为客观条件限制和主观考虑,最好逐步进行调整。将上面两个式子结合起来就得到一阶自回归模型: 475
Y=αγ+αγX+(1−γ)Y+γε () t01tt−1t引进滞后操作数与逆操作数,就是 αγγ1Y=α+X+ε t0tt1−(1−γ)L1−(1−γ)L2* =α+αγX+αγ(1−γ)X+αγ(1−γ)X+L+ε () 01t1t−11t−2t*我们再一次得到几何滞后模型,不过ε构造复杂。 *我们再对部分调整关系式Y−Y=γ(Y−Y)作一些解释。将Y理解为股本,tt−1tt−1Y−Y 反映股本的变化,它来自于投资。投资多少呢?不要指望一口吃个胖子,办事留有余tt−1地,这些名训很好地体现在部分调整关系式中: *I=Y−Y=γ(Y−Y) () ttt−1tt−1**我们在时刻t期望有Y那么多,可实际只有Y那么多,差距是Y−Y。但我们并不一下tt−1tt−1*子投资(I)整个差距,而在t时刻只补足差距的一部分(γ(Y−Y))。其余的到下一时段再ttt−1*看,那时Y也许会变,Y当然已经变了。就这样走一步,看一步,调一步,慢慢向好的目tt−1标调整。 最后我们看这两个模型的结合。 我们考虑下面的模型 **Y=β+βX+ε () t01tt**这个Y是期望的股本,X是期望的产出水平。困难在于模型中因变量与自变量都是不可观tt测的期望值,我们要设法将它们都转化为可观测的变量。我们可以使用自适应期望模型中的关系 *−1X=[1−(1−λ)L]λX () tt−1和部分调整模型中的关系 11−γ*Y=Y−Y () ttt−1γγ都代入到()中得 −1Y=βγ+(1−γ)Y+γβλ[1−(1−λ)L]X+γε t0t−11t−1t 476
2=βγ+(1−γ)Y+γβλ[X+(1−λ)X+(1−λ)X+L]+γε () 0t−11t−1t−2t−3t这样模型中已没有不可观察的变量。但是这个模型形式未必令人满意。我们可以把它化为都仅仅对X滞后的无限滞后模型,或者把它化为都对Y作一阶自回归的模型。这一点我们在下段继续讨论。 二、几何滞后模型的Koyck变换及估计 无限分布滞后的回归模型直接计算存在困难,解决办法要么适当截断变为有限分布滞后回归,要么使用Koyck变换将它化为一阶自回归。这样还有统计上的优点,参数减少,线性重合的可能性减少。 考虑一般的几何滞后回归模型 2Y=α+βX+βλX+βλX+L+ε () t0t0t−10t−2tKoyck的想法是先将它滞后一个时段: 2Y=α+βX+βλX+βλX+L+ε () t−10t−10t−20t−3t−1将后一式两边同乘以λ,再与前一式相减得 Y−λY=α(1−λ)+βX+ε−λε () tt−10ttt−1*令ε=ε−λε,将上式重排得 ttt−1*Y=α(1−λ)+βX+λY+ε () t0tt−1t这就成了一阶自回归模型,它不大可能产生自变量的线性重合问题,但会产生Y的自相关问题,需要应用第三章讲过的办法处理。 下面我们将上段自适应期望模型作Koyck变换。对自适应的基本关系式()***X−X=λ(X−X)解得 tt−1t−1t−1**X=λX+(1−λ)X () tt−1t−1代入原模型得 *Y=α+αλX+α(1−λ)X+ε () t01t−11t−1t将原模型滞后一个时段得 *Y=α+αX+ε () t−101t−1t−1 477
解出 1εα*t−10X=Y−− () t−1t−1ααα111代入()得: Y=α+αλX+(1−λ)Y−α(1−λ)−(1−λ)ε+ε t01t−1t−10t−1t* =αλ+αλX+(1−λ)Y−ε () 01t−1t−1t*这里ε=ε−(1−λ)ε。这就是自适应期望模型的一阶自回归形式。 ttt−1我们再将自适应期望与部分调整的结合模型()化成一阶自回归模型。将()1αε*0t与()的提前一个时段形式X=Y−−都代入()得: ttααα111⎛⎞11−γ1αε0t⎜⎟Y−Y=β+βY−−+ε () tt−101tt⎜⎟γγααα⎝111⎠整理成: ⎡⎤⎛⎞αγβα1−γβ1101⎜⎟Y=β−+Y+1−ε ⎢⎥t0t−1t⎜⎟α−γβαγα111⎝1⎠⎣⎦ =C+CY+Cε () 01t−12t虽然这种形式对Y是线性的,但对原始参数就不是线性的。 下面我们对几何滞后模型的一阶自回归形式 Y=γ+γX+λY+ε () t01tt−1t2作出参数估计。如果误差ε满足标准条件即ε=(ε,L,ε)~N(0,σI),则可以对参数t2T′γ=(γ,γ,λ)作出最小二乘估计。然而,由于X是随机的,Y又与Y相关,因此LSE将01tt−1t不是最佳线性无偏估计。形式上: /−1ˆˆˆˆγ=(γ,γ,λ)=(X'X)X'Y () 01这里 Y1XY⎛⎞⎛⎞221⎜⎟⎜⎟Y1XY⎜⎟⎜⎟332Y=,X= () ⎜⎟⎜⎟MMMM⎜⎟⎜⎟⎜⎟⎜⎟Y1XY⎝T⎠⎝TT−1⎠ 478
不过,这个LSEˆγ是一致性估计。这可以证明如下。 −1因为ˆY=Xγ+ε,所以γ=γ+(X'X)X'ε,于是 −1X'XX'ε⎛⎞−1ˆplimγ=γ+plim[(X'X)X'ε]=γ+plimplim () ⎜⎟TT⎝⎠假定plim(X'X/T)非奇异。下面分析第二因子: T⎛⎞1⎜⎟ε∑t⎜T⎟t=2⎜⎟TX'ε1⎜⎟=Xε () ∑tt⎜⎟TTt=2⎜⎟T⎜⎟1⎜Yε⎟∑t−1t⎜⎟T⎝t=2⎠分别考虑这三个分量的极限。第一个,由于E(ε)=0,故 tT1plimε=0 () ∑tTt=2第二个,由于假定X与ε独立,故也有 ttT1plimXε=0 () ∑ttTt=2T第三个,由于Yε/T是E(Yε)的一致估计,如果假定Y与ε不相关,则也有 ∑t−1tt−1tt−1tt=2T1plimYε=0 () ∑t−1tTt=2因此plim(X'ε/T)=0,即ˆplimγ=γ+0=γ,故ˆγ是γ的一致性估计。当然如果这些假定不满足,那就不是一致性估计了。但这时我们可以使用下面的工具变量法。 算例 几何滞后模型与Koyck变换 按本节思想针对一般的自适应期望模型与部分调整模型编制了计算程序,数据例子如下。表 No. Y X No Y X NoY X No Y X 479
1 .0739 26 76 .4991 2 .8967 27 .8473 .4566 .6348 77 .1758 3 .0203 28 78 .4498 4 .0684 29 .4570 79 .5261 5 .9262 .3585 30 80 .0359 6 .5556 31 .2040 81 .7595 7 .7245 32 .0567 82 .5914 8 .4150 33 83 .9440 9 .0888 34 84 .9434 10 .9597 35 85 .3479 11 .3268 36 86 .8374 12 .0713 37 87 .1989 13 .8506 38 88 .5806 14 .9018 39 89 .9075 15 .7672 40 90 .6540 16 .8805 41 91 .7434 17 .6952 42 92 .6939 18 .7644 43 .3099 93 .3734 19 .4866 44 94 .9524 20 .7839 45 .2905 .0128 95 .3808 21 .3054 46 .8379 .7789 96 .4961 22 .4768 47 .9048 .2617 97 .9264 23 .3383 48 .1533 98 .8940 24 .6053 49 99 .4167 25 .9940 50 100 .0838 本项程序依据书中第10章第3节第2段。这一段介绍了 3 个经济回归模型, 它们是: 自适应期望模型: Y(t)=a0+a1 X*(t)+ε(t) X*(t)-X*(t-1)=λ(X(t-1)-X*(t-1)) 部分调整模型: Y*(t)=a0+a1X(t)+ε(t) Y(t)-Y(t-1)=γ(Y*(t)-Y(t-1)) 上述二者的结合模型: Y*(t)=b0+b1 X*(t)+ε(t) 这里带上标的都是预期价格或价值。上述模型经过引进滞后操作数, 可以化为无限滞后模型, 再经过Koyck变换, 可以化为一阶自回归形式(): Y(t)=γ+γ X(t)+λY(t-1)+ε(t) 01数据文件准备, 第一列是因变量 Y, 第二列是自变量 X, 滞后过程由程序自动完成。下面是计算机输出的结果。 例10.3.2 数据文件中, n=100, M=1 480
回归方程 Y = .6976 + X1 + .0360 X2 残差平方和: 回归平方和: 方差的估计 : .8609 标准差 = .9278 回归方程整体显著性F检验, H0:b0=b1=...=b2=0 F统计量: F临界值F(2, 96) 全相关系数 R : .6155 计算结束。 图 三、工具变量法与极大似然估计 上段研究ˆγ估计一致性问题,要求X与ε独立,Y与ε不相关。这些条件有时不一定ttt−1t能满足。如果ε与ε相关,那么由于 tt−1Y=γ+γX+λY+ε () t−101t−1t−2t−1也会连带出ε与Y相关。所以我们最好是要研究解决一般情况下的一致性问题。工具变量tt−1估计能够是一致性估计,虽然不一定是有效估计。 我们现在考虑的模型是 Y=Xγ+ε () 这里Y,X,γ,ε的定义如上段()与()所示。所谓工具变量法是要构造一组工具变量Z。在本例中工具变量Z取如下具体形式: 1XX⎛⎞21⎜⎟1XX⎜⎟32Z= () ⎜⎟LL⎜⎟⎜⎟1XX⎝TT−1⎠一般工具变量应该满足如下两个条件: 481
−1(1)Z与X相关,并且plimTZ'X=Σ存在且非奇异。 ZX−1(2)Z与ε不相关,并且plimTZ'ε=0。由于Y依赖于X,这两个变量是相关t−1t−1的。而X是假定与误差ε不相关的,因此上述()具体构造的Z满足工具变量的两t−1个要求。 将工具变量Z的转置左乘()得: Z'Y=Z'Xγ+Z'ε () 再除以T,取概率极限: 111⎛⎞⎛⎞⎛⎞plimZ'Y=plimZ'Xγ+plimZ'ε () ⎜⎟⎜⎟⎜⎟TTT⎝⎠⎝⎠⎝⎠由假设工具变量应满足的条件得: Σ=Σγ () ZYZX假设还有Σ非奇异,于是 ZX−1γ=ΣΣ () ZXZY再以样本矩代替总体矩,得工具变量(IV)估计: −1ˆγ=(Z'X)Z'Y () IV下面我们证明工具变量估计是一致性估计: −1ˆplimγ=plim[(Z'X)Z'(Xγ+ε)] IV−1 =plim[γ+(Z'X)Z'ε] −111⎛⎞⎛⎞ =γ+plimZ'XplimZ'ε ⎜⎟⎜⎟TT⎝⎠⎝⎠−1 =γ+∑⋅0=γ ZX() 可见一致性的证明是简单的。还可以证明ˆγ的渐近分布为正态。如果 IV1d2Z'ε⎯⎯→N(0,σΣ) () ZZT1这里Τ=plimZ'Z,则有 ZZT 482
d2−1−1ˆT(γ−γ)⎯⎯→N(0,σΣΣΣ) () IVZXZZXZ111并且可以用样本矩Z'X,Z'Z,X'Z分别去代替总体矩Σ、Σ、Σ,作出渐近方ZXZZXZTTT差的估计,这个估计也是相合的。由于这个方差依赖于工具变量的选择,所以它未必是有效的。Dhrymes(1974)还证明了,工具变量Z与随机自变量X相关性越高,渐近方差矩阵就越“小”。 下面我们看几何滞后模型的极大似然估计。 工具变量法不需要关于误差项ε的具体分布假定。如果这样的分布存在的话,那么丢掉t这些信息是很可惜的。我们可以使用这些信息来改进它的渐近有效性。我们考虑的模型是 2Y=α+γX+γλX+γλX+L+ε () t01t1t−11t−2t2误差项ε=(ε,L,ε)'~N(0,σI)。我们来构造参数的极大似然估计。 1T将上式写成有限项形式: t−1tY=α+γX+γλX+L+γλX+ηλ+ε () t01t1t−111t其中余项系数η为 2η=γ(X+λX+λX+L) () 10−1−2因为η与t无关,在模型中可以作为进一步的信息。在ε是独立同分布假定下,极大似然估计t是将下式极大化: T2S(α,γ,λ,η)=ε 01∑tt=1Tt−1t2 =[Y−(α+γX+γλX+L+γλX+ηλ)] () ∑t0111t−111t=1由于几何滞后模型()关于参数λ是非线性的,要计算S(α,γ,λ,η)的极小化需要使01用数学规划的方法。当然,对任何固定的λ,模型关于其它参数是线性的。利用这一点可以帮助我们简化计算。对于给定λ,将模型写为 Y=α+γZ(λ)+ηZ(λ)+ε () t01t1t2t这里 t−1itZ=λX, Z=λ () t1∑t−it2i=0 483
采用矩阵记号就是 Y=Z(λ)β+ε () 这里 Y1Z(λ)Z(λ)ε⎛⎞⎛⎞⎛⎞111121⎜⎟⎜⎟α⎜⎟⎛⎞0⎜⎟Y1Z(λ)Z(λ)ε⎜⎟⎜⎟⎜⎟221222Y=,Z(λ)=,β=γ,ε= () ⎜⎟1⎜⎟⎜⎟⎜⎟MKLM⎜⎟⎜⎟⎜⎟⎜⎟η⎝⎠⎜⎟⎜⎟⎜⎟Y1Z(λ)Z(λ)ε⎝T⎠⎝T1T2⎠⎝T⎠则对任何固定的λ,β的估计是 −1ˆβ(λ)=[Z(λ)'Z(λ)]Z(λ)'Y () 于是,为了找到λ的最小二乘估计,只需要对一个参数λ作极小化: T2ˆˆS(λ)=ε=[Y−Z(λ)β(λ)]'[Y−Z(λ)β(λ)] ∑tt=1−1−1 ={Y−Z(λ)[Z(λ)'Z(λ)]Z(λ)'Y}'{Y−Z(λ)[Z(λ)'Z(λ)]Z(λ)'Y} −1 =Y'{I−Z(λ)[Z(λ)'Z(λ)]Z(λ)'}Y () 4这比对4个参数作极小化无论如何要简便得多,大约可以节省计算量n−n倍,如果是采用ˆ格点搜索而每个参数搜索n等分的话。对S(λ)作极小化计算出λ以后,取其余三个参数的极大似然估计为 ˆα⎛⎞0⎜⎟−1ˆˆˆˆˆˆˆγ=β=β(λ)=[Z(λ)'Z(λ)]Z(λ)'Y () ⎜⎟1⎜⎟ˆη⎝⎠ 注意η的极大似然估计并不是一致性估计,随着样本容量T增加,η并没有一致性趋势。但是这并不影响其余三个参数α,γ,λ估计的一致性、渐近有效性。 01 当然,在经济分析实际过程中,关于误差ε的独立性假设是不太切合实际的。动态模型t中通常没有充足理由可以假定误差的独立性。这个时候需要参考自回归误差的分析方法。 我们已经看到,分布滞后回归模型与一阶自回归模型有着密切联系,而一阶自回归基本上属于时间序列分析的内容,我们在后面第十三章继续深入研究。 算例 工具变量法 原始数据如下: 484
Y X Y X Y X Y X 下面是计算机输出的结果。 第 1 步:滞后时段 k, 即一个变量从 X(k+1) 到 X(n), 一个变量从 X(1) 到 X(n-k)。 例数据文件中, n=40, M=1, 共有 2 列 打印几何滞后模型的一阶自回归形式的计算结果: 样本总数 39 自变量个数 2 回归方程 Y = + X1 + X2 残差平方和: 回归平方和: 误差方差的估计 : 标准差 = 回归方程整体显著性F检验, H0:b0=b1=...=b2=0 F统计量: F临界值F(2,37) 全相关系数 R : 再引进工具变量进行计算。 滞后时段 k = 1, 来自过程控制参数第一步。 即一个变量从 X(k+1) 到 X(n), 一个变量从 X(1) 到 X(n-k)。 打印工具变量回归的因变量: 打印工具变量回归的自变量: 打印工具变量回归计算有关结果: 打印矩阵 ZX 的逆矩阵: 打印工具变量法回归系数: 回归平方和: 残差平方和: 误差方差估计: 全相关系数: 工具变量回归结束. 485
图 486