第五章异方差性yu kaizhi_swufe
yu kaizhi_swufe
yu kaizhi_swufe
引子:更为接近真实的结论是什么?根据四川省2000年21个地市州医疗机构数与人口数资料,分析医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。对模型估计的结果如下:Yˆ=−+ kaizhi_swufe()()t =()()R2===式中: Y表示卫生医疗机构数(个)X表示人口数量(万人)。
真的每2000人就需要一个医疗机构吗?●人口数量对应参数的标准误差较小●t 统计量远大于临界值●可决系数和修正的可决系数结果较好●F检验结果明显显著表明该模型的估计效果不错,即可以认为人口数量每增加1万人,平均说来医疗机构将增加个。然而,这里得出的结论可能是不可靠的,平均说来每增加1万人口可能并不需要增加这样多的医疗机构,所得结论并不符合真实情况。有什么充分的理由说明这一回归结果不可靠呢?更为接近真实yu kaizhi_swufe的结论又是什么呢?
第五章异方差性本章将讨论四个问题:●异方差的实质和产生的原因●异方差产生的后果●异方差的检测方法●异方差的补救yu kaizhi_swufe
第一节异方差性的概念一、异方差的实质同方差的含义同方差性:对所有的i (=1,2,...,n)有:V2ar(u)=σi因为方差是度量被解释变量Y的观测值围绕回归线的分散程度,因此同方差性指的是所有观测值的yu kaizhi_swufeE(Y)==b1+b2X2+b3X3+...+bXiiikki分散程度相同。
异方差性模型中的随机扰动项主要代表两方面影响:(1)被模型忽略的其他变量对应变量的影响(2)测量误差的影响实际上随机扰动代表的两方面因素有可能随X的i变化而变化,使随机项的方差也随X的变化而i变化,这种情况称为存在异方差性,表现为Va2r(u)=s(i=1,2,Ln)ii对比同方差时y为u kaizhi_swufeVa2r(u)=s异方差可看成是由于某个i解释变量的变化而引起的,则Va22r(u)=s=sf(X)iii
异方差性的图示概率储蓄Y分布密度yu kaizhi_swufe收入X
二、产生异方差性的原因●从模型中略去的变量随列入模型的解释变量X的变i化,也呈现规律性的变化,导致u随X而变化ii●模型设定不恰当产生的异方差。如果一些重要变量被忽略,或把非线性模型设为线性,可能导致异方差●统计测量误差导致的异方差测量误差可能随解释变量X的增大而增大●截面数据中总体各单位的差异一般说异方差性在截面数据中比在时间序列数据中更常出现(原因:同一时点不同对象的差异一般yu kaizhi_swufe大于同一对象不同时间的差异)注意:在经济结构发生较大变化时,时间序列也常存在异方差
第二节异方差性的后果存在异方差时,OLS估计仍然是无偏估计,但是一、OLS估计式不再具有最小方差特性(不同方法)OLS估计式的方差不一定是最小的,即OLS估计式虽然无偏,但不一定是最佳的(存在异方差时,可证明能够找到比OLS 的方差更小的估计方法)二、解释变量的显著性z检hi_swufe验失效(同一方法)1、参数方差的确定有困难可证明异方差时2 kai∑s2xVarb*=ii(ˆ2)∑22(证明见下页)(x)未知,也yuis2不能再用∑22i(e)(n−2)=sˆ去估计, i(s2i不再是常数),Var(bˆ*无法确定。2)
2、如果仍然用不存在异方差性时的OLS方式估计其方差,即用Va22r(ˆb2)=s∑xi所估计的方差,会低估存在异方差时的的真实方差。后果:低估Var(ˆb,也就2)yu kaizhi_swufe会高估t 统计量,从而夸大所估计参数的统计显著性。
三、预测精度降低,区间预测面临困难尽管参数的OLS估计量仍然无偏,并且基于此的预测也是无偏的,但是●由于异方差的存在,bˆk的方差增大,Y预测值的精确度将会下降●由于s2难以确定,Y的方差也难以确定,Y置信i区间的确定会出现困难●在sˆ2=∑2en−kiu kaizhi_swufe是s2无偏估计的证明中用到了ui的同方差性假定,由于存在异方差性,使得sˆ2=∑y2en−k是有偏的,在此基础上的区间估i计和假设检验都将不可靠。
第三节异方差性的检验一、图形分析法基本思想:异方差性的表现是ui的方差随某个解释变量的变化而变化,或Y的分散程度随X的变化而变化。因此可利用u的代表e与某解释变量的散布图,观察是否存在异ii方差及其异方差的形式,或从Y的分散程度与X的关系观测是否存在异方差。具体方法:假定不存在异方 kaizhi_swufe差,进行回归,并计算剩余平方2ei描绘2e与Xy的u散点图或Y与X的散点图,作出近似判ii断。
1.残差图形分析设一元线性回归模型为:Y=β+βX+ui12ii运用OLS法估计,得样本回归模型为:Yˆ=βˆ1+βˆ2Xii由上两式得残差:e=Y-Yˆiii绘制出2e对X的散点图ii◆如果2e不随X而变化,则表明不存在异方差;ii◆如果2e随Xi而变化,则表明存在yu kaizhi_swufe异方差。i
通过Eviews作x-e2 散点图1、键入LS y c x 作回归(点击resid)2、键入genre1=resid调用残差3、键入genre2=e1^2 生成残差平方4、键入Scat X e2 (或键入Scat X e1)i_swufe或1、点击Quick / Graph,键入x e2 2、点击Line Grapizhh,在出现的下拉菜单中3、选Scatter Diagram (散点图) / okyu k
22ee•••••••••••••••(a)X(d)(b)X22eeizhi_swufe••••••••••••••••••••yu ka•X(c)(d)X
2.相关图分析Y与X之间图形举例:分析Y与X的相关图形,也可以初略地看到Y的离散程度与X之间是否有相关关系。用1998年四川省各地市州农村居民家庭消费支出与家庭纯收入的数据,绘制出消费支出对纯收入的散点图,其中用Y1表示农村家庭消费支出,X1表示家庭纯收入。yu kaizhi_swufe
二、Goldfeld-Quandt检验(GQ检验)作用:检验递增性(或递减性)异方差。基本思想:●将观测值按X的大小顺序排列Yii●去掉中间位置的一部分观测值,从而把观测值分为前后两部分(目的是提高分辨性)●将前后两部分分别作回归,分别计算出各部分剩余e,C个i●比较两个回归的剩余平方和∑2e:Xii两个∑2e之比接近于1,为同方差, i两个∑2e之比不同于1,为异方差i前提条件:●样本容量较大yu kaizhi_swufe●服从正态分布,并除异方差外服从其他基本假定
具体步骤:●排序:将观测值按解释变量X大小顺序排列●数据分组:去掉中间的C个(约1/4)观测值,分别进行前后两部分(n−c)2个观测值的回归●提出假设:分别进行前后两部分回归的基础上,提出检验假设:H0:ui是同方差(前后两部分方差无显著差异),即H2:=20ss kaizhi_swufeiH1:ui是异方差(方差随X递增或递减)如为递增如为递减yuH:s2≤s2≤≤s211LnH:s2≥21s≥L≥s21n
●构造F统计量:(1)若方差随X递增统计量∑2n−ce2(−k)iF=2∑2n−ce1(−k)i2F服从第一、二自由度均为[(n−c)2]−k的F 分布。●判断:查表得F临界值F(n−c)−(n−c)a[k,−k]22yu kaizhi_swufe◆若F>F(临界值),说明后部分与前部分比值显著大于a1,就拒绝H(同方差),即接受存在异方差性0◆若F<Fa(临界值),说明后部分与前部分比值不显著大于1,就接受H0,认为是同方差性
(2)如果方差随X递减统计量∑2n−ce1(−k)iF=2∑2n−ce2(−k)i2F服从第一、二自由度均为[(n−c)2]−k的F 分布。判断:查表得F临界值F(n−c)−(n−c)a[k,−k]22◆若F>Fa(临界值),说明前部分与后部分比值显著大于1,就拒绝H(同方差) ,即接受存在异方差性0◆若F<Fa(临y界u kaizhi_swufe值),说明前部分与后部分比值不显著大于1,就接受H,认为是同方差性0
Goldfeld-Quandt检验的特点●要求大样本●异方差的表现既可为递增型,也可为递减型●检验结果与选择数据删除的个数c的大小有关●只能判断异方差是否存在,在多个解释变量的情况下,对是哪一个变量引起异方差的判断存在局限。yu kaizhi_swufe
GoldFeld-Quanadt检验的EViews上机实现1) 键入Sort /回车,在对话框中键入X(或Xi中任一个)/ok;2) 键入Sample /回车,在对话框中键入1 n1 /ok(前部分样本区)3) 键入Ls y c x(或Ls y c x1 x2 x3 x4┄)/回车,得残差平方和S2小4)键入Sample /回车,在对话框中键入n1+c+1 n / ok(后部分样本区)5)键入Ls y c x(或Ls y c x1 x2 x3 x4┄)/回车,记住残差平yu kaizhi_swufe方和S2大6)计算F统计量,作出是否拒绝原假设的结论。
三、White检验基本思想:如果存在异方差,其方差s2t与某解释变量有关系。在不知道关于异方差的任何先验信息时,在大样本的情况下,将OLS估计后的残差平方对解释变量的各种形式(如常数、解释变i量z、hi_swufe解释变量的平方及其交叉乘积等)构成一个辅助回归,利用yu ka辅助回归建立相应的检验统计量来判断异方差性。
例如两个解释变量的模型中Y=β+βX+βX+ut122t33tt设s2t与X2和X3的关系为如下辅助回归:s2=a+++a2+a21a2X2a3X34XX+aXX+vtt53t62t3t其中v为随机误差项。t但一般s2未知,可用原模型回归剩余2作为2的testt估计值,进行以上辅助回归。在大样本情况下寻求能确定分布的统计量,判断s2的变化是否与解释t变量有关(当有K个解yu kaizhi_swufe释变量时,可作类似的含两两交互的辅助回归)
检验的基本步骤: (手算)e21.求回归估计式并计算t用OLS法估计原模型,计算残差e=Y-Yˆ,并求残差ttt的平方e2。t2.求辅助函数用残差平方e2作为异方差σ2tt的估计,并建立XX222,X3,,X,XX的辅助回归,即tt2t3t2t3t kaizhi_swufe2+αX+αX+αX2+αX2eˆ=αˆˆˆˆˆˆt122t33t42t53+αXXt62t3t并计算辅助yu回归的R2
3.计算统计量nR2n为样本容量,R2为辅助回归可决系数4.提出假设H0:a2=...=a6=0,H1:a(j=2,,3,...,6)不全为零j在大样本情况下可以证明,在零假设成立下,nR2服从自由度为5的c2分布,即nR2~c2(5)yu kaizhi_swufe
5.检验给定显著性水平a2,查χ分布表得临界值2χa(5),如果nR2>2χa(5), H 不合理,则拒绝原假设H00,即认为模型中随机误差存在异方差。若nR2≤c25(a)则不拒绝H0,即认为模型中随机误差是同方差。yu kaizhi_swufe
White检验的特点●要求为大样本●不仅能够检验异方差的存在性,同时在多变量的情况下,还能判断出是哪一个变量引起的异方差。yu kaizhi_swufe
White检验在EViews上的实现(用现成命令)设Y=b1+b2X2+b3X3+mtttt1)Ls Y C X2 X32)点击View/residual test/White/回车;3)在出现的对话框中,选择no cross terms(没有交叉项)/回车或cross terms(有交叉z项hi_swufe)/回车4)出现输出框(比模型输出框多2行)Test直接给出了相关的 统kai计量(F-statistic和Obs*R-squared)如果统计量的y值unR2很大(大于c2a(K)),相应的p值小于5%,拒绝H(0存在异方差)。
四、ARCH检验什么是ARCH(autoregressiveconditionanlhelecosecdasticity自回归条件异方差)过程?即s2=a+as21+L+as2t01+t−pt−pvtp为ARCH过程的阶数,并且a0>0,a≥0,i=1,2,L,piv为随机误差。t基本思想:●时间序列数据中可认为存在的异方差性为ARCH过程:●因各个s2均未知,用对原模型OLS2ettyu kaizhi_swufe估计的剩余项去近似估计,s2=a+as2+as2−++as201−122L−+vtttptpt●检验ARCH过程是否成立去判断是否存在异方差。
ARCH 检验的基本步骤1. 估计参数并计算et用OLS法估计原模型参数,求出残差et,并计算残差平方序列222e,e...,ett-1,t-p,以分别作为对σ222,σ,...,σtt-1t-p的估计。2.作辅助回归e2=a+ae2++ae2ˆˆˆ01...ˆtt-pt-p计算辅助回归的可决系数R23.提出原假y设u kaizhi_swufeH0:a1=a2=...=ap=0 ;H1:aj不全为零
4.检验计算辅助回归的可决系数R2与n−p的乘积2(n-p)R,在H成立时,基于大样本,2渐进服从2(n-p)Rχ0分布,即n−pR2~c2()p给定显著性水平a,查2分布表得临界值2χχa(p)如果n-p)R2>2(χα(p),则拒绝H0:a1=a2=L=ap=0,说明ARCH过程成立,表明模型存在异方差。如果−pR2<c2(n)yu kaizhi_swufea(p),则不拒绝H0:a1=a2=L=ap=0,说明ARCH过程不成立,表明模型不存在异方差。
具体作法:(手算)●用OLS法估计原模型参数,并计算残差et●计算残差的平方及滞后值2222e,e−1,e−2L,etttt−p●作辅助回归:2=a+a2+a2+La2eˆˆˆ01e−ˆ12e−2+ˆetttpt−p●提出原假设H0:a1=a2=L=a;p =0H1:a至少有一个不为0j可证明大样本时2(n−pR~2)cp给定显著性水平α,查c2分布表得临界值c2p(a)●判断:◆若n−pR2≥2()cHp(a则拒绝)0:a1=a2=L=ap=0说明ARCH过程成立,表明模型存在异方差◆反之,22(n−p)R<c则不拒绝H0:a=a=L=ap=yu kaizhi_swufep(a)120表明不存在异方差
ARCH检验的特点●适于时间序列数据●样本容量较大●只能判断模型中是否存在异方差,而不能诊断出哪一个变量引起的异方差。yu kaizhi_swufe
ARCH 检验在EViews上的实现(用现成命令)1)LS y c x2 x3 L xk /Enter2)点击View/residual test/ ARCH / 回车3)在对话框中输入滞后期P,Lags P (P=1,2,3,或更长)/ 回车4)与White检验相同,ARCH Test直接给出了相关的统计量,原假设是序列无异方差,如果统计量的值很小,相应的p值大于5%,则接受原假设如果统计量的值−2很大(大于c2(np)Ra(P)p5%H0yu kaizhi_swufe),相应的值小于,拒绝(存在异方差)。
五、Glejser检验检验的基本思想用OLS法将应变量Y对解释变量回归得残差e,取eii的绝对值e,然后将e对某个解释变量Xi的各种函数ii形式回归,(用各种函数形式去试,寻找最佳的函数形式),例如e=f(X)+viii若回归系数显著,就说明存在异方差,若回归系数都不显著,就认为是同方差注意:用e的绝对值e而不用实际值,原因是:ii因∑eX=0,无法进行的回归iiyu kaizhi_swufee=f(X)iie方差的大小随X的变动,与eii的符号无直接关系
检验的步骤1.建立模型并求ei根据样本数据建立回归模型,并求残差序列e=Y-Yˆiii2.寻找ei与X的最佳函数形式用残差绝对值e对X进行回归,用各种函数ii形式去试,寻找最佳的函数形式。yu kaizhi_swufe
3.判断根据选择的函数形式作e对的回归,作为iX2ei的替代变量,对所选函数形式回归。用回归所得到的β、t、F等信息判断,若参数β显著不为零,即认为存在异方差性。yu kaizhi_swufe
检验的特点不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式进行诊断。该检验要求变量的观测值为大样本。问题:●│ei│与X回归的函数形式事实上不可能一一i找完。●e=f(X)回归的误差项v本身可能出现均iii值不为0y、u kaizhi_swufe自相关、异方差●一般只可用于大样本的情况
第四节异方差的修正一、对原模型加以变换基本思想:●直接用加权最小二乘法必须确定权数w=1s2ii,可是经常s2是未知的,需对s2作出某种假定ii●异方差性与的变化有关,可假定s2=2Xkf(X)iii2khi_swufe其中的为常数●以f(X)除原模型两边,将模型变换为iYb1Xu=+bi2+if(X)f(Xkaiz)f(X)f(X)ii变换后的模型的扰动项uyu =vif(X是同方差的,因为)u12kVarv=Vari=Varu2()()=i=kiif(X)f(X)f(X)iii
具体作法:对f(X)i的函数形式可作出各种假定, 例如:函数形式var(u)viivar(n)i2f(X)=XkXuX2kiiiii22f(X)=XX2kuX2kiiiii=22f(X)(a1+a2X)22iik(a0+a1X)u(a+aXki01)ii注意:●的函数形式可参考图形分析法或Glejser法去确定●模型变换可能引起变量出现“虚构的”的相关关系●对原模型变换yu kaizhi_swufef(X)i后的拟合优度可能变小,这是对观测值加权的结果
二、加权最小二乘法(WLS)基本思想:●用OLS法估计参数时是使^^min2:∑e=∑Y−b−bX2(ii12)i这里不论2ei的大小是同等对待的(因是同方差)。●在异方差且方差s2已知的情况下,方差越小,其样本值i偏离均值的程度越小,其观Y•测值越应受到重视。即方差•越小,在确定回归线时的作•••••••••用应当越大,反之方差越大,•••••••••其观测值所起的作u用 kaizhi_swufe应当越•••小。yX
所以可以用1s2i作为权数,使得2m∑e1i=∑−*−b*2in:(YbX)s2s2i12iii这样估计的b**1和b2称为加权最小二乘估计式(WLS)yu kaizhi_swufe
具体作法:如果s2已知,令1s2可以证明WLS估计为i=wiiw**yxb*iiib****1=Y−b2X2=∑∑wx*2ii其中:Y*、X*为加权平均数wY*∑wXY*=∑iiX=ii∑w∑wii*、*yxii为与加权平均数的离差*YY*y=−x*=X−X*iiiiyu kaizhi_swufe可以证明,加权最小二乘估计可以消除或减轻异方差的影响。
模型变换与加权最小二乘法的关系例如原模型Y=b1+b2X+uiii如果u为异方差,假定其方差为Var222i(u)=s=kXiii(1)模型变换——原模型变换为Ybui=1+b2+iXXXiii其中随机项uX是同方差的,用OLS法估计参数,其剩余平ii方和为kaizhi_swufe^Yb^1^^∑2e=∑yiu −1−b2(2)=∑(Y−b−bX22)iXXX2i1iiii
(2)加权最小二乘法用u方差的倒数11=作为权数is222kXii其加权回的剩余平方和为∑*2s2(ei)i*2∑ei1=∑−b*−*1=∑Y−b*−b*X2()(YX)()s2s2i1ik2X212iiii对比模型变换的结果^^^∑2∑Ybe=i−112(−)=∑(Y−b−bX)XXX2i1iii2kyu kaizhi_swufe二者的剩余平方和只相差常数,能使其中一个最小时必能使另一个最小。用模型变换后的OLS估计的参数实际与应用加权最小二乘法估计的参数是一致的。(也间接证明了加权最小二乘法可消除异方差)
三、模型的对数变换基本思想:●对数变换可使所测量变量的尺度缩小,从而缩小原变量差异的倍数,如log(10)=1;log(100)=2;LOG(1000)=3●对数变换后模型的剩余ei表示一种相对误差,一般相对误差比绝对误差有较小的数值差异具体作法:原模型为:Y=b1+b2X+uiii变换为lnY=b1+b2lnX+uiii注意:变换后模y型u kaizhi_swufe中参数的意义发生了变化,这时b2是Y对iXi的弹性,即Y相对于X的百分比变化,这与原模型中不同。
第五章案例分析案例1:医疗机构与人口数量的关系一、问题的提出和模型设定为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。(见引子)假定医疗机构数与a人izhi_swufe口数之间满足线性约束,则理论模型设定为:Yy=u kb+bX+ui12ii其中Y表示卫生医疗机构数,Xi表示人口数。i
四川省2000年各地区医疗机构数与人口数地区人口数医疗机构数地区人口数(万人)医疗机构数(万人)X(个)YX(个)Y成都眉山自贡315911宜宾攀枝花103934广安泸州达州德阳雅安绵阳巴中广元资阳遂宁3711375阿坝82yu 内江甘孜乐山凉山南充 4064
二、参数估计进入EViews软件包,确定时间范围;编辑输入数据;选择估计方程菜单,估计样本回归函数如下:hi_swufekaiz估计结果为Yˆ=−+ i()()R2=,F=
三、检验模型的异方差(一)图形法EViews软件操作由路径:Quick/Estimate Equation,进入Equation Specification窗口,键入“y c x”,确认并“ok”,得样本回归估计结果。(1)生成残差平方序列。在得到估计结果后,立即用生成命令建立e2序列,记为e2。生成过程如下,先按路径:Object/Generate Series,进入Generate Series by Equation对话框,即yu kaizhi_swufe
然后,在Generate Series by Equation对话框中(如图),键入“e2=(resid)^2”,则生成序列。e2yu kaizhi_swufe
(2)绘制2e对X的散点图。选择变量名X与e2(注意选tt择变量的顺序,先选的变量将在图形中表示横轴,后选的变量表示纵轴),进入数据列表,再按路径view/graph/scatter,可得散点图,见图。yu kaizhi_swufe
判断:由图可以看出,残差平方2e对解释变量X的散点图主i要分布在图形中的下三角部分,大致看出残差平方2e随X的变动呈增大的趋势,因此,模型很可能存ii在异方差。但是否确实存在异方差还应通过更进一步的检验。yu kaizhi_swufe
(二)Goldfeld-Quanadt检验1、EViews软件操作(1)对变量取值排序(按递增或递减)。在Procs菜单里选Sort Current Page/Sort WorkfileSeries命令,出现排序对话框,键入X,如果以递增型排序,选"Ascenging",如果以递减型排序,则应选"Descending",点ok。本例选递增型排序,这时变量Y与X将以X按递增型排序。(2)构造子样本区间,建izhi_swufe立回归模型。在本例中,样本容量n=21,删除中间1/4的观测值,即大约5个观测值,余下部分平分得两个样本区间:1—8和14—21,它们的样yu ka本个数均是8个,即。n=n=8n1=n2=812
在Sample菜单里,将区间定义为1—8,然后用OLS方法求得如下结果表Ayu kaizhi_swufe
在Sample菜单里,将区间定义为14—21,再用OLS方法求得如下结果表Byu kaizhi_swufe
(3)求F统计量值。基于表中残差平方和的数据,即Sum squared resid的值。由表A算得的残差平方和为∑2e,由表B算得到的残差平方和1=∑,根据Goldfeld-Quanadt检验,F统计量∑2eF=∑==_swufe(4)判断在a=下,式()中分子、分母的自由度均为6,查F分布表得临界值为F0,=(6,6)因为=所以拒绝原假yu >(6,6)=设,表明模型确实存在异方差。
(三)White检验由估计结果,按路径view/residual tests/white heteroskedasticity(no cross terms or cross terms有无交叉项),进入White检验。根据White检验中辅助函数的构造,最后一项为变量的交叉乘积项,因为本例为一元函数,故无交叉乘积项,因此应选no cross terms,则辅助函数为s2=a+ax+a201+t2xvttyu kaizhi_swufe经估计出现White检验结果,见下表5。
从表可以看出,nR2=由White检验知,在a=下,查c2分布表得临界值,c2005(2)=.或分析P值因为nR2=>c20=.05(2) kaizhi_swufe所以拒绝原假设,不拒绝备择假设,表明模型存在异方差。
四、异方差的修正(一)加权最小二乘法(WLS)分别选用权数w1111=,w2=,w=tXtX23tX,ttt生成权数:在Genr/Enter equation中分别键入:w1=1/Xw2=1/X^2w3=1/sqr(X)经估计检验发现用权数w2最好,只给出用权数w的结果。t2t方法:在Estimate equation 中输入"Y C X",点optioyu kaizhi_swufen,在对话框中点weighted LS,在weighte中输入"w2"/ok ,即出现加权最小二乘结果。
表7估计结果:Yˆ=+()()R2=,.=,F= kaizhi_swufe结论:运用加权小二乘法消除了异方差性后,参数的t检验均显著,可决系数大幅提高,F检验也显著,并说明人口数量每增加1万人,平均说来将增加个卫生医疗机构,而不是引子中得出的增加个医疗机构。
案例2:四川省农民消费研究一、问题的提出和模型设定农村居民的收入和消费状况是四川省实现小康的关键,分析改革开放以来农村居民的收入与消费的关系,对于研究四川省农村经济的发展具有重要的现实意义。按照经济学原理,收入是影响消费的重要因素。模型设定为Y=b1+b2X+uttt其中:Yt为农村人均生活费支出;X为农村人均纯收入。tyu kaizhi_swufe
由《中国统计年鉴》取得1978年至2000年四川省农村人均纯收入和人均生活费支出的数据时间农村人均纯农村人均生时间农村人均纯农村人均生收入X活费支出Y收入X活费支出
二、参数估计估计样本回归函数,其结果为Yˆ=+=()()R2=,F=,.= kaizhi_swufe
三、检验模型的异方差(一)图形法(1)生成残差平方序列。方法:点“genr“输入”e2=(resid)^2”。(2)绘制e2对X的散点图。选择X与e2数据表(先选的变量将在图形中表示横轴,后选的变量表示纵轴),按view/graph/scatter,得散点图2、判断。由图e2对X的散点图主要分布在图形的下三角部分,大致看出残差平方随X的变动呈增大的趋势,因此,模型很可能y存u kaizhi_swufe在异方差。但是否确实存在异方差还应通过更进一步的检验。
(二)Goldfeld-Quanadt检验(1)对变量取值排序(原数据已为递增)(2)构造子样本区间,建立回归模型样本容量n=23,删除中间1/4的5个观测值,两个样本区间:1978—1986和1992—2000,样本个数均是9个。子样本1的结果Yˆ=−+=(i−)()R2=,F=∑e=子样本2的结果yu kaYˆ=+=()()R2==∑e=
(3)求F统计量值=∑2i5∑==(4)判断。在a=下,式()中分子、分母的自由度均为7,查F分布表得临界值为F005(7,7)=.因为F=_swufe6>F0(=.057,7)所以拒绝原假y设u k,表明模型显著性地存在异方差。
(三)White检验按路径view/residual tests/white heteroskedasticity(no cross terms or cross terms),本例为一元函数,无交叉项,选no cross terms,则辅助函数为s2=a+ax+a2012x+vtttt得White检验结果nR2=23×=临界值(2)=因nR2>c200(2)= kaizhi_swufe所以拒绝原假设,表明模型存在异方差。
(四)ARCH检验按路径view/residual tests/ARCH LM test即可得到ARCH检验结果,本例中,取滞后阶数为1,即=1,则有e2=a2ˆ0+aˆet1t−1注意:这里的obs*R-squared表示2(n−p)R的数值“22”表示n-p,不是n,取a=,查临界值得c2005(1)=.由于n−pR2()=>c2005(1)=.则拒绝原假设,表y明u kaizhi_swufe模型显著性地存在异方差。
四、异方差性的修正(一)加权最小二乘法分别选用了权数w11=w1=w1,t2,=XiX23iXttt经估计检验发现用权数w2t的效果较好。估计结果yu kaizhi_swufe
(二)对数变换法分别对变量Y与Xtt取对数,生成“lY=log(Y),lX=log(X)”。tttt用OLS法求ly对lxtt的回归lYˆ=+()()R2=,=F=yu ,经检验,发现用对数变换后的估计结果,对异方差性有较大地修正作用,基本不存在异方差。(检验结果见下页)注意:此案例用的是时间序列数据,但也表现出了较严重的异方差性,说明有的时候时间序列也同样存在异方差。问题:案例中虽然用加权最小二乘法及对数变换等办法消除了异方差,但又出现了自相关。
对数变换后的估计结果的异方差检验White检验结果ARCH检验结果nR2=<c−2=()<00(1)=(2)=.不能拒绝原假设不能拒绝原假设yu kaizhi_swufe
本章小结1、什么是异方差性?Varu=s2()ii2、出现异方差的原因?随机项的方差随Xi而变化3、异方差性的后果:OLS估计式不再具有最小方差特性(WLS才具最小方差性)参数方差的确定有困难,且s2=∑2ˆe(n−k)i是有偏的解释变量的显著性检验失效OLS会低估存在异方差时的的真实方差高估t 统计量,夸大估计参数的统计显著性预测精yu kaizhi_swufe度降低
4、异方差性的检验:图形分析法:描绘2e与Xii的散点图Goldfeld-Quandt检验White检验ARCH检验但要注意它们的假设条件。5、异方差的修正:加权最小二乘法(WLS)对原模yu kaizhi_swufe型加以变换模型的对数变换
第五章主要公式异方差性Var2(u)=siiGoldfeld-Qunandt检验∑2n−ce2/[−k]2ieF*=2=∑2i的n−c2F统计量∑2ee/[−k]∑1i1i2White检验中的辅助函数2eˆ=aˆ1+aˆ2x2+aˆ3xtt3t(原模型只有两个解释变量)+a2ˆ4x+aˆ5x3+aˆ6x2xttt3tyu kaizhi_swufeARCH检验中的辅助函数e2=a+ae22ˆˆˆtˆ01t−1+L+apet−p
Glejser检验中常用的辅助函数1e=bX+v;e=bX+v;e=b+v;X1e=b+v;e=a+bX+vX一元函数下的加权最小二乘估计∑w(X−X*Y−Y*bˆ*=Y*−bˆ*X*bˆ*)()iii1z2hi_swuf2=∑w(X−X*2)ii一元函数下的对设Y=b并且1+b2X+uiiivu=s2=s2ar()f(X)原模型的变换iiiYbXui=1+bi+i2yu kai则f(X)f(X)f(X)f(X)iiii对数变换的模型lnY=b1+b2lnX+uiii
第五章讲完了!有什么问题吗?yu kaizhi_swufe