智库文档所有分类

财务管理财务知识经济计量实训指导书某某某.doc

下载

优品文档海量资料库

138页 | 1.56MB | 0次下载 |

0.0

(0人评价)

我要评价：

投诉举报

用手机看文档

扫一扫,手机看文档

下载

开通VIP

财务管理财务知识经济计量实训指导书某某某《经济计量模型建模实训》指导书《经济计量模型建模实训》简介《经济计量模型建模实训》是为经济学专业本科生计量经济学以及相关课程设置的一个综合性实践教学环节。是一门理论与实践相结合的一门课程。其主要目的是让学生通经济计量模型建模实训来掌握在对社会经济现象作定性分析的基础上，探讨如何运用经济计量模型建模的方法来定量描述具有随机性特征的经济变量关系，是结合计量经济学理论知识进行实验操作的实训课程。在实训中学生通过以建立计量经济模型的基本过程为主线，结合样本数据收集，掌握计量经济模型的建立、估计、检验、应用，综合运用微观、宏观经济学、统计学、国际贸易、计量经济学等相关课程的理论知识，学会用计量经济模型对实际经济问题进行实证分析，得到综合运用所学知识解决实际问题能力的培养和锻炼。一、实训目的本实训主要目的是使学生能够应用计量经济学所学的理论方法，根据经济系统中经济现象反映的问题，提出反映经济现象本质的经济计量模型，并通过上机实际操作，完成模型的参数估计，模型的统计检验，从而建立经济计量模型。实训使学生对经济计量建模过程有一个直观感性的认识，并熟悉现代计量经济分析软件 Eviews的实际操作流程。学生应达到的实训能力标准：1、要求学生能用计量经济学的理论解决实际问题，建立数学模型，通过计量经济学有关软件的实际操作；2、掌握计量经济学问题的计算机软件操作；3、对于外界条件的变化，具有一定的分析解决问题的能力。二、实训时间根据教学计划的要求，集中进行 16学时的训练。三、实训方式建立反映经济现象本质的经济计量模型，利用 Eviews软件完成模型的参数估计，模型的统计检验等工作，使学生掌握 Eviews 的实际操作流程。四、实训内容 1、经济计量模型基础理论 2、实证项目研究的选题 3、模型设定与数据处理 4、经济计量模型建模----模型的估计 5、经济计量模型建模----模型的检验 6、经济计量模型建模----模型的调整 7、经济计量模型建模---模型计量结果的分析 8、经济计量模型建模----撰写研究结果的报告五、实训要求 1、在实训开始前，组织学生认真阅读《实训指导书》，使学生明确所作实训项目的实训目的、实训要求、完成的实训内容和实训原理。 2、指导学生根据《实训指导书》所要求的实训步骤进行实训，必要时老师可进行演示。 3、计量经济牵涉面广，综合性强，要求思路开阔，综合运用计量经济及其它相关课程的理论知识，切忌孤立片面地分析回答问题。 4、要求学生根据实验结果进行实验分析总结，认真填写实训课程报告，并批阅评定成绩。 5、引导学生根据个人兴趣和教师指导，通过实训教学，综合掌握计量模型的建立步骤、估计原理、检验内容、对模型进行应用，得到有价值的结论。 6、撰写实训课程报告定量分析要求选用恰当的计量模型，计算结果要求准确。定性分析要求思路清晰，论点及概念正确，论据充分，文字表达层次分明，流畅。六、实训成绩评定本课程虽为考试课程，但课程总成绩是由多项形成性考核方式决定，其中实践能力训练是重要组织部分。学生的实训态度、动手能力、项目完成质量是实践教学评分的主要依据。 1、根据个人提交的经济计量模型实训报告质量给出实训的基础成绩。 2、根据个人答辩表现给出答辩成绩。 3、每人的总成绩=60%基础成绩+40%答辩成绩《经济计量模型建模实训》实验目录实验一：经济计量模型基础理论实验二：实证项目研究的选题实验三：模型设定与数据处理实验四：经济计量模型建模----模型的估计实验五：经济计量模型建模----模型的检验实验六：经济计量模型建模----模型的调整实验七：经济计量模型建模----模型计量结果的分析实验八：经济计量模型建模----研究结果的报告《经济计量模型建模实训》实验内容实验一：经济计量模型基础理论（实验学时：2）实验内容：了解计量经济学的基础理论和 Eviews 软件的基本操作实验说明：全面熟悉经济计量模型建模的相关计量经济学基础知识，并熟练相关的 Eviews软件操作过程。操作要求：（以案例分析为例）实验二：实证项目研究的选题（实验学时：2）建立我国最终消费支出与国内生产总值（单位：亿元）之间的回归模型，并进行变量和方程整体的显著性检验。当显著性水平为，2004年国内生产总值为 38000亿元时，对 2004 年我国最终消费支出和平均最终消费支出进行点预测和区间预测。年份 GDP 最终消费年份 GDP 最终消费 1978 3624 .10 2239 .10 1991 1114 6151 .57 1979 3899 .53 2568 .04 1992 1273 7083 .53 1980 4203 .96 2753 .10 1993 1445 7917 .65 1981 4425 .03 2989 .25 1994 1628 8638 .30 1982 4823 .68 3225 .09 1995 1799 9445 .38 1983 5349 .17 3511 .35 1996 1971 1058 1984 6160 .97 3988 .53 1997 2146 1144 1985 6990 .89 4506 .64 1998 2313 1251 1986 7610 .61 4817 .38 1999 2479 1381 1987 8491 .27 5114 .07 2000 2677 1540 1988 9448 .03 5419 .86 2001 2878 1675 1989 9832 .18 5190 .02 2002 3117 1809 1990 1020 5471 .93 2003 3407 1945 一、创建工作文件建立工作文件的方法 1．菜单方式在主菜单上依次单击 File→New→Workfile（见图 2-2），出现对话框“WorkfileRange”。在“Workfilefrequency”中选择数据频率： Annual(年度)Weekly(周数据) Quartrly(季度)Daily(5dayweek)(每周 5天日数据) SemiAnnual(半年)Daily(7dayweek)(每周 7天日数据) Monthly(月度)Undatedorirreqular(未注明日期或不规则的) 时间序列提供起止日期（年、季度、月度、周、日），非时间序列提供最大观察个数。本例中在 StartData 里输入 1978，在 Enddata里输入 2003，见图 2-3。单击 OK后屏幕出现 Workfile工作框，如图 2-4所示。 2．命令方式在命令窗口直接输入建立工作文件的命令 CREATE，命令格式：CREATE数据频率起始期终止期其中，数据频率类型分别为 A（年）、Q（季）、M（月）、 U（非时间序列数据）。输入 Eviews命令时，命令字与命令参数之间只能用空格分隔。如本例可输入命令： CREATEA3 这时屏幕上出现 WorkfileRange对话框，如图 2-3所示。工作文件创立后，需将工作文件保存到磁盘，单击工具条中 Save→输入文件名、路径→保存，或单击菜单兰中 File →Save或 Saveas→输入文件名、路径→保存。图2-2Eviews菜单方式创建工作文件示意图图 2-3 图 2-4 一个新建的工作文件窗口内只有2个对象(Object）,分别为c（系数向量）和resid（残差）。它们当前的取值分别是0 和NA（空值）。可以通过鼠标左键双击对象名打开该对象查看其数据，也可以用相同的方法查看工作文件窗口中其它对象的数值。二、输入和编辑数据建立或调入工作文件以后，可以输入和编辑数据。输入数据有两种基本方法：命令方式和菜单方式。 1．命令方式命令格式：data〈序列名 1〉〈序列名 2〉…〈序列名 n〉功能：输入新变量的数据，或编辑工作文件中现有变量的数据。在本例中，在命令窗口直接输入： DataYX 2．菜单方式在主菜单上单击 Objects→Newobject，在 Newobject对话框里，选 Group 并在 NameforObject 上定义变量名（如变量 X、Y），单击 OK，屏幕出现数据编辑框。另一种菜单方式是在主菜单上依次单击 Quick→Group （见图 2-5），图 2-5 建立一个空组（见图2-6），在数据编辑窗口中，首先按上行键“↑”，这时对应的“obs”字样的空格会自动上跳，在对应列的第二个“obs”有边框的空格键入变量名，如 “X”，再按下行键“↓”，对因变量名下的列出现“NA”字样，即可依顺序输入相应的数据（见图2-7）。其他变量的数据也可用类似方法输入。若要对数据存盘，点击 “fire/SaveAs”，出现“SaveAs”对话框，在“Drives”点所要存的盘，在“Directories”点存入的路径（文件名），在“FireName”对所存文件命名，或点已存的文件名，再点 “ok”。若要读取已存盘数据，点击“fire/Open”，在对话框的“Drives”点所存的磁盘名，在“Directories”点文件路径，在“FireName”点文件名，点击“ok”即可。另外数据还可以从 Excel中直接复制到空组。然后为每个时间序列取序列名。单击数据表中的 SER01 （见图 2-8），在数据组对话框中的命令窗口输入该序列名称，如本例中输入 X（见图 2-9），回车后 Yes。采用同样的步骤修改序列名 Y（见图 2-10）。数据输入操作完成。图 2-6 图 2-7 图 2-8 图 2-9修改序列名图 2-10数据输入数据输入完毕，单击工作文件窗口工具条的 Save或单击菜单兰的 File→Save将数据存入磁盘。（3）调入已有数据文件用户可从主菜单中选择 ProcsreadText-Lotus-Excel, 然后找到 Excel 文件存储路径后，双击文件对应并打开目标文件名后屏幕出现图 2-11所示对话框。本例调入对话框如图 2-12 图 2-11从外部调入数据对话框图 2-12 从外部调入数据对话框三、图形分析在估计计量经济模型之前，借助图形分析可以直观地观察经济变量的变动规律和相关关系，以便合理的确定模型的数学形式。图形分析中最常用的是趋势图和相关图。 1．菜单方式在数组窗口工具条上 Views 的下拉菜单中选择 Graph，出现对话框如图 2-13。 2．命令方式趋势图：PlotYX（见图 2-14-1）功能：（1）分析经济变量的发展变化趋势；（2）观察经济变量是否存在异常值。图给出了最终消费支出与国内生产总值的趋势图。相关图：ScatYX（见图 2-14-2）功能：（1）观察经济变量之间的相关程度；（2）观察经济变量之间的相关类型，判断是线性相关，还是曲线相关；曲线相关时，大致是哪种类型的曲线。图 2-13数组窗口下图形选择窗口图 2-14-1最终消费支出与国内生产总值的趋势图图 2-14-2最终消费支出与国内生产总值的相关图重要提示：在 Eviews工作薄中选取变量的顺序是很重要的。首先选中的变量的数据将表示为 X轴。四、OLS估计参数 1．命令方式在主菜单命令行键入 LSYCX（如图 2-15）图 2-15 2．菜单方式在主菜单上选 Quick 菜单，单击 EstimateEquation 项（图 2-16-1），屏幕出现 EstimateEquation估计对话框（图 2-16-2 ），在 EstimationSettings 中选 OLS 估计，即 LeastSquares，在方程清单（Specification）窗口输入要建立的方程（图 2-16-3）。回归方程的书写形式如下：完整形式：简化形式：YCX 两种形式等价的。（其中 C 为 Eviews 固定的截距项系数）。然后 OK，出现方程窗口（见图 2-16－4），输出结果如表 2-1所示。图 2-16-1 图 2-16-2方程估计窗口图 2-16-３方程输入窗口图 2-16－４方程窗口在工具栏中，单击 Name,将方程命名就可以把它永久的保存在工作文件中。我们把它命名为 eq01,如图 2-16-5所示: 图 2-16－5方程保存窗口表 2-1回归结果 DependentVariable:Y Method:LeastSquares， Sample:3 Includedobservations:26 Variable Coeffi cient Std. Error t-Stat istic Prob . C 22 153. 9605 05 41 X 14 9135 23 00 R-squared 59 Meandependentva r 8042 .748 AdjustedR-squa red 87 r 5177 .609 on 42 Akaikeinfocrite rion 2700 Sumsquaredresi d . Schwarzcriterio n 2378 Loglikelihood 510 F-statistic 3645 .290 Durbin-Watsons tat 11 Prob(F-statisti c) 0000 方程窗口的上半部分为参数估计结果如表 2-2 所示，其中第 1列分别为解释变量名（包括常数项），第 2列为相应的参数估计值，第 3列为参数的标准误差，第 4列为 t统计值，第 5列为 t检验的双侧概率值 p，即 P（|t|>ti）=p。表 2-2参数估计结果常数和解释变量参数估计值参数标准误差 t统计量双侧概率 C 522 5 3605 41 X 514 5 7623 00 方程窗口的下半部分主要是一些统计检验值，其中各统计量的含义如表 2-3所示。表 2-3统计检验值可决系数 459 被解释变量均值 8042 .748 调整的可决系数 187 被解释变量标准差 5177 .609 回归方程标准差 742 赤池信息准则 2700 残差平方和 . 施瓦兹信息准则 2378 似然函数的对数 -193. 3510 F统计量 3645 .290 DW统计量 011 F统计量的概率 0000 在本例中，参数估计的结果为：单击 Equation窗口中的 Resid按钮，将显示模型的拟合图和残差图（图 2－17所示）。图 2-17拟合图和残差图单击 Equation 窗口中的 View→Actual,Fitted,Resid →Table 按钮，可以得到拟合直线和残差的有关结果。（图 2-18所示）。图 2-18拟合直线和残差的有关结果五、随机项正态分布检验双击我国最终消费支出和国内生产总值工作文件中的 resid 标志（见图 2-19-1）总是可以获得包括最近一次回归模型的残差值向量，如图 2-19-2所示：图 2-19-1 图 2-19-2 点击 Views/DescriptiveStatistics/HistogramandStats( 如图 2-19-3)，可以得到残差值的直方图和 Jarque-Bera统计量，如图 2-19-4所示：图 2-19-3 图 2-19-4 例中残差的偏度为，说明残差的分布是说明的分布是不对称的呈现左偏。例中残差的峰度为，说明残差的分布相对于正态分布是平坦的，呈现平坦的分布形态。在正态分布的原假设下，J-B统计量是自由度为 2的 c2 分布。J-B统计量下显示的概率值（P值）是 J-B统计量超出原假设下的观测值的概率。如果该值很小，则拒绝原假设。当然，在不同的显著性水平下的拒绝域是不一样的。例中残差的 J-B 统计量下显示的概率值（P 值）是，不能拒绝原假设,残差服从正态分布。六、模型检验 1、经济意义检验所估计的参数，说明我国 GDP每增长一亿元，最终消费支出平均增长亿元。这与经济学中最终消费支出与国民生产总值间的关系相符。 2、拟合优度和统计检验用 EViews得出回归模型参数估计结果的同时，已经给出了用于模型检验的相关数据。拟合优度的度量：由表 2-3中可以看出，本例中可决系数为，说明所建模型整体上对样本数据拟合较好，即解释变量“国内生产总值”对被解释变量“我国最终消费支出”的绝大部分差异作出了解释。对回归系数的 t检验：针对和，由表 2-2中还可以看出，估计的回归系数的标准误差和 t 值分别为：，；的标准误差和 t 值分别为：。取，查 t 分布表得自由度为 24 的临界值因为》，所以应拒绝。这表明，国内生产总值对我国最终消费支出有显著影响。六、预测在 Equation框中选 Forecast项后，弹出 Forecast对话框（如图 2-20-1），Eviews 自动计算出样本估计期内的被解释变量的拟合值，拟合变量记为 YF，其拟合值与实际值的对比图如图 2-20-2 所示。同时在主窗口生成预测值序列 YF （如图 2-20-3）。图 2-20-1预测设置窗口图 2-20-2样本其内预测结果图 2-20-3 下面预测 2004年我国最终消费支出。 1．首先将样本期范围从 1978-2003年扩展为 1978-2004 年。即单击工作文件框中 Pros 中的 Structure/ResizeCurrentPage，如图 2-21-1 所示，并将 1978-2003改为 1978-2004，如图 2-21-2所示。图 2-21-1 图 2-21-2 2．然后编辑解释变量 X。在 Group数据框中输入变量 X 的 2004年数据。（见图 2-22）图 2-22 3．点预测。在前面 Equation对话框中选 Forecast，将时间 Sample定义在 1978-2004，如图 2-23所示，这时 Eviews 自动计算出=21202.，如图 2-24所示。图 2-23 图 2-24 4．区间预测。在 Group 数据框中单击 View，选 DescriptiveStats 里的 CommonSampleEviews（如图 2-25 所示），计算出有关 X和 Y的描述统计结果，如图 2-26所示。图 2-25 图 2-26X和 Y的描述统计结果根据图 2-26可计算出如下结果： 850 给定显著性水平，查表得，由可得的预测区间为： ..8587 即的 95%预测区间为（，）。实验二：实证项目研究的选题（实验学时：2）实验内容：理解实证项目研究的选题过程： 1、问题的提出 2、研究题目的选择 3、文献资料的利用、综述与评价实验说明：以完成一个经济计量建模实训报告为例，对实训项目的计量经济研究的构成要素、基本步骤等提出建议，包括对一般性原则和常用方法、有关选题、文献综述与评价等内容展开讨论。操作要求： 1、研究领域要依据自身的专业，或者结合自己在经济学、管理学、国际贸易等方面的知识结构，去选择感兴趣的领域。 2、要尽量选择在经济和社会领域中受到广泛关注的问题。所研究问题的题目要具体化，不宜空洞。 3、要明确研究范围。研究范围也决定了收集数据的范围， 4、所选题目的大小要适中。要充分考虑数据来源的可能性。 5、对收集到的相关文献应注意进行整理。对相关文献应当有个总结性的文字材料，以利于梳理思路。实验三：模型设定与数据处理（实验学时：2）实验内容：理解模型设定与数据处理过程： 1、建模的基本思路 2、模型设定的要求 3、模型变量与函数形式的设定： ⑴确定模型包含的变量根据经济学理论和经济行为分析。例如：同样是生产方程，电力工业和纺织工业应该选择不同的变量，为什么？例如，消费和 GDP之间的因果关系。考虑数据的可得性。注意因素和变量之间的联系与区别。考虑入选变量之间的关系。要求变量间互相独立。 ⑵确定模型的数学形式利用经济学和数理经济学的成果根据样本数据作出的变量关系图选择可能的形式试模拟 ⑶拟定模型中待估计参数的理论期望值区间符号、大小、关系例如：ln(人均食品需求量)=α+βln(人均收入)+γln(食品价格)+ δln(其它商品价格)+ε 其中α、β、γ、δ的符号、大小、关系 4、数据的收集与处理：数据来源、数据类型、数据处理 ⑴几类常用的样本数据时间序列数据截面数据虚变量离散数据联合应用 ⑵数据质量完整性准确性可比性一致性说明：以完成一个经济计量建模实训报告为例，对实训项目的计量经济研究的构成要素、基本步骤等提出建议，包括对模型选择、数据收集、论文写作以及一些具体的计量经济建模分析技术等内容展开讨论。操作要求：登陆相关数据网站，熟悉数据收集过程。中国国家统计局：.gov 美国：. 上海统计局：- 美国人口普查局：.gov 信息产业部：.govhyzw 美国会图书馆：.gov/ 国家外汇管理局：.gov 美国商业部：-/ 国际货币基金组织数据库：亚洲东盟网站：经合组织数据库： APEC网站：.sg 国信证券：美国 IBM公司：/investor 中国人民银行网：.gov 美国：经济杂志网：美国纳斯达克网：北京大学网：.pkuyearbook 搜索网站：中国疾病预防控制中心：英文书搜索网站：国内最常用的一些网上数据来源：中国经济信息网：.gov 中国经济统计数据库：.gov 中国国家统计局：.gov/tjsj 中国人民银行网：.govtongjishuju/ 中国证券监督管理委员会统计数据网页：.govstatinfo/ 实验四：经济计量模型建模----模型的估计（实验学时：2）实验内容：设定的模型确定以后，即用收集的数据去估计模型中的参数。 1、各种模型参数估计方法 2、如何选择模型参数估计方法 3、关于应用软件的使用实验原理：（以一元线性回归模型为例介绍 OLS） 1．一元线性回归模型有一元线性回归模型（统计模型）如下， yt=0+1xt+ut 上式表示变量 yt和 xt之间的真实关系。其中 yt称被解释变量（因变量），xt称解释变量（自变量），ut称随机误差项，0称常数项， 1称回归系数（通常未知）。上模型可以分为两部分。（1）回归函数部分，E(yt)=0+1xt,（2）随机部分，ut。 E(yt)=0+1xtut 图真实的回归直线这种模型可以赋予各种实际意义，收入与支出的关系；如脉搏与血压的关系；商品价格与供给量的关系；文件容量与保存时间的关系；林区木材采伐量与木材剩余物的关系；身高与体重的关系等。以收入与支出的关系为例。假设固定对一个家庭进行观察，随着收入水平的不同，与支出呈线性函数关系。但实际上数据来自各个家庭，来自各个不同收入水平，使其他条件不变成为不可能，所 5 10 15 20 25 30 10 20 30 40 50 60 70 y x 以由数据得到的散点图不在一条直线上（不呈函数关系），而是散在直线周围，服从统计关系。随机误差项 ut中可能包括家庭人口数不同，消费习惯不同，不同地域的消费指数不同，不同家庭的外来收入不同等因素。所以在经济问题上“控制其他因素不变”是不可能的。回归模型的随机误差项中一般包括如下几项内容，（1）非重要解释变量的省略，（2）人的随机行为，（3）数学模型形式欠妥，（4）归并误差（粮食的归并）（5）测量误差等。回归模型存在两个特点。（1）建立在某些假定条件不变前提下抽象出来的回归函数不能百分之百地再现所研究的经济过程。（2）也正是由于这些假定与抽象，才使我们能够透过复杂的经济现象，深刻认识到该经济过程的本质。通常线性回归函数 E(yt)=0+1xt是观察不到的，利用样本得到的只是对 E(yt)=0+1xt的估计，即对0和1的估计。在对回归函数进行估计之前应该对随机误差项 ut做出如下假定。 (1)ut是一个随机变量，ut的取值服从概率分布。 (2)E(ut)=0。 (3)D(ut)=E[ut-E(ut)]2=E(ut)2=2。称 ui具有同方差性。 (4)ut为正态分布（根据中心极限定理）。以上四个假定可作如下表达。utN(0,)。 (5)Cov(ui,uj)=E[(ui-E(ui))(uj-E(uj))]=E(ui,uj)=0,(ij)。含义是不同观测值所对应的随机项相互独立。称为 ui的非自相关性。 (6)xi是非随机的。 (7)Cov(ui,xi)=E[(ui-E(ui))(xi-E(xi))]=E[ui(xi-E(xi)]=E[uix i-uiE(xi)]=E(uixi)=与 xi相互独立。否则，分不清是谁对 yt 的贡献。 (8)对于多元线性回归模型，解释变量之间不能完全相关或高度相关（非多重共线性）。在假定（1），（2）成立条件下有 E(yt)=E(0+1xt+ut)=0+1xt。 2．最小二乘估计（OLS）对于所研究的经济问题，通常真实的回归直线是观测不到的。收集样本的目的就是要对这条真实的回归直线做出估计。怎样估计这条直线呢？显然综合起来看，这条直线处于样本数据的中心位置最合理。怎样用数学语言描述“处于样本数据的中心位置”？设估计的直线用 =+xt 表示。其中称 yt的拟合值（fittedvalue），和分别是0和1的估计量。观测值到这条直线的纵向距离用表示，称为残差。 yt=+=+xt+ 称为估计的模型。假定样本容量为 T。（1）用“残差和最小”确定直线位置是一个途径。但很快发现计算“残差和”存在相互抵消的问题。（2）用“残差绝对值和最小”确定直线位置也是一个途径。但绝对值的计算比较麻烦。（3）最小二乘法的原则是以“残差平方和最小”确定直线位置。用最小二乘法除了计算比较方便外，得到的估计量还具有优良特性。（这种方法对异常值非常敏感）设残差平方和用 Q表示， Q===，则通过 Q最小确定这条直线，即确定和的估计值。以和为变量，把 Q 看作是和的函数，这是一个求极值的问题。求 Q 对和的偏导数并令其为零，得正规方程， =2(-1)=0(1) =2(-xt)=0(2) 下面用代数和矩阵两种形式推导计算结果。首先用代数形式推导。由（1）、（2）式得， 0(3) xt=0(4) （3）式两侧用除 T，并整理得， =(5) 把（5）式代入（4）式并整理，得， xt=0(6) =0(7) =(8) 因为=0，=0，分别在（8）式的分子和分母上减和得， =(9) =(10) 3．最小二乘估计量和的特性 (1) 线性特性这里指和分别是 yt的线性函数。 (2) 无偏性 (3)有效性 0,1的 OLS估计量的方差比其他估计量的方差小。 Gauss-Marcov 定理：若 ut满足 E(ut)=0，D(ut)=2，那么用 OLS 法得到的估计量就具有最佳线性无偏性。估计量称最佳线性无偏估计量。最佳线性无偏估计特性保证估计值最大限度的集中在真值周围，估计值的置信区间最小。上面的评价是对小样本而言，若是对大样本而言还应讨论估计量的渐近无偏性，一致性和渐近有效性。 OLS 估计量都能满足上述渐近特性，但满足渐近特性的估计量不见得是最佳线性无偏估计量。注意：分清 4个式子的关系。 (1) 真实的统计模型， yt=0+1xt+ut (2)估计的统计模型，yt=+xt+ (3) 真实的回归直线， E(yt)=0+1xt (4)估计的回归直线，=+xt 实验说明：本实训讨论的范围所用的估计方法主要是最小二乘法。事实上 OLS不仅简便易用，而且在很多情形下都是既简便又适用的估计方法。方法可以学习系列教学课件中相关内容，以及实验环节的示例。操作请查看实训软件 spss的帮助功能。操作要求：（可以参考实验一案例分析为例）实验五：经济计量模型建模----模型的检验（实验学时：2）实验内容：由数理统计理论决定,包括拟合优度检验、总体显著性检验、变量显著性检验实验原理：一、线性回归模型检验的种类（以一元为例说明）根据变量X和Y的样本观测值，应用最小二乘法求得了样本回归直线，作为总体回归直线的近似，这种近似是否合理，必须对其进行检验。如果通过检验发现模型有缺陷，则必须回到重新设定模型或估计参数。一元线性回归模型的检验包括经济意义检验、统计检验和计量检验。（一）经济意义检验经济意义检验主要涉及参数估计值的符号和取值范围，如果它们与经济理论以及人们的实践经验不相符，就说明模型不能很好地解释现实的经济现象。例如，前面的家庭消费支出与可支配收入例子中，2β的取值范围应在0和1之间，如果估计出来的2b小于0或大于1，则不能通过经济意义检验。在对实际的经济现象进行回归分析时，常常会遇到经济意义检验不能通过的情况。造成这一结果的主要原因是：经济现象的统计数据无法象自然科学中的统计数据那样通过有控制的实验去取得，因而所观测的样本容量有可能偏小，不具有足够的代表性，或者不能满足标准线性回归分析所要求的假定条件。（二）统计检验统计检验是利用统计学中的抽样理论来检验样本回归方程的可靠性，具体又可分为拟合程度检验、相关系数检验、参数显著性检验(t检验)和回归方程显著性检验（F检验），是对所有现象进行回归分析时都必须通过的检验。（三）计量检验计量检验是对标准线性回归模型的假定条件是否满足进行检验，具体包括序列相关检验、异方差性检验等。计量检验对于经济现象的定量分析具有特别重要的意义。二、拟合优度检验所谓拟合程度，是指样本观测值聚集在样本回归直线周围的紧密程度。判断回归模型拟合程度优劣最常用的数量指标是判定系数（CoefficientofDetermination）。该指标是建立在对总离差平方和进行分解的基础之上的。 1、多重判定系数（多重可决系数）对于多元线性回归模型： yt=0+1xt1+2xt2+…+k-1xtk-1+ut, 总平方和 SST= 其中是 yt的样本平均数，定义为=。回归平方和为 SSR= 其中的定义同上。残差平方和为 SSE== 则有如下关系存在， SST=SSR+SSE R2= 显然有 0R21。R21，拟合优度越好。 2、调整的多重判定系数当解释变量的个数增加时，通常 R2不下降，而是上升。为调整因自由度减小带来的损失，又定义调整的多重判定系数如下： =1-=1- 判定系数是对回归模型拟合程度的综合度量，判定系数越大，模型拟合程度越高。判定系数越小，则模型对样本的拟合程度越差。判定系数R2具有如下性质： (1)判定系数R2具有非负性。由判定系数的定义式可知，R2的分子分母均是不可能为负值的平方和，因此其比值必大于零。 (2)判定系数的取值范围为０≤R2≤１。由R2的计算公式可以看出：当所有的观测值都位于回归直线上时， RSS＝０，这时R2＝１，说明总离差可以完全由所估计的样本回归直线来解释；当观测值并不是全部位于回归直线上时，RSS＞０，则RSS／TSS＞０，这时R2＜１；当回归直线没有解释任何离差，即模型中解释变量Ｘ与因变量Ｙ完全无关时，Ｙ的总离差全部归于残差平方和，即RSS＝TSS，这时R2＝０。 (3)判定系数是样本观测值的函数，它也是一个统计量。三、相关系数的显著性检验经济变量之间通常是相关的。问题是相关程度如何，如果在相关程度过低的变量之间建立回归模型，就没有很大的意义。这里讨论两个变量之间的线性相关，称为简单相关。正如上一章所讨论的，两个变量X和Y之间真实的线性相关程度用总体相关系数ρ来表示，即相关系数r具有以下性质：（1）相关系数r的取值范围在-1至+1之间，当r>0时，称X与Y正相关；当r<0时，称X 与Y负相关；当r=0时，称X与Y不（线性）相关。当|r|接近于1时，相关程度越高。（2）r=±R2，但两者的概念不同。判定系数R2是对变量Y和X作回归分析得出的，用于衡量拟合优度，而相关系数r是对变量X和Y作相关分析得出的，用以判定X与Y的线性相关程度。（3）相关系数r接近于1的程度与样本容量n有关：当n较小时，相关系数的绝对值容易接近于1；当n较大时，相关系数的绝对值容易偏小。特别是当n=2 时，相关系数的绝对值总为1。因此仅凭相关系数较大就说变量X与Y之间有密切的线性关系，则显得匆忙。样本相关系数在统计上是否显著，即总体X与Y是否显著相关，必须进行相关系数的显著性检验。相关系数的显著性检验可采用上一章的检验方法，也可以按如下步骤进行检验：（1）计算样本相关系数r；（2）根据给定的显著性水平α和样本容量n，查相关系数表（附表）得到临界值rα。（3）若|r|>rα，则X与Y有显著的线性关系，否则X与Y的线性相关关系不显著。四、、回归方程的显著性检验：方差分析与 F检验与 SST相对应，自由度 T-1也被分解为两部分，（T-1）=(k-1)+(T-k) 回归均方定义为 MSR=，误差均方定义为 MSE= 表方差分析表方差来源平方和自由度均方均方回归 SSR= k-1 MSR=SSR/(k -1) F= 误差 SSE= T-k MSE=SSE/(T -k) 总和 SST= T-1 H0:1=2=…=k-1=0;H1:j不全为零 F==F(k-1,T-k) 设检验水平为，则检验规则是，若 FF(k-1,T-k)，接受 H0；若 F>F(k-1,T-k),拒绝 H0。 0F(k-1,T-k)-t(T-k)0t(T-k) 图检验示意图图检验示意图五、回归参数的显著性检验 t检验 H0：j=0,(j=1,2,…,k-1),H1：j0 t=t(T-k) 判别规则：若ttk接受 H0；若t>tk拒绝 H0。六、建模过程中应注意的问题图（1）研究经济变量之间的关系要剔除物价变动因素。以上图为例，按当年价格计算，我国 1992年的 GDP是 1980年的倍，而按固定价格计算，我国 1992年的 GDP是 1980年的倍。另外从图中还可看出，1980-1992 期间按名义价格计算的 GDP 曲线一直是上升的，而按不变价格（1980 年价格）计算的 GDP 曲线在 1989 年出现一次下降。可见研究经济变量应该剔除物价变动因素。 (2)依照经济理论以及对具体经济问题的深入分析初步确定解释变量。例：我国粮食产量=f（耕地面积、农机总动力、施用化肥量、农业人口等）。但根据我国目前情况，“耕地面积”不是“粮食产量” 的重要解释变量。粮食产量的提高主要来自科技含量的提高。例：关于某市的食用油消费量，文革前常驻人口肯定是重要解释变量。现在则不同，消费水平是重要解释变量，因为食用油供应方式已改变。 (3)当引用现成数据时，要注意数据的定义是否与所选定的变量定义相符。例：“农业人口”要区别是“从事农业劳动的人口”还是相对于城市人口的“农业人口”。例：2002年起我国将执行新的规定划分三次产业。即将农、林、牧、副、渔服务业从原第三产业划归第一产业。 (4)通过散点图，相关系数，确定解释变量与被解释变量的具体函数关系。（线性、非线性、无关系）（nonli8）图（5）谨慎对待离群值（outlier）。离群值可能是正常值也可能是异常值。不能把建立模型简单化为一个纯数学过程，目的是寻找经济规律。年 INV（投资）IMPORT （进口） 1991 1992 1993 1994 1995 1996 1997 1998 0 (6)过原点回归模型与非过原点回归模型相比有如下不同点。以一元线性过原点模型，yt=1xt+ut，为例，①=0 不一定成立。原因是正规方程只有一个（不是两个）， =2(yt-xt)(-xt)=0 即xt=0，而没有=0。所以残差和等于零不一定成立。②可决系数 R2有时会得负值！原因是有时会有 SSE>SST。为维持 SSE+SSR=SST，迫使 SSR<0。 (7)改变变量的测量单位可能会引起回归系数值的改变，但不会影响 t值。即不会影响统计检验结果。以一元回归模型的估计公式为例说明之。 = t=== (8)回归模型给出估计结果后，首先应进行 F检验。F检验是对模型整体回归显著性的检验。(检验一次，H0:1=2=…=k-1=0;H1:j不全为零。)若 F检验结果能拒绝原假设，应进一步作 t检验（检验 k 次，H0：j=0,(j=1,2,…,k-1),H1：j0）。t 检验是对单个解释变量的回归显著性的检验。若回归系数估计值未通过 t检验，则相应解释变量应从模型中剔除。剔除该解释变量后应重新回归。按经济理论选择的变量剔出时要慎重。 (9)在作 F 与 t 检验时，不要把自由度和检验水平用错（正确查临界值表）。回归系数的 t 检验是双端检验，但 t 检验表的定义有 P(t>t)=,P(t<t)= -t(T-k)0t(T-k)F(k-1,T-k) 图图 (10)对于多元回归模型，当解释变量的量纲不相同时，不能在估计的回归系数之间比较大小。若要在多元回归模型中比较解释变量的相对重要性，应该对回归系数作如下变换 *=,j=1,2,…k-1() 其中 s(xt)和 s(yt)分别表示 xt和 yt的样本标准差。*可用来直接比较大小。以二元模型为例，标准化的回归模型表示如下（标准化后不存在截距项）， =1*+2*+…+ut 两侧同乘 s(yt)，得 (yt-)=1*(xt1-)+2*(xt2-)+…+uts(yt) 所以有 j*=j,即j*=j,i=1,2,…k-1 既是()式。 (11)利用回归模型预测时，解释变量的值最好不要离开样本范围太远。原因是①根据预测公式离样本平均值越远，预测误差越大。以一元回归模型为例； N(0+1xF,(1++)) 从公式看，当 xF=时，的分布方差最小，即预测区间最小，预测精度最高。而预测点 xF越远离，的分布方差越大，即预测区间越大，预测精度越差。 ②有时，样本以外变量的关系不清楚。当样本外变量的关系与样本内变量的关系完全不同时，在样本外预测就会发生错误。图给出青铜硬度与锡含量的关系曲线。若以锡含量为 0-16%为样本，求得的关系近似是线性的。当把预测点选在锡含量为 16%之外时，显然这种预测会发生严重错误。因为锡含量超过 16%之后，青铜的硬度急剧下降，不再遵从锡含量为 0-16%时的关系。图的区间预测的变化图青铜硬度与锡含量的关系图图 (12)回归模型的估计结果应与经济理论或常识相一致。如边际消费倾向估计结果为，则模型很难被接受。 (13)残差项应非自相关（用 DW检验，亦可判断虚假回归）。否则说明①仍有重要解释变量被遗漏在模型之外。②选用的模型形式不妥。 (14)通过对变量取对数消除异方差。 (15)避免多重共线性。 (16)解释变量应具有外生性，与误差项不相关。 (17)应具有高度概括性。若模型的各种检验及预测能力大致相同，应选择解释变量较少的一个。 (18)模型的结构稳定性要强，超样本特性要好。 (19)世界是变化的，应该随时间的推移及时修改模型。实验说明：本实训讨论模型的检验主要包括经济意义的检验、统计推动检验、计量经济学检验、模型预测检验。此外还有模型的诊断性检验，主要包括对变量的检验、残差检验和稳定性检验。具体检验方法可以学习系列教学课件中相关内容，以及实验环节的示例。操作请查看实训软件 spss的帮助功能。操作要求：（以案例分析为例）建立我国国有独立核算工业企业生产函数。根据生产函数理论，生产函数的基本形式为：，其中，L、K分别为生产过程中投入的劳动与资金，时间变量 t 反映技术进步的影响。表 3-1 列出了我国 1978-1994 年期间国有独立核算工业企业的有关统计资料；其中产出 Y 为工业总产值（可比价），L、K 分别为年末职工人数和固定资产净值（可比价）。一、创建工作文件建立工作文件的方法 1．菜单方式在主菜单上依次单击 File→New→Workfile（见图 3-1），选择数据类型和起止日期。时间序列提供起止日期（年、季度、月度、周、日），非时间序列提供最大观察个数。本例中在 StartData 里输入 1978，在 Enddata 里输入 1994，见图 3-2。单击 OK后屏幕出现 Workfile工作框，如图 3-3所示。 2．命令方式在命令窗口直接输入建立工作文件的命令 CREATE，命令格式：CREATE数据频率起始期终止期其中，数据频率类型分别为 A（年）、Q（季）、M（月）、 U（非时间序列数据）。输入 Eviews命令时，命令字与命令参数之间只能用空格分隔。如本例可输入命令： CREATEA4 工作文件创立后，需将工作文件保存到磁盘，单击工具条中 Save→输入文件名、路径→保存，或单击菜单兰中 File →Save或 Saveas→输入文件名、路径→保存。图3-1Eviews菜单方式创建工作文件示意图这时屏幕上出现 WorkfileRange对话框，如图 3-2所示。图 3-2 图 3-3 一个新建的工作文件窗口内只有2个对象(Object）,分别为c （系数向量）和resid（残差）。它们当前的取值分别是0和NA（空值）。可以通过鼠标左键双击对象名打开该对象查看其数据，也可以用相同的方法查看工作文件窗口中其它对象的数值。二、输入和编辑数据建立或调入工作文件以后，可以输入和编辑数据。输入数据有两种基本方法：命令方式和菜单方式。 1．命令方式命令格式：data〈序列名 1〉〈序列名 2〉…〈序列名 n〉功能：输入新变量的数据，或编辑工作文件中现有变量的数据。在本例中，在命令窗口直接输入： DataYtLK 2．菜单方式在主菜单上单击 Objects→Newobject，在 Newobject对话框里，选 Group 并在 NameforObject 上定义变量名（如变量 Y、t、L、K），单击 OK，屏幕出现数据编辑框。另一种菜单方式是在主菜单上依次单击 Quick→ EmptyGroup（见图 3-4），图 3-4 建立一个空组（见图 3-5），再用方向键将光标移到每一列的顶部之后，输入各个变量名，回车后输入数据（见图 3-6）。另外数据还可以从 Excel中直接复制到空组。图 3-5 图 3-6录入数据数据输入完毕，单击工作文件窗口工具条的 Save或单击菜单兰的 File→Save将数据存入磁盘。三、图形分析在估计计量经济模型之前，借助图形分析可以直观地观察经济变量的变动规律和相关关系，以便合理的确定模型的数学形式。图形分析中最常用的是趋势图和相关图。 1．菜单方式在数组窗口工具条上 Views 的下拉菜单中选择 Graph。（见图 3-7-1） 2．命令方式趋势图：PlotYtLK（见图 3-8）功能：（1）分析经济变量的发展变化趋势；（2）观察经济变量是否存在异常值。图 3-12给出了工业总产值与劳动人数、资金的趋势图。相关图：ScatYt（见图 3-10）功能：（1）观察经济变量之间的相关程度；（2）观察经济变量之间的相关类型，判断是线性相关，还是曲线相关；曲线相关时，大致是哪种类型的曲线。图 3-7-1数组窗口趋势图图 3-7-2数组窗口趋势图对话框图 3-8工业生产总值和投入趋势图图 3-9-1数组窗口相关图图 3-9-2数组窗口相关图图 3-10工业生产总值和时间相关图重要提示：在 Eviews工作薄中选取变量的顺序是很重要的。首先选中的变量的数据将表示为 X轴。四、建立多元线性回归模型㈠建立包括时间变量的三元线性回归模型完整过程；在命令窗口依次键入以下命令即可： ⒈建立工作文件：CREATEA7894 ⒉输入统计资料：DATAYLK ⒊生成时间变量t：GENRT=@TREND(77) ⒋建立回归模型：LSYCTLK 其中参数估计OLS方法： 1．命令方式在主菜单命令行键入 LSYCTLK（如图 3-11-1），单击回车键，即可出现回归结果表 3-11-2 图 3-11-1 图 3-11-2 2．菜单方式在主菜单上选 Quick 菜单，单击 EstimateEquation 项（图 3-12-1），屏幕出现 Equation-Specification估计对话框（图 3-12-2），在 EstimationSettings中选 OLS估计。许，即 LeastSquares，在方程清单（Specification）窗口输入要建立的方程（图 3-12-3）。回归方程的书写形式如下：完整形式：简化形式：YCTLK 两种形式等价的。（其中 C 为 Eviews 固定的截距项系数）。然后 OK，出现方程窗口（见图 3-12－4），输出结果如表 3-1所示。图 3-12-1 图 3-12-2方程估计窗口图 3-12-３方程输入窗口图 3-12－４方程窗口在工具栏中，单击 Name,将方程命名就可以把它永久的保存在工作文件中。我们把它命名为 eq01,如图 3-12-5所示: 图 3-12－5方程保存窗口则生产函数的估计结果及有关信息如表 3-1所示：表 3-1我国国有独立核算工业企业生产函数的估计结果 DependentVariable:Y Method:LeastSquares Date:0809Time:12:26 Sample:4 Includedobservations:17 Variable Coefficien t t-Statist ic Prob. C T L K R-squared AdjustedR-squared Sumsquaredresid Loglikelihood -Quinncriter. F-statistic -Watsonstat Prob(F-statistic) 因此，我国国有独立工业企业的生产函数为：五、模型检验 1、经济意义检验模型的计算结果表明，我国国有独立核算工业企业的劳动力边际产出为，资金的边际产出为，技术进步的影响使工业总产值平均每年递增亿元。回归系数的符号和数值是较为合理的。 2、拟合优度和统计检验，说明模型有很高的拟合优度，F检验也是高度显著的，说明职工人数L、资金K和时间变量t对工业总产值的总影响是显著的。从表3-1看出，解释变量资金K的t统计量值为，表明资金对企业产出的影响是显著的。但是，模型中其他变量（包括常数项）的t统计量值都较小，未通过检验。因此，需要对以上三元线性回归模型做适当的调整，按照统计检验程序，一般应先剔除t统计量最小的变量（即时间变量）而重新建立模型。单击 Equation窗口中的 Resid按钮，将显示模型的拟合图和残差图（图 3-13所示）。图 3-13拟合图和残差图单击 Equation 窗口中的 View→Actual,Fitted,Resid →Table 按钮，可以得到拟合直线和残差的有关结果,如图 3-14所示。图 3-14模型 1的残差分布㈡建立剔除时间变量的二元线性回归模型；命令：LSYCLK 则生产函数的估计结果及有关信息如图 3-15所示。在工具栏中，单击 Name,将方程命名就可以把它永久的保存在工作文件中。我们把它命名为 eq02。图 3-15 表3-2我国国有独立核算工业企业生产函数剔除时间变量后的估计结果 DependentVariable:Y Method:LeastSquares Date:0809Time:12:42 Sample:4 Includedobservations:17 Variable Coeffici t-Statist ic Prob. C 9 L K R-squared 9 AdjustedR-squar ed 2 n Akaikeinfocriterio n 1 Sumsquaredresid 5 Loglikelihood 5 Hannan-Quinncriter . 2 F-statistic -Watsonstat 4 Prob(F-statisti c) 因此，我国国有独立工业企业的生产函数为：从表 3-2 的结果看出，回归系数的符号和数值也是合理的。劳动力边际产出为，资金的边际产出为，表明这段时期劳动力投入的增加对我国国有独立核算工业企业的产出的影响最为明显。模型 2 的拟合优度较模型 1 并无多大变化，F 检验也是高度显著的。这里，解释变量、常数项的 t检验值都比较大，显著性概率都小于，因此模型 2较模型 1更为合理。单击 Eq02窗口中的 Resid按钮，将显示最后一次回归模型的拟合图和残差图（图 3－16所示）。图 3-15拟合图和残差图（剔除时间变量）单击 Eq02 窗口中的 View→ Actual,Fitted,Resid→ Table按钮，可以得到拟合直线和残差的有关结果,如图 3-16 所示。图 3-16模型 2的残差分布六、随机项正态分布检验双击我国工业总值工作文件中的 resid 标志（见图 3-17-1）总是可以获得包括最近一次回归模型的残差值向量，如图 3-22-2所示：图 3-17-1 图 3-17-2 点击 Views/DescriptiveStatistics/HistogramandStats( 如图 3-17-3)，可以得到残差值的直方图和 Jarque-Bera统计量，如图 3-17-4所示：图 3-17-3 图 3-17-4 七、比较、选择最佳模型估计过程中，对每个模型检验以下内容，以便选择出一个最佳模型：㈠回归系数的符号及数值是否合理；㈡模型的更改是否提高了拟合优度；㈢模型中各个解释变量是否显著；㈣残差分布情况以上比较模型的㈠、㈡、㈢步在步骤一中已有阐述，现分析模型1和模型2的残差分布情况。分别在模型 1 ～模型 2 的各方程窗口中点击 View/Actual,Fitted,Residual/Actual,Fitted,ResidualTa ble（图3-18），可以得到各个模型相应的残差分布表（图 3-19-1至图3-19-2）。 3-18 图 3-19-1模型 1的残差分布图 3-19-2模型 2的残差分布可以看出，模型 1的各期残差中大多数都落在±σˆ的虚线框内，且残差分布不存在明显的规律性。但是，由步骤五中的分析可知，模型 1中除了解释变量 K之外，其余变量均没有通过变量显著性检验，因此，该模型也应舍弃。模型 2具有合理的经济意义，都通过了 t检验和 F检验，拟合优度高，理论上讲可以描述资本、劳动的投入与产出的关系。因此可以选择模型 2为我国国有工业企业生产函数。七、预测从方程 eq02 的工具栏中，点击 View/Representations, 便得到目标方程的表达式，加黑的部分就是回归方程估计结果的表达式，如图 3-20所示：图 3-20 当 L=5010,K= 时，我们将预测国内工业总产值是多少？将加黑的方程复制到 Eviews 的命令窗口，如图 3-21 所示：图 3-21 然后编辑，首先进行左边因变量名称的修改，这点很重要，要避免覆盖因变量 Y.为此我们没有使用命令造一个变量（Series）,而只是造一个纯量（scalar）,或者说是一个常数。我们将新纯量命名为 R3,输入命令如图 3-22所示：图 3-22 点击回车键，注意：该命令的执行会导致在文档中产生一个永久纯量图标，如图 3-23阴影部分所示：图 3-23 通过双击图标 R3，可以在任何时间显示在 Eviews 主窗口左下角的状态栏里，如图 3-24所示：图 3-28 显然，当 L=5010,K= 时，我们将预测国内工业总产值是 12017.。实验六：经济计量模型建模----模型的调整（实验学时：2）实验内容：模型的调整，是指对模型检验提出的问题如何予以解决，包括多重共线性、异方差性、自相关性以及模型设定误差、测量误差等。实验原理：一、多重共线性 1、多重共线性的概念：对于模型 Yi=b0+b1X1i+b2X2i+¼+bkXki+mii=1,2,…,n 其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相关性，则称为多重共线性 (Multicollinearity)。 2、多重共线性的经济解释（1）经济变量在时间上有共同变化的趋势。如在经济上升时期，收入、消费、就业率等都增长，当经济收缩期，收入、消费、就业率等又都下降。当这些变量同时进入模型后就会带来多重共线性问题。（2）解释变量与其滞后变量同作解释变量。 3、多重共线性的理论后果（1）即使是在接近共线性的情形下，普通最小二乘法估计量仍然是无偏的。但要记住的是，无偏性是一个重复抽样的性质。（2）接近共线性也并未破坏普通最小二乘估计量的最小方差性：在所有线性无偏估计量中，普通最小二乘法估计量的方差最小。但最小方差并不意味着方差值也较小。 (3)即使变量 X与总体(也即 PRF)不线性相关，但却可能与某一样本线性相关，从这个意义上说，多重共线性本质上是一个样本(回归)现象。 4、多重共线性的实际后果 (1)普通最小二乘法估计量的方差和标准差较大,普通最小二乘法估计量的精确度降低。 (2)置信区间变宽。由于标准差较大，所以总体参数的置信区间也就变大了。 (3)t值不显著。 (4)R2值较高，但 t值则并不都显著。 (5)普通最小二乘估计量及其标准差对数据的微小变化非常敏感；也就是说，它们趋于不稳定。（6）回归系数符号有误。（7）难以衡量各个解释变量对回归平方和(ESS)或者 R2的贡献。 5、多重共线性的检验（1）初步观察。当模型的拟合优度（R2）很高，F值很高，而每个回归参数估计值的方差 Var(j)又非常大（即 t 值很低）时，说明解释变量间可能存在多重共线性。（2）Klein 判别法。计算多重可决系数 R2及解释变量间的简单相关系数 rxixj。若有某个 rxixj>R2，则 xi，xj间的多重共线性是有害的。（3）此外还有其他一些检验方法，如主成分分析法等，很复杂。 6、多重共线性的克服方法（1）直接合并解释变量当模型中存在多重共线性时，在不失去实际意义的前提下，可以把有关的解释变量直接合并，从而降低或消除多重共线性。如果研究的目的是预测全国货运量，那么可以把重工业总产值和轻工业总产值合并为工业总产值，从而使模型中的解释变量个数减少到两个以消除多重共线性。甚至还可以与农业总产值合并，变为工农业总产值。解释变量变成了一个，自然消除了多重共线性。（2）利用已知信息合并解释变量通过经济理论及对实际问题的深刻理解，对发生多重共线性的解释变量引入附加条件从而减弱或消除多重共线性。比如有二元回归模型 yt=0+1xt1+2xt2+ut() x1与 x2间存在多重共线性。如果依据经济理论或对实际问题的深入调查研究，能给出回归系数1与2的某种关系，例如 2=1() 其中为常数。把上式代入模型（），得 yt=0+1xt1+1xt2+ut=0+1(xt1+xt2)+ut() 令 xt=xt1+xt2 得 yt=0+1xt+ut() 模型（）是一元线性回归模型，所以不再有多重共线性问题。用普通最小二乘法估计模型（），得到，然后再利用（）式求出。（3）增加样本容量或重新抽取样本这种方法主要适用于那些由测量误差而引起的多重共线性。当重新抽取样本时，克服了测量误差，自然也消除了多重共线性。另外，增加样本容量也可以减弱多重共线性的程度。（4）合并截面数据与时间序列数据这种方法属于约束最小二乘法（RLS）。其基本思想是，先由截面数据求出一个或多个回归系数的估计值，再把它们代入原模型中，通过用因变量与上述估计值所对应的解释变量相减从而得到新的因变量，然后建立新因变量对那些保留解释变量的回归模型，并利用时间序列样本估计回归系数。（5）逐步回归法（1）用被解释变量对每一个所考虑的解释变量做简单回归。（2）以对被解释变量贡献最大的解释变量所对应的回归方程为基础，以对被解释变量贡献大小为顺序逐个引入其余的解释变量。这个过程会出现 3种情形。①若新变量的引入改进了 R2，且回归参数的 t检验在统计上也是显著的，则该变量在模型中予以保留。②若新变量的引入未能改进 R2，且对其他回归参数估计值的 t检验也未带来什么影响，则认为该变量是多余的，应该舍弃。③若新变量的引入未能改进 R2，且显著地影响了其他回归参数估计值的符号与数值，同时本身的回归参数也通不过 t检验，这说明出现了严重的多重共线性。舍弃该变量。进行逐步回归的SPSS操作步骤如下：（1）在SPSS中输入变量数据，设变量名分别为Y、X1、X2。（2）选择主菜单[Analyze]=>[Regression]=>[Linear…]，显示如图8-82所示的对话框。选择 Y进入因变量框，选择X1、X2进入自变量列表框。选择[Method（方法）]为[Stepwise]。（3）单击[Options]按钮，打开[LinearRegression:Options] 子对话框（如图8-90所示），该对话框的[SteppingMethodCriteria]栏给出了引入/删除自变量的默认F临界值/p值。本例采用 SPSS默认值，单击[Continue]按钮返回。图8-90回归分析选项对话框（4）单击主对话框中的[OK]按钮，输出结果为：二、异方差 1、异方差的概念 2、异方差的后果异方差对最小二乘估计量（OLS）的影响: 1、OLS仍是线性 2、OLS仍是无偏的 3、OLS不再是最小方差，不再是最有效的 4、OLS估计量方差的公式得到的方差是有偏的。 6、建立在 t分布和 F分布的置信区间和假设检验不可靠。 3、异方差检验定性分析异方差 (1)经济变量规模差别很大时容易出现异方差。如个人收入与支出关系，投入与产出关系。 (2)利用散点图做初步判断。因变量 Y与解释变量 X的散点图当 Y与 X的散点图分布的区域逐渐变宽、变窄或出现不规则的复杂变化时，都可能存在异方差。如图 8-92 所示，（A）为同方差的情形，（B）为递增异方差的情形，（C）为递减异方差的情形，（D）为复杂异方差的情形。 (3)利用残差图做初步判断。残差平方e2与X的散点图如果扰动项ε存在异方差，在残差平方e2与X的散点图上，e2 不会近似于某一常数。因此可依此判断是否存在异方差。各种异方差情形所对应的 e2 与 X 的散点图如图 8-95 所示。异方差检验 2 25 / . .ie d f 、不再是真实的无偏估计量 (1)White检验 White检验由年提出。Goldfeld-Quandt检验必须先把数据按解释变量的值从小到大排序。Glejser检验通常要试拟合多个回归式。White检验不需要对观测值排序，也不依赖于随机误差项服从正态分布，它是通过一个辅助回归式构造2统计量进行异方差检验。White检验的具体步骤如下。以二元回归模型为例， yt=0+1xt1+2xt2+ut() ①首先对上式进行 OLS回归，求残差。 ②做如下辅助回归式， =0+1xt1+2xt2+3xt12+4xt22+5xt1xt2+vt() 即用对原回归式中的各解释变量、解释变量的平方项、交叉积项进行 OLS回归。注意，上式中要保留常数项。求辅助回归式()的可决系数 R2。 ③White检验的零假设和备择假设是 H0:()式中的 ut不存在异方差， H1:()式中的 ut存在异方差 ④在不存在异方差假设条件下统计量 TR22(5)() 其中 T表示样本容量，R2是辅助回归式()的 OLS估计式的可决系数。自由度 5表示辅助回归式()中解释变量项数（注意，不计算常数项）。TR2属于 LM统计量。 ⑤判别规则是若 TR2 2(5),接受 H0（ut具有同方差）若 TR2>2(5),拒绝 H0（ut具有异方差） (2)Goldfeld-Quandt检验 H0:ut具有同方差，H1:ut具有递增型异方差。构造 F 统计量。①把原样本分成两个子样本。具体方法是把成对（组）的观测值按解释变量的大小顺序排列，略去 m个处于中心位置的观测值（通常 T30时，取 mT/4，余下的 T-m个观测值自然分成容量相等，(T-m)/2，的两个子样本。） {x1,x2,…,xi-1,xi,xi+1,…,xT-1,xT} n1=(T-m)/2m=T/4n2=(T-m)/2 ②用两个子样本分别估计回归直线，并计算残差平方和。相对于 n2和 n1分别用 SSE2和 SSE1表式。③F统计量是 F==，（k为模型中被估参数个数）在 H0成立条件下，FF(n2-k,n1-k) ④判别规则如下，若 FF(n2-k,n1-k),接受 H0（ut具有同方差）若 F>F(n2-k,n1-k),拒绝 H0（递增型异方差）注意： ①当摸型含有多个解释变量时，应以每一个解释变量为基准检验异方差。 ②此法只适用于递增型异方差。 ③对于截面样本，计算 F统计量之前，必须先把数据按解释变量的值从小到大排序。（3）Glejser检验检验是否与解释变量 xt存在函数关系。若有，则说明存在异方差；若无，则说明不存在异方差。通常应检验的几种形式是 =a0+a1xt =a0+a1xt2 =a0+a1,…. Glejser检验的特点是： ①既可检验递增型异方差，也可检验递减型异方差。 ②一旦发现异方差，同时也就发现了异方差的具体表现形式。 ③计算量相对较大。 ④当原模型含有多个解释变量值时，可以把拟合成多变量回归形式。 4、补救措施由于异方差存在时普通最小二乘估计量是非有效的，所以对于已经检验出存在异方差的回归模型，就不应再直接采用普通最小二乘法来估计模型的参数。常用于处理异方差问题的方法是采用加权最小二乘法(WLS,WeightedLeastSquares)。分两种情况处理： 1、误差的真实值是已知的 2、误差的真实值是未知的误差的真实值是已知的加权最小二乘法（WLS）误差的真实值是未知的需要对做假定 1、误差与 Xi成比例：平方根变换三、自相关 1、自相关的性质： E(ui,uj)=0,i不等于 j 2、自相关产生的原因惯性模型设定误差蛛网现象数据加工 3、自相关的后果 OLS仍是线性的无偏的 OLS不再是有效的 OLS估计量的方差是有偏的。 1 2 1 2 1 ( ) ( ) i i i i i i i i i i Y B B X Y X B B             变为 2 i 2 i 2 i t和 F检验不在可靠 σ＝RSS／.是真实σ的有偏估计量 R的测度不在真实计算预测的方差和标准差也可能无效 3、自相关的诊断 (1) 图示法图示法是一种直观的检验方法，是把给定的回归模型直接用OLS法估计参数，求出残差项e，e作为扰动项ε的真实值的估计值，再绘出残差e的散点图，根据e的相关性来判断扰动项ε的自相关性。残差e的散点图通常有两种绘制方式：绘制−1−ttee的散点图和按时间顺序绘制残差的散点图。在−1−ttee散点图中，如果大部分点落在第一、三象限，表明扰动项ε存在正自相关，如图8-100(A)所示；如果大多数点落在第二、四象限，表明扰动项 ε存在负自相关，如图8-100(B)所示。在ett−−散点图中，如果te 随时间变化并不频繁地改变符号，而是相几个正的te后面跟着几个负的te，表明扰动项存在正自相关，如图8-100(C) 所示；如果te随着时间的逐次变化频繁地改变符号，表明扰动项存在负自相关，如图8-100(D) 所示。 (2) DW（Durbin-Watson）检验法 DW 检验是 , 于 1950，1951 年提出的。它是利用残差 et构成的统计量推断误差项 ut是否存在自相关。使用 DW检验，应首先满足如下三个条件。（1）误差项 ut的自相关为一阶自回归形式。（2）因变量的滞后值 yt-1不能在回归模型中作解释变量。（3）样本容量应充分大（T15） DW检验步骤如下。给出假设 H0:=0(ut不存在自相关) H1:0(ut存在一阶自相关) 用残差值 et计算统计量 DW。 DW=() 其中分子是残差的一阶差分平方和，分母是残差平方和。把上式展开， DW=() 因为有 ≈≈,() 代入（）式， DW≈=2(1-)=2(1-).() 因为的取值范围是[-1,1]，所以 DW 统计量的取值范围是[0,4]。 与 DW值的对应关系见表。表 与 DW值的对应关系及意义  DW ut的表现 =0 DW=2 ut非自相关 =1 DW=0 ut完全正自相关 =-1 DW=4 ut完全负自相关 0<<1 0<DW<2 ut 有某种程度的正自相关 -1<<0 2<DW<4 ut 有某种程度的负自相关实际中 DW=0,2,4 的情形是很少见的。当 DW 取值在（0,2），（2,4）之间时，怎样判别误差项 ut是否存在自相关呢？推导统计量 DW 的精确抽样分布是困难的，因为 DW 是依据残差 et计算的，而 et的值又与 xt的形式有关。DW 检验与其它统计检验不同，它没有唯一的临界值用来制定判别规则。然而 Durbin-Watson根据样本容量和被估参数个数，在给定的显著性水平下，给出了检验用的上、下两个临界值 dU和 dL。判别规则如下：图 (1)若 DW 取值在（0,dL）之间，拒绝原假设 H0,认为 ut存在一阶正自相关。 (2)若 DW取值在（4-dL,4）之间，拒绝原假设 H0,认为 ut存在一阶负自相关。 (3)若 DW 取值在（dU,4-dU）之间，接受原假设 H0,认为 ut非自相关。 (4)若 DW取值在（dL,dU）或（４-dU,4-dL）之间，这种检验没有结论，即不能判别 ut是否存在一阶自相关。判别规则可用图表示。当 DW值落在“不确定”区域时，有两种处理方法。①加大样本容量或重新选取样本，重作 DW检验。有时 DW值会离开不确定区。②选用其它检验方法。 DW 检验表 4 给出 DW 检验临界值。DW 检验临界值与三个参数有关。①检验水平，②样本容量 T,③原回归模型中解释变量个数 k （不包括常数项）。注意：①因为 DW统计量是以解释变量非随机为条件得出的，所以当有滞后的内生变量作解释变量时，DW检验无效。②不适用于联立方程模型中各方程的序列自相关检验。③DW统计量不适用于对高阶自相关的检验。 SPSS可以输出DW值。在回归分析对话框中单击[Statistics] 按钮，打开[Linear Regression:Statistics]子对话框，在[Residuals]栏中选择 [Durbin-Watson]选项，单击[Continue] 按钮返回再单击主对话框[OK]按钮。这样在SPSS的输出结果中将包含DW值，根据该值就可以进行检验。 4、克服自相关如果模型的误差项存在自相关，首先应分析产生自相关的原因。如果自相关是由于错误地设定模型的数学形式所致，那么就应当修改模型的数学形式。怎样查明自相关是由于模型数学形式不妥造成的？一种方法是用残差 et对解释变量的较高次幂进行回归，然后对新的残差作 DW 检验，如果此时自相关消失，则说明模型的数学形式不妥。如果自相关是由于模型中省略了重要解释变量造成的，那么解决办法就是找出略去的解释变量，把它做为重要解释变量列入模型。怎样查明自相关是由于略去重要解释变量引起的？一种方法是用残差 et对那些可能影响因变量但又未列入模型的解释变量回归，并作显著性检验，从而确定该解释变量的重要性。如果是重要解释变量，应该列入模型。只有当以上两种引起自相关的原因都消除后，才能认为误差项 ut“真正”存在自相关。在这种情况下，解决办法是变换原回归模型，使变换后的随机误差项消除自相关，进而利用普通最小二乘法估计回归参数。这种变换方法称作广义最小二乘法。下面介绍这种方法。设原回归模型是 yt=0+1x1t+2x2t+…+kxkt+ut(t=1,2,…,T)() 其中 ut具有一阶自回归形式 ut=ut-1+vt 其中 vt满足通常的假定条件，把上式代入（）式， yt=0+1x1t+2x2t+…+0xkt+ut-1+vt 求模型（）的(t-1)期关系式，并在两侧同乘， yt-1=0+1x1t-1+2x2t-1+…+kxkt-1+ut-1 用（）式与上式相减得 yt-yt-1=0(1-)+1(x1t-x1t-1)+…+k(xkt-xkt-1)+vt() 令 yt*=yt-yt-1, xjt*=xjt-xjt-1,j=1,2,…k 0*=0(1-), 则模型（）表示如下， yt*=0*+1x1t*+2x2t*+…+kxkt*+vt(t=2,3,…T)() 上述变换称作广义差分变换。上式中的误差项 vt是非自相关的，满足假定条件，所以可对上式应用最小二乘法估计回归参数。所得估计量具有最佳线性无偏性。上式中的1…k就是原模型（）中的1…k，而0*与模型（）中的0有如下关系， 0*=0(1-),0=0*/(1-)() 注意：（1）对（）式进行 OLS估计得到的0,1,…,k的估计量称作普通最小二乘估计量；对（）式进行 OLS 估计得到的 0,1,,…,k的估计量称作广义最小二乘估计量。（3）当误差项 ut的自相关具有高阶自回归形式时，仍可用与上述相类似的方法进行广义差分变换。比如 ut具有二阶自回归形式， ut=1ut-1+2ut–2+vt, 则变换过程应首先求出原模型（t-1）期与（t-2）期的两个关系式，然后利用与上述相类似的变换方法建立符合假定条件的广义差分模型。若 ut具有 k阶自回归形式，则首先求 k个不同滞后期的关系式，然后通过广义差分变换使模型的误差项符合假定条件。需要注意的是对二阶自回归形式，作广义差分变换后，要损失两个观测值；对 k阶自回归形式，作广义差分变换后，将损失 k个观测值。（4）当用广义差分变量回归的结果中仍存在自相关时，可以对广义差分变量继续进行广义差分直至回归模型中不存在自相关为止。 5、自相关系数的估计上一节介绍了解决自相关的方法。这种方法的应用还有赖于知道 值。下面介绍两种估计的方法。 (1)用 DW统计量估计。由（）式，DW=2(1-)，得 =1-（DW/2）首先利用残差 et求出 DW 统计量的值，然后利用上式求出自相关系数的估计值。注意：①用此法时样本容量不宜过小。②此法不适用于动态模型（即被解释变量滞后项做解释变量的模型）。 (3) 用残差进行自回归的方法估计（特别对高阶自回归形式）。实验说明：值得注意的是，模型的检验与调整并不是截然分离的，这里只是为了论证方便，认为地将其分为两个阶段去说明。模型的估计、检验和调整通常是一个统一体中的不同侧面，相辅相成；并且模型的估计、检验和调整要进行若干的重复，即所谓的重新估计、重新检验和重新调整，直到模型满意为止。操作要求：具体 Eviews 操作以下面的案例分析为例说明。要求至少用一种方法进行模型多重共线性、异方差型、自相关性的检验，如果存在问题，并运用合适的方法进行修正补救，直到模型满意为止。例 1：关于中国电信业务总量的计量经济模型（多重共线性问题的处理）经初步分析，认为影响中国电信业务总量变化的主要因素是邮政业务总量、中国人口数、市镇人口占总人口的比重、人均 GDP、全国居民人均消费水平。用 1991-1999年数据建立中国电信业务总量计量经济模型。具体数据见表 1 Lny=+–++ ()()()()()() R2=,F=,DW=,T=9,(1991-1999),(3)=, R2=，而每个回归参数的 t检验在统计上都不显著，这说明模型中存在严重的多重共线性。表 1变量 y，x1，x2，x3，x4，x5的数据年电信业务总量邮政业务总量中国人口数市镇人口比重人均 GDP 人均消费水平 y x1 x2 x3 x4 x5 199 1 199 2 199 3 199 4 199 5 199 6 199 7 199 8 199 9 资料来源：《中国统计年鉴》2000 操作步骤与过程： 1、创建工作文件在主菜单上依次单击 File→New→Workfile，选择数据类型和起止日期。时间序列提供起止日期（年、季度、月度、周、日），非时间序列提供最大观察个数。本例中在 StartData 里输入 1991，在 Enddata里输入 1999，单击 OK后屏幕出现 Workfile工作框，如图 6-1所示。工作文件创立后，需将工作文件保存到磁盘，单击工具条中 Save→输入文件名、路径→保存，或单击菜单兰中 File →Save或 Saveas→输入文件名、路径→保存。图 6-1 2、输入和编辑数据在 Object菜单里选 Newobject中的 Group项，进入输入数据的对话框见图 6-2输入 Y、x1、x2、x3、x4、x5数据见图 6-3。图 6-2 图 6-3 数据输入完毕，单击工作文件窗口工具条的 Save或单击菜单兰的 File→Save将数据存入磁盘。 3、建立如下多元线性回归模型，进行参数估计 ln（）用最小二乘法对式（）中的参数进行估计，选 Quick/EstimateEquation项，在弹出的估计对话框中输入变量（图 6-4），点击确定对话参数做 OLS估计，输出结果见图 6-5。图 6-4估计对话框图 6-5回归分析结果由回归结果可以看出 F检验结果是显著的，但是由于可决系数 R2= 很高，可是所有的变量显著性检验都没有通过检验，表明方程存在严重多重共线性。 4、多重共线性诊断下面用 Klein判别法进行分析。首先给出解释变量间的简单相关系数矩阵。用 EViews求相关系数矩阵有如下两种方法： (1)点击 Quick键并依次选择 GroupStatistics,Correlations，将出现一个要求填写序列名的对话框（SeriesList）（图 6-6），填好序列名后按 OK，即可得到相关系数矩阵（图 6-7）。 (2)在 Workfile窗口中用鼠标选中序列名,点击 Show键，OK键，从而打开数据组(Group)窗口。在数据组窗口点击 View键选择 Correlations。图 6-6 图 6-7 因为其中有一个简单相关系数大于 R2=，所以根据 Klein 判别法，模型中存在严重的多重共线性。 5、用逐步回归法修正多重共线性用逐步回归法筛选解释变量。（1）用每个解释变量分别对被解释变量做简单回归，以可决系数为标准确定解释变量的重要程度，为解释变量排序。 Lny=+206x1 ()()R2=,F=204,T=9 Lny=-291x2 ()()R2=,F=555,T=9 Lny=+7075x3 ()()R2=,F=,T=9 Lny=+ ()()R2=,F=,T=9 Lny=+ ()()R2=,F=,T=9 解释变量的重要程度依次为 x2,x3,x1,x4,x5。（2）以 Lny=-291x2为基础，依次引入 x3,x1,x4,x5。首先把 x3引入模型， Lny=-2024x2+ ()()()R2=,F=,T=9 因为 x3的引入使各回归系数的 t 值下降，同时 x3的系数也未通过 t检验，所以应剔除 x3。接着把 x1引入模型， Lny=–– ()()()R2=,F=,T=9 同理剔除 x1引入 x4 Lny=–+ ()()()R2=,F=,T=9 同理剔除 x4引入 x5 Lny=–+ ()()()R2=,F=,T=9 同理剔除 x5，最后确定的模型是（回归结果见图 6-8） Lny=-291x2 ()()R2=,F=555,T=9 图 6-8逐步回归最后确定回归结果或者用解释变量之间相关系数值最小的 x1和 x4同做解释变量与 Lny回归（回归结果见图 6-9），得图 6-9 Lny=–+ ()()()R2=,F=184,T=9 例 2：案例分析（异方差问题的处理） 1、问题的提出和模型设定为了给制定医疗机构的规划提供依据，分析比较医疗机构与人口数量的关系，建立卫生医疗机构数与人口数的回归模型。假定医疗机构数与人口数之间满足线性约束，则理论模型设定为（）其中表示卫生医疗机构数，表示人口数。由 2001 年《四川统计年鉴》得到如下数据。表四川省 2000年各地区医疗机构数与人口数地区人口数（万人） X 医疗机构数（个）Y 地区人口数（万人） X 医疗机构数（个）Y 成都 6304 眉山 827 自贡 315 911 宜宾 1530 攀枝花 103 934 广安 1589 泸州 1297 达州 2403 德阳 1085 雅安 866 绵阳 1616 巴中 1223 广元 1021 资阳 1361 遂宁 371 1375 阿坝 536 内江 1212 甘孜 594 乐山 1132 凉山 1471 南充 4064 2、创建工作文件在主菜单上依次单击 File→New→Workfile，选择数据类型和起止日期。在工作文件定义对话框（图 7-1）中的 “ Workfilestructuretype” 下拉菜单中选择 Unstructured/Undated,在“Datarange”框中输入 21，给工作文件命名为：实验 7案例分析，点击 OK按钮即可建立了新的工作文件。工作文件创立后，需将工作文件保存到磁盘，单击工具条中 Save→输入文件名、路径→保存，或单击菜单兰中 File →Save或 Saveas→输入文件名、路径→保存。图 7-1 2、输入和编辑数据在 Object菜单里选 Newobject中的 Group项，进入输入数据的对话框见图 7-2 输入 Y、x数据见图 7-3. . 图 7-2 图 7-3 数据输入完毕，单击工作文件窗口工具条的 Save或单击菜单栏的 File→Save将数据存入磁盘。 3、建立如下线性回归模型，进行参数估计（）用最小二乘法对式（）中的参数进行估计，选 Quick/EstimateEquation项，在弹出的估计对话框中输入变量（图 7-4），点击确定对参数做 OLS估计，输出结果见图 7-5。图 7-4估计对话框图 7-5回归分析结果估计结果为 Y=+5.*X() 4．检验模型的异方差本例用的是四川省 2000 年各地市州的医疗机构数和人口数，由于地区之间存在的不同人口数，因此，对各种医疗机构的设置数量会存在不同的需求，这种差异使得模型很容易产生异方差，从而影响模型的估计和运用。为此，必须对该模型是否存在异方差进行检验。（一）图形法 a、对 Y 和 X 两变量绘制散点图，在主窗口菜单栏中选择 QuickScatter,弹出图 7-6 所示的对话框，在对话框中输入“XY”, 点击 OK按钮便得到了 X和 Y两变量散点图（见图 7-7）图 7-6序列选择对话框图和 xt散点图从 yt和 xt观测值的散点图（见图）可以发现数据中存在异方差。 b、再对()回归残差平方 E2与 x绘制散点图。具体 EViews软件操作过程：第一步：由路径： Quick/EstimateEquation ，进入 EquationSpecification窗口，键入“ycx”，确认并“ok”，得样本回归估计结果，见图 7-5. 第二步：生成残差平方序列。在得到图估计结果后，立即用生成命令建立序列，记为 e2。生成过程如下，先按路径： Quick/GenerateSeries，进入 GenerateSeriesbyEquation对话框，在弹出的对话框中输入生成序列 E2 的公式“E2=Resid^2”(图 )。图生成新序列对话框即，在 GenerateSeriesbyEquation对话框中（如图）输入“e2= （resid）^2”，则生成序列。第三步：绘制对的散点图。选择变量名 X 与 e2（注意选择变量的顺序，先选的变量将在图形中表示横轴，后选的变量表示纵轴），进入数据列表，再按路径 viewscatter，可得散点图，见图 . 图和 X的散点图第四步：判断。由图看出，残差平方对解释变量 X 的散点图主要分布在图形中的下三角部分，大致看出残差平方随的变动呈增大的趋势，因此，模型很可能存在异方差。但是否确实存在异方差还应通过更进一步的检验。（二）Goldfeld-Quanadt检验 1、EViews软件操作。（1）对变量取值排序（按递增或递减）。在 Procs 菜单里选 SortSeries 命令，出现排序对话框，如果以递增型排序，选 Ascenging，如果以递减型排序，则应选 Descending，键入 X，点 ok。本例选递增型排序，这时变量 Y与 X将以 X按递增型排序。（2）构造子样本区间，建立回归模型。在本例中，样本容量 n=21，删除中间 1/4的观测值，即大约 5个观测值，余下部分平分得两个样本区间：1—8和 14—21，它们的样本个数均是 8个，即。在 Sample菜单里，将区间定义为 1—8，然后用 OLS方法求得如下结果表在 Sample菜单里,将区间定义为 14—21，再用 OLS方法求得如下结果表（3）求 F 统计量值。基于表和表中残差平方和的数据，即 Sumsquaredresid的值。由表计算得到的残差平方和为，由表计算得到的残差平方和为，根据 Goldfeld-Quanadt检验， F统计量为（）（4）判断。在下，式（）中分子、分母的自由度均为 6，查 F分布表得临界值为，因为，所以拒绝原假设，表明模型确实存在异方差。（三）White检验在估计的结果窗口菜单栏（见图 7-10）上，按路径 view/residualtests/whiteheteroskedasticity （nocrosstermsorcrossterms），进入 White 检验对话框（见图 7-11-1 ），在 TestType 中选择 white 方法，并选择上 Includewhitecrossterms,则辅助函数为（）经估计出现 White检验结果，见表。从表可以看出，，由 White检验知，在下，查分布表,得临界值（在（）式中只有两项含有解释变量，故自由度为 2），比较计算的统计量与临界值，因为＞，所以拒绝原假设，不拒绝备择假设，表明模型存在异方差。图 7-11怀特检验菜单项选择图 7-11-1white检验对话框表怀特检验结果 HeteroskedasticityTest:White F-statistic 8 (2,18) Obs*R-squared 1 -Square(2) ScaledexplainedS S 0 -Square(2) TestEquation: DependentVariable:RESID^2 Method:LeastSquares Date:1210Time:23:33 Sample:121 Includedobservations:21 Coeffic ient t-Statist ic Prob. C 823375. 5 X 78 X^2 7 R-squared 5 Meandependentvar 351198. 3 AdjustedR-square d 8 454261. 0 178711. 1 Akaikeinfocriterion 9 Sumsquaredresid +1 1 Schwarzcriterion 1 Loglikelihood 32 Hannan-Quinncriter. 8 F-statistic 8 Durbin-Watsonstat 5 Prob(F-statistic ) 0 5、异方差性的修正（一）加权最小二乘法（WLS）在 Eviews中生成新序列，就在 OLS估计中使用加权处理方式来完成加权最小二乘估计：在主菜单中选择选 Quick/EstimateEquation项，在弹出的估计对话框（图 7-4）中，在窗口的 “ Equationspecification” 栏中输入 YCX, 在 “ Estimationsettings” 的 “ Method” 下拉菜单栏中选择 “LS-LeastSquares(NLSandARMA)”.该窗口填写完毕后点击窗口上方的“Options”按钮出现如图 7-12所示的模型估计窗口。在窗口中选择 WeightedLS/TSLS 选项，再在 Weight 项后填写权数序列名（见图 7-12），在运用 WLS法估计过程中，我们分别选用了权数。权数的生成过程如下，由图，在对话框中的 Weight 处，按如下格式分别键入：；；，单击确定，经估计检验发现用权数的效果最好。下面仅给出用权数的结果(表 7-4)。表 DependentVariable:Y Method:LeastSquares Date:1210Time:23:37 Sample:121 Includedobservations:21 Weightingseries:1/X^2 Coeffic ient t-Statist ic Prob. C 3 X 7 WeightedStatistic s R-squared 9 Meandependentvar 9 AdjustedR-square d 4 7 7 Akaikeinfocriterion 2 Sumsquaredresid . Schwarzcriterion 0 Loglikelihood 89 Hannan-Quinncriter. 1 F-statistic 8 Durbin-Watsonstat 0 Prob(F-statistic ) 6 UnweightedStatist ics R-squared 3 Meandependentvar 3 AdjustedR-square d 9 5 3 Sumsquaredresid 5 Durbin-Watsonsta t 9 表的估计结果如下 Y=+2.*X（）可以看出运用加权小二乘法消除了异方差性后，参数的 t 检验均显著，可决系数大幅提高，F 检验也显著，并说明人口数量每增加 1 万人，平均说来将增加个卫生医疗机构，而不是（）中得出的增加个医疗机构。虽然这个模型可能还存在某些其他需要进一步解决的问题，但这一估计结果或许比（）中的结论更为接近真实情况。例 3：案例分析（自相关问题的处理）一、研究目的 2003年中国农村人口占％，而消费总量却只占 %，农村居民的收入和消费是一个值得研究的问题。消费模型是研究居民消费行为的常用工具。通过中国农村居民消费模型的分析可判断农村居民的边际消费倾向，这是宏观经济分析的重要参数。同时，农村居民消费模型也能用于农村居民消费水平的预测。二、模型设定影响居民消费的因素很多，但由于受各种条件的限制，通常只引入居民收入一个变量做解释变量，即消费模型设定为（）式中，Yt为农村居民人均消费支出，Xt为农村人均居民纯收入，ut 为随机误差项。表是从《中国统计年鉴》收集的中国农村居民 1985-2003年的收入与消费数据。表 -2003年农村居民人均收入和消费单位：元年份全年人均纯收入（现价）全年人均消费性支出（现价）消费价格指数（1985=100）人均实际纯收入（1985可比价）人均实际消费性支出（1985可比价） 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 注：资料来源于《中国统计年鉴》1986-2004。为了消除价格变动因素对农村居民收入和消费支出的影响，不宜直接采用现价人均纯收入和现价人均消费支出的数据，而需要用经消费价格指数进行调整后的 1985 年可比价格计的人均纯收入和人均消费支出的数据作回归分析。具体操作步骤与过程：三、创建工作文件在主菜单上依次单击 File→New→Workfile，选择数据类型和起止日期。在工作文件定义对话框（图 7-1）中的 “ Workfilestructuretype ” 下拉菜单中选择 Dated/regularfrequency,本例中在 StartData里输入 1985，在 Enddata里输入 2003，单击 OK后屏幕出现 Workfile工作框，如图 8-3 所示。给工作文件命名为：实验 8 案例分析，点击 OK按钮即可建立了新的工作文件。工作文件创立后，需将工作文件保存到磁盘，单击工具条中 Save→输入文件名、路径→保存，或单击菜单兰中 File →Save或 Saveas→输入文件名、路径→保存。图 8-3 四、输入和编辑数据在 Object菜单里选 Newobject中的 Group项，进入输入数据的对话框见图 8-4 输入 Y、x数据见图 8-5. . 图 8-4 图 8-5 数据输入完毕，单击工作文件窗口工具条的 Save或单击菜单栏的 File→Save将数据存入磁盘。五、建立如下线性回归模型，进行参数估计（）用最小二乘法对式（）中的参数进行估计，选 Quick/EstimateEquation项，在弹出的估计对话框中输入变量（图 8-6），点击确定对参数做 OLS估计，输出结果见表 8-3。图 8-6估计对话框表 8-3回归分析结果 DependentVariable:Y Method:LeastSquares Date:1210Time:11:21 Sample:3 Includedobservations:19 Coeffic ient t-Statist ic Prob. C 4 X 1 R-squared 1 Meandependentvar 5 AdjustedR-square d 6 0 3 Akaikeinfocriterion 5 Sumsquaredresid 1 Schwarzcriterion 0 Loglikelihood 64 Hannan-Quinncriter. 0 F-statistic 9 Durbin-Watsonstat 8 Prob(F-statistic ) 0 根据表中调整后的 1985年可比价格计的人均纯收入和人均消费支出的数据，使用普通最小二乘法估计消费模型，根据表 8-3可得（8-11） Se=()() t=()() R2=，F=，df=17，DW= 六、序列相关性的检验（1）D．W统计量检验根据表 8-3的参数估计结果可以知道，该回归方程可决系数较高，回归系数均显著。对样本量为 19、一个解释变量的模型、5%显著水平，查 DW统计表可知，dL=，dU=，模型中 DW=<dL，显然消费模型中有自相关。这一点残差图中也可从看出，点击 EViews方程输出窗口的按钮 Resids可得到残差图，如图所示。图残差图图残差图中，残差的变动有系统模式，连续为正和连续为负，表明残差项存在一阶正自相关，模型中 t统计量和 F统计量的结论不可信，需采取补救措施。（3）LM检验在方程工具栏中选择 View/residualTests/SerialCorrelationLMTest，在弹出的图所示的滞后阶数定义对话框中设定滞后阶数，上面已经检验到序列存在一阶自相关，现我们设定滞后的阶数为 2，点击 OK按钮得到 LM 检验结果（见表 8-4）。表中的 LM统计量显示，在 5%的显著性水平上，c2(2)=，因为 LM=TR2=>c2(2)=，所以拒绝原假设，即序列存在二阶序列相关性。图 8-8滞后阶数对话框表 8-4LM检验结果: Breusch-GodfreySerialCorrelationLMTest: F-statistic 7 (2,15) Obs*R-squared 4 -Square(2) TestEquation: DependentVariable:RESID Method:LeastSquares Date:1210Time:11:27 Sample:3 Includedobservations:19 Presamplemissingvaluelaggedresidualssettozero. Coeffic ient t-Statist ic Prob. C 65 X 6 RESID(-1) 5 RESID(-2) 85 R-squared 8 Meandependentvar -1 4 AdjustedR-square d 1 2 4 Akaikeinfocriterion 4 Sumsquaredresid 2 Schwarzcriterion 4 Loglikelihood 38 Hannan-Quinncriter. 4 F-statistic 1 Durbin-Watsonstat 7 Prob(F-statistic ) 7 七、序列相关性的修正（1）已知自相关系数为解决自相关问题，本案例用残差直接自回归的方法估计 r。由模型（）可得残差序列 et，在 EViews中，每次回归的残差存放在 resid序列中，为了对残差进行回归分析，需生成命名为 e的残差序列。在主菜单选择 Quick/GenerateSeries或点击工作文件窗口工具栏中的 Procs/GenerateSeries，在弹出的对话框中输入 e=resid，点击 OK得到残差序列 et。使用 et进行滞后一期的自回归，在 EViews命今栏中输入 lsee(-1)可得回归方程结果如下： et=-1（）由式（）可知=，对原模型进行广义差分，得到广义差分方程（）对式（）的广义差分方程进行回归，在 EViews命令栏中输入 *Y(-1)*X(-1)，回车后可得方程输出结果如表。表用残差直接自回归的方法估计 r的广义差分方程输出结果 DependentVariable:*Y(-1) Method:LeastSquares Date:1210Time:11:39 Sample(adjusted):3 Includedobservations:18afteradjustments Coeffic ient t-Statist ic Prob. C 6 *X(-1) 1 R-squared 2 Meandependentvar 5 AdjustedR-square d 9 0 0 Akaikeinfocriterion 6 Sumsquaredresid 9 Schwarzcriterion 7 Loglikelihood 39 Hannan-Quinncriter. 7 F-statistic 5 Durbin-Watsonstat 5 Prob(F-statistic ) 0 由表可得回归方程为（） se=()（） t=（）（） R2===16DW= 式中，。由于使用了广义差分数据，样本容量减少了 1 个，为 18 个。查 5% 显著水平的 DW统计表可知 dL=，dU=，模型中 DW=>dU，说明广义差分模型中已无自相关，不必再进行迭代。同时可见，可决系数 R2、t、F统计量也均达到理想水平。对比模型（）和（），很明显普通最小二乘法低估了回归系数的标准误差。[原模型中 Se（）=，广义差分模型中为 Se（）=。经广义差分后样本容量会减少 1个，为了保证样本数不减少，可以使用普莱斯—温斯腾变换补充第一个观测值，方法是和。在本例中即为和。由于要补充因差分而损失的第一个观测值，所以在 EViews 中就不能采用前述方法直接在命令栏输入 Y和 X的广义差分函数表达式，而是要生成 X和 Y的差分序列 X*和 Y*。在主菜单选择 Quick/GenerateSeries或点击工作文件窗口工具栏中的 Procs/GenerateSeries，在弹出的对话框中输入 Y*=*Y(-1)，点击 OK得到广义差分序列 Y*，同样的方法得到广义差分序列 X*。此时的 X*和 Y*都缺少第一个观测值，需计算后补充进去，计算得=，=275.，双击工作文件窗口的 X*打开序列显示窗口，点击 Edit+/-按钮，将=到 1985年对应的栏目中，得到 X*的 19个观测值的序列。同样的方法可得到 Y*的 19个观测值序列。在命令栏中输入 LsY*cX*得到普莱斯—温斯腾变换的广义差分模型回归结果（见表 8-6）为: 表 8-6：普莱斯—温斯腾变换的广义差分模型回归结果 DependentVariable:Y1 Method:LeastSquares Date:1210Time:11:53 Sample:3 Includedobservations:19 Coeffic ient t-Statist ic Prob. C 0 X1 3 R-squared 6 Meandependentvar 6 AdjustedR-square d 3 3 4 Akaikeinfocriterion 6 Sumsquaredresid 1 Schwarzcriterion 1 Loglikelihood 01 Hannan-Quinncriter. 1 F-statistic 1 Durbin-Watsonstat 1 Prob(F-statistic ) 0 由表 8-6，可得到普莱斯—温斯腾变换的广义差分模型回归结果为（）（） t=（（） R2===19DW= 对比模型（）和（）可发现，两者的参数估计值和各检验统计量的差别很微小，说明在本例中使用普莱斯—温斯腾变换与直接使用科克伦—奥克特两步法的估计结果无显著差异，这是因为本例中的样本还不算太小。如果实际应用中样本较小，则两者的差异会较大。通常对于小样本，应采用普莱斯—温斯腾变换补充第一个观测值。由差分方程（）有（）由此，我们得到最终的中国农村居民消费模型为 Yt=+（）由（）的中国农村居民消费模型可知，中国农村居民的边际消费倾向为 ,中国农民每增加收入 1 元，将增加消费支出元。（2）未知自相关系数（用科克伦-奥科特迭代法）假设检验到模型（）存在 p阶序列相关，用科克兰内-奥克特法对模型进行修正，直接在 Eviews中输入命令 LSYCXAR(1)AR(2)-----AR(p) 或在图 8-6 所示的方程估计对话框中输入 YCXAR(1)AR(2)-----AR(p)，便可以得到修正后的参数估计结果。见表 8-7 表8-7科克伦-奥科特迭代法回归结果： DependentVariable:Y Method:LeastSquares Date:1210Time:12:01 Sample(adjusted):3 Includedobservations:17afteradjustments Convergenceachievedafter5iterations Coeffic ient t-Statist ic Prob. C 4 X 9 AR(1) 3 AR(2) 58 R-squared 2 Meandependentvar 6 AdjustedR-square d 1 1 0 Akaikeinfocriterion 5 Sumsquaredresid 8 Schwarzcriterion 5 Loglikelihood 56 Hannan-Quinncriter. 3 F-statistic 1 Durbin-Watsonstat 4 Prob(F-statistic ) 0 InvertedARRoots . i .39+.52i Y=+*X+[AR(1)=,AR(2)=] 取 a=5%，DW>du=1..401(样本容量:19) 表明:广义差分模型已不存在序列相关性。实验七：经济计量模型建模----模型计量结果的分析（实验学时： 2）实验内容：经过检验证明所估计的模型是符合要求的，最后应对模型所提供的数量信息作具体的分析。根据建立模型的目的，可能是经济结构分析、经济预测、政策评价，其中经济预测和政策评价都要以所确立的经济结构为基础。实验说明：对实证分析结果的解释力度做出说明，主要体现在对回归系数的符号、大小以及检验结果的解释方式上。操作要求：具体问题具体分析，注重分析角度全面、定性与定量分析相结合，应对所估计的参数数值与符号的经济意义做具体研究和评价。除了必须做一般性的解释外，如回归系数的符号、大小和统计显著性等，还可以从灵敏度分析、弹性分析等多个角度，对回归系数的经济意义进行说明，也可从不同估计方法差异性比较的角度进行解释。实验八：经济计量模型建模----研究结果的报告（实验学时：2）实验内容：实证项目的计量经济研究的结论得到以后，为了让别人了解研究的成果，应形成研究报告（或课程论文）。实训报告通常可以考虑包括的内容如下：引言、理论分析与研究思路、计量经济模型与估计方法、数据及处理、结果分析、结论。 1、引言一定要非常清楚地在引言中交代如下几个问题：第一，本文研究了什么问题。直接在文章开头写：本文研究了什么什么问题，显得很清楚，开门见山。人们看你文章的第一个目的就是发现你的文章为什么重要。当你提出问题以后，你要去告诉别人为什么重要，这里面你就需要说明创新，这时你就要把你的文章和既有的文献作比较，这就涉及到了文献评论。如果文献评论不是非常长时，你可以把他简单地放在引言部分。如果比较长，可以把最主要的、最经典的、最有意义的放在这里，突出你研究的重要性和创新，其余放在第二部分文献综述中再去说。第三就是概括你的工作，很清楚地告诉大家你解决了什么问题。千万不要只说本文研究了什么。问题这么多，你需要告诉大家你解决了什么问题，运用了什么方法。 2、理论分析与研究思路接下来，我们来看理论怎么做，实证怎么做。先讲理论。无论数学模型也好，用文字表述的理论也好，你首先要界定问题是什么，你要揭示的现象是什么，界定哪些因素对这个问题是重要的。接下来我们讲实证。你首先要知道你想看什么，你模型背后的理论基础是什么，这些决定了你放什么变量。因为在不同的理论机制下，可以有不同的解释变量，这完全取决于你想看什么。我特别强调，要注意阅读文献，了解文献中的变量是怎么设置的，怎么度量的，十分重要。千万不要不知所以地往模型塞变量。实证模型的设定要跟着理论走。 3、计量经济模型与估计方法对自己所建的计量经济学模型进行系统全面地论述。主要包括两个方面的内容：一是关于模型的描述、对整个建模思路进行说明，替别是研究的主要对象（被解释变量）的确定、影响因素的分析及解释变量的选择、模型函数形式的假设等；二是关于推断方法的描述，主要是选择得估计和假设检验的方法，指出所用方法与他人在研究类似问题所使用的方法的差异性。这里要注意显著变量的处理问题，很多人喜欢把不显著变量扔掉，但如果这个不显著的变量是应该控制的，那么，把它扔到了残差项里的话，就可能导致遗漏变量偏误。那么最后一个问题是：R平方高不高是不是问题？很多同学在做实证文章的时候常常问，我的 R平方只有到，也就是说我的模型只能解释数据的 8%到 9%。我说恭喜你，已经不错了，因为在实证文章里有时 R平方只有。R平方是什么意思？就是说，我们的模型能解释数据的 variance的多少，可能对于绝大部分的 variance的解释，经济学家是不知道的。 4、数据的处理这里要强调数据可以截面的、可以是面板的，数据来源可以是公开的、可以是调查的。实证研究里，经常被大家提到的问题就是内生性问题，这主要就是说你观察到的一个变量对另一个变量的影响并不一定完全是它对另一个变量的影响。比如，教育程度高的人收入水平也高，但收入水平高是不是因为受教育程度高？不一定。因为教育程度高的人能力也高，所以这里面就存在一个估计偏误问题，属于遗失变量的内生性问题。两个实际变量有共同时间趋势，放在一起看来是相关的，但是只是因为它们有共同时间趋势而已，这是伪回归问题。 5、结果分析结果分析包括给出规范格式报告回归分析计算结果，以及估计和假设检验结果经济意义的解释，还包括关于模型解释力度的讨论等。 6、结论在论文的结论部分，我建议大家的是要准确，不能夸大。你不能总结出一个你的模型没有说明的结论。政策含义最好有，但不一定必要。如果有，一定要是严格基于理论发现的结论。不基于理论发现的结论，哪怕是正确的也不要说。因为你是在做科学的论文，而不是政策建议的报告。如果是后者，没问题，你可以基于别人的理论。有一个误区就是我们很多作者写文章，写了一大堆的政策结论，每一句话都对，但真正跟他有关系的没多少。最后也可以提出若干未解决的问题，这在写文章时起到的作用有两个：一、在自己写完以后告诉读者这篇文章什么问题没解决；二、如果你的文章里存在缺陷，自己讲出来要比审稿人讲好，与其让审稿人讲，不如主动交代。此外，不要迷信别人在文章中提到的没有解决的问题，道理很简单，如果这个问题是可以解决的，作者早就解决了。不要因为别人提到这是个有待研究的方向你就去做，因为作者这样写，可能是解决不了审稿人认为应该解决的问题，就跟审稿人讲您说的是对的，但这个问题已超出了本文研究的范围，我已经在文章的结尾将这个问题作为未来研究的方向提出来了。我想经济学家都是这么做的。你在理解别人提出的未来研究方向时，一定要小心，听听在这个领域专家的看法非常重要，那些专家可以告诉你这些问题是否真的可以做。实验说明： 1、研究报告并没有固定的格式，上述实验内容只是对通常可以考虑包括的内容提供一些建议。 2、附录中，给出了一篇本科学生计量经济学课程论文的示例，这是一篇对经济理论做实际验证性质的研究报告。应当指出，这里只是作为实证项目研究报告形式的举例，对于报告中的内容和方法是否恰当，大家可以充分展开讨论。操作要求：具体 Eviews 操作同前。参看附录文章，每位同学完成一份感兴趣论题的实训报告，不少于 5000 字，在个人成绩评定中占 60%；同时每位同学要完成小结报告，便于口试陈述，在个人成绩评定中占 40%。附录：实证项目研究（实训报告）示例 1：人民币汇率调整对金鹰包装制品公司出口收入影响的实证分析引言纸制品包装行业在全国包装行业七大门类中，纸包装业的产值排在首位，约占 37%。这些年随着国民经济的发展和人民物质文化生活水平的提高，纸包装业发展的速度很快。随着中国进入 WTO，许多纸包装企业也开始开拓海外市场，转变了以前单一的销售渠道。北京金鹰包装制品有限公司是一家生产纸包装的民营企业。从 2003年以来金鹰公司开始从事出口贸易，2008年年出口额为 20，489，元人民币。在这期间正值我国汇率制度改革，从 2005年 7月 21日，我国开始实施以市场供求为基础、参考一篮子货币进行调节、有管理的浮动汇率制度，截止到 2009年 4月 1日，人民币升值的幅度已经超过 21%。理论上认为人民币升值会对出口企业产生影响，但人民币升值对出口企业个体的影响程度我们并不能一概而论。为此，本文以北京金鹰包装制品有限公司为例从人民币汇率变动的情况出发，对人民币升值对出口企业的影响和对策进行了分析和探讨。本文尝试运用微观定量的实证分析方法，并以国际贸易理论为基础，通过对北京金鹰包装制品有限公司将近 5 年的经济数据进行经济计量分析，估计出金鹰公司出口收入与人民币汇率以及金鹰公司总产值的多元线性回归模型。并结合金鹰公司的实际情况，根据分析结果，对金鹰公司今后的发展提出相应的建议和对策。 1人民币汇率变动情况概述及相关理论人民币汇率调整历程我国加入 WTO 已经进入了第八个年头，在这八年中随着我国对外开放的不断深入，人民币汇率制度不断的改革与完善，人民币汇率水平调整的幅度有不断扩大的趋势。自 1994 年以来，从市场的角度看，人们对人民币汇率的预期也经历了一个从预期贬值到预期升值、升值、持续升值的相对完整的转变过程。表 1-1人民币汇率变化表（单位：元）年份人民币汇率年均值环比升值率 1994 1995 1996 1997 1998 1999 -05 2000 -05 2001 2002 -06 2003 -05 2004 -05 2005 2006 2007 2008 东南亚金融危机期间及结束后一段时间，国际市场乃至国内市场上，人们普遍预期人民币会像周边国家货币一样采取贬值的作法。杨帆（1999）认为，亚洲金融危机过程中，周边国家货币纷纷贬值使得我国出口增速减缓，我国没有必要也没有力量对亚洲地区经济承担稳定的责任，要改变国际市场不利状况，人民币存在贬值的可能性。过了不到两年的时间，市场参与者的预期发生了逆转，预期人民币升值的看法逐渐盛行。温思凯（2004）认为，由于我国国际收支“双顺差”余额不断扩大，人民币的升值压力逐渐显现。近两年我国市场参与者开始对人民币升值现状进行反思。宋晓金（2008）认为，在现阶段人民币币值并没有被严重低估，而是被高估中国政府应抵住各方压力，通过制定相应的外贸政策来保持经济平稳发展。图 1-11994年-2008年人民币汇率调整折线图 1994 年 1 月 1 日起,我国实现人民币汇率并轨,实行以市场供求为基础的、单一的、有管理的浮动汇率制。到 1996 年底,人民币汇率由并轨初的 1美元兑换元人民币升至 1 美元兑换元人民币。1998 年之后,人民币汇率始终在较窄范围内浮动,人民币兑 1美元保持在～元之间。 1998～2005 年 7 月 21 日,人民币汇率钉住了美元,基本保持不变自 2005 年 7 月 21 日起,我国开始实行以市场供求为基础、参考一篮子货币进行调节、有管理的浮动汇率制度。人民币汇率不再盯住单一美元,形成更富弹性的人民币汇率机制。自 2005年 7月 21日 19∶00时人民币对美元交易价格调整为 1 美元兑元人民币以来,人民币持续升值,到 2009 年 4 月 1 日,人民币对美元汇率中间价为 1 美元兑元人民币,升值幅度达 128%。汇率变动对贸易收支影响理论汇率是一个国家进行国际经济活动时最重要的综合性价格指标,它的变化对一国对外贸易的平衡与国内经济活动的波动都具有深刻的影响。名义汇率名义有效汇率是一种指数,它是对本国和其贸易伙伴国及竞争国的双边汇率指数的一种加权平均。实际汇率实际有效汇率则是在名义有效汇率的基础上剔除本国物价相对于贸易伙伴国本国物价的上涨因素,它也可以表示为一种对双边实际汇率的加权平均指数。它反映了本国和贸易伙伴国家的物价水平的相对变化对本国货币实际购买力的影响,是一种多边实际汇率。实际有效汇率不仅考虑了所有双边名义汇率的相对变动情况,而且还剔除了通货膨胀对货币本身价值变动的影响,能够综合地反映本国货币的对外价值和相对购买力。自 1994 年起至 2005 年 7 月,我国一直实行盯住美元的汇率制度。虽然 07年改革后改为一篮子汇率制度。我国汇率受美元汇率变动影响很深,而且研究发现,名义汇率的变动和实际汇率的变动高度相关,本文据此直接采用数据最容易收集的名义汇率。我国包装行业出口贸易发展现状包装行业主要分三大类：纸制品包装、塑料制品包装、金属制品包装。其中纸制品包装出口贸易在我国包装行业对外经贸往来中占有举足轻重的地位，据我国海关统计，2008 年第一季度我国纸制品（海关税号：）出口数量为亿公斤，比 2007年同期增长 %；出口金额为亿美元,同比增长 %。纸制品包装行业在北京同样也是出口创汇商品。据石家庄海关统计，2009年 1-4月北京市纸及纸板；纸浆、纸或纸板制品出口 23, 千美元；其中 4 月北京市纸及纸板；纸浆、纸或纸板制品出口 8,千美元。人民币汇率变动与纸制品包装出口贸易之间的关系在进行国际贸易时，其他条件相对稳定时，汇率是影响商品进出口的重要因素之一，是相对价格。一般来讲，其他 05. 7- 09. 3我国纸制品出口额, 汇率变化折线图 - 2 - 1. 5 - 1 - 0. 5 0 0. 5 1 200 7年 7月 200 7年 9月 200 7年 11月 200 8年 1月 200 8年 3月 200 8年 5月 200 8年 7月 200 8年 9月 200 8年 11月 200 9年 1月 200 9年 3月时间我国纸制品月环比出口额我国汇率月环比出口额( %) 条件不变时，本国货币对外升值，则在外国市场上，以外币表示的本国商品的价格会升高，这样，外国居民对本国商品的需求会减少，相应地，本国商品的出口会下降，在出口需求弹性较大时，会造成出口收入降低；在出口需求弹性较小时，出口收入会增加。反之则相反。图 1-22005年 7月-2009年 3月我国制止品出口额、汇率变化折线图 2实证模型构建准确地把握人民币汇率变化对出口贸易的影响，我们还得采用实证的分析方法。因为：第一，影响出口贸易的因素是多种多样的，有的是正面的因素，有的是负面的因素；第二，影响出口贸易因素的贡献大小不一样，有的影响大，有的影响小，有的影响因素直觉大实际小，有的影响因素知觉小但实际大；第三，在出口贸易不断多元化的背景下，仍然用人民币兑美元汇率的变化作为人民币升值的依据去解释对出口的影响，具有较大的片面性。关于模型的说明为了便于分析，研究人民币汇率、公司生产总值与纸制品包装出口收入之间的关系时，模型设计可将其他因素作为外生变量来看待；由于人们所看到的是变量人民币汇率中间价，所以模型中人民币汇率和纸制品包装出口收入变量均直接采用货币值。这样，可以将模型设计为： (2-1) ----代表对出口收入取自然数为底的对数； ----代表对人民币名义汇率取自然数为底的对数； ----代表对月生产总值取自然数为底的对数； ----为模型的随机干扰项。和为偏回归系数；为截距项；为随机干扰项。本文利用多元线性回归方法对北京金鹰包装制品有限公司（以下称为简称为公司）的历史数据进行分析，并据此初步判断人民币名义汇率和金鹰公司总产值对公司出口收入的影响。上述模型一个隐含的前提是除人民币汇率以及公司总产值，其他影响出口收入的要素都不发生变化。这些要素包括原材料价格、替代品价格，人民币实际汇率等微观及宏观变量。事实上，社会经济系统是动态的，其内部各要素都处于不断的变化发展过程中，这些因索的变化发展又最终推动了社会经济系统的发展和变化。由此，上述模型适合于在其他变量保持不变的情况下对公司出口收入的变化进行描述。一旦这些要素发生了变化，该模型就不能很好地对现实进行拟合。得出回归方程之后，再对回归拟合的显著性进行检验，主要是进行 t 检验，例如以判断人民币汇率对公司出口收入是否有显著影响。其次要进行模型整体线性关系是否成立的 F检验。根据汇率决定理论，如果人民币币值变动是公司出口收入的约束因素，那么，长期来看，人民币升值会使得公司纸制品包装出口收入降低；又由于人民币名义汇率，人民币汇率值减小表示人民币对外升值。所以，如果模型符合理论分析，则β1值应该为正。相关数据——指标的选取、测算口径及时段基于统计数据的可获得性，本文采用 2005年 1月-2009 年 3月北京金鹰包装制品有限公司出口收入为因变量、2005 年 1月-2009年 3月人民币名义汇率中间价月平均值和公司月生产总值来作为自变量，并分别对以上原始数据取自然数为底的对数。公司出口收入数据选自《金鹰包装制品有限公司销售纪录》，包含 2005年 1月到 2009年 3月共 46（51个数据剔除个别月份出口收入为 0的）个月的金鹰公司的出口收入；人民币名义汇率中间价数据选自外汇管理网站。表出口数据及人民币汇率表（单位：元）序号汇率月出口收入生产总值 1 7,327, 13,590, 2 8,977, 16,650, 3 6,930, 12,854, 4 6,680, 12,389, 5 8,130, 15,079, 6 7,890, 14,634, 7 13,421, 24,892, 8 17,165, 31,836, 9 16,212, 30,070, 10 14,577, 27,037, 11 24,207, 44,961, 12 16,715, 31,022, 13 550, 14,392, 14 99, 8,886, 15 1,442, 11,411, 16 31, 8,744, 17 548, 9,806, 18 342, 10,195, 19 662, 15,110, 20 770, 16,012, 21 418, 15,455, 22 291, 15,736, 23 225, 7,225, 24 238, 9,033, 25 276, 7,178, 26 2,314, 8,090, 27 712, 8,096, 28 1,626, 6,806, 29 1,647, 7,718, 30 614, 8,051, 31 494, 8,688, 32 582, 7,245, 33 952, 7,768, 34 1,270, 6,093, 35 573, 6,763, 36 3,139, 7,697, 37 2,148, 8,051, 38 2,921, 10,233, 39 1,976, 10,061, 40 2,351, 10,258, 41 2,011, 9,074, 42 727, 8,215, 43 2,416, 10,404, 44 2,359, 9,929, 45 782, 7,219, 46 3,302, 7,572, 图时间序列分布图：从图 2-1，我们可以看出，中间部分明显出现大幅度的波动。直观来看出口收入与生产总值的关系相当明显。回归的估计与分析对模型的初步回归和分析我们利用原始数据和 Eviews软件进行多元回归分析，建立如式（2-1）的回归模型，并对模型的显著性进行分析。 Eviews回归结果如下表 2-2：表 2-2Eviews回归结果 DependentVariable:LOG(EX) Method:LeastSquares Date:1210Time:21:48 Sample(adjusted):2005M012008M10 Includedobservations:46afteradjustments Coeffic ient t-Statist ic Prob. C 21 LOG(RATE) 98 LOG(PRODUCT) 9 R-squared 4 Meandependentvar 0 AdjustedR-square d 0 9 9 Akaikeinfocriterion 1 Sumsquaredresid 6 Schwarzcriterion 0 Loglikelihood 42 Hannan-Quinncriter. 6 F-statistic 4 Durbin-Watsonstat 7 Prob(F-statistic ) 1 根据表2-2，可以建立如下回归方程：（2-2）从表2-2可以看出，经T检验，当月汇率取对数（）和当月生产总值取对数（）的概率p值分别为和，按给定的显著性水平的情形下，均有显著意义。偏回归系数度量了出口收入对汇率的弹性，即在生产总值保持不变的条件下，汇率升水率每增加一个百分点，平均月出口收入将增加 %。类似地，在汇率保持不变的条件下，月生产总产值每增加一个百分点，月平均出口收入将增加%。从表 2-2 可以看出，模型观察值的 F 统计量的值为，概率率 p值为，在显著性水平为的情形下，可以认为当月出口收入取对数（）与当月利率取对数（）和当月生产总值取对数（）之间有整体线性关系。对模型回归诊断由于线性回归模型参数估计的最小二乘法是建立经典假设基础之上的，所以有必要对模型是否满足基本假设进行分析。第一，判断模型中随机干扰项是否服从正态分布。从图 2-3 可以看出残差分布基本是一个左偏的正态分布；残差的 J-B 统计量下显示的概率值（P 值）是，不能拒绝原假设,残差服从正态分布。图 2-3回归标准化残差的直方图第二，对模型是否存在多重共线性进行检验。表 2-3变量相关系数矩阵 LNEX LNPRODUCT LNRATE LNEX LNPRODUCT LNRATE 从表 2-3 中可以看出，各变量间的 Peaeson 相关系数，当月利率取对数和当月生产总值取对数存在相关性，但相关程度不高。方程有可能存在多重共线性问题，但是由于多重共线性的主要问题在于使参数估计量的方差变大。参数估计量的方差是由随机干扰项的方差、变量的变异程度与方差膨胀因子一起决定的。如果存在多重共线性，但随机干扰项的方差很小，或变量的变异程度很大，都可能得到较小的参数估计量的方差。这时，即使有严重的多重共线性，也不会带来不良后果。因此，只要回归方程估计的参数标准差值为很小，t 统计值为较大，就没有必要过于关心是否存在多重共线性问题。在模型中，从表 2-2 中得到该值为 ,比较小，同时可以从表 2-2 中看到 t 值比较大。所以，本模型中多重共线性问题不必过于关心。第三，检验模型是否存在异方差。首先从图 2-4可以看到残差平方对被解释解释变量估计值的散点图主要分布在图形中的下三角部分，大致看出残差平方随的变动呈增大的趋势，因此，模型很可能存在异方差。但是否确实存在异方差还应通过更进一步的检验。图 2-4与预测值的散点图其次可进行怀特异方差检验：参看表 2-4 表 2-4怀特异方差检验结果 HeteroskedasticityTest:White F-statistic 6 (5,40) Obs*R-squared 2 -Square(5) ScaledexplainedSS -Square(5) 2 TestEquation: DependentVariable:RESID^2 Method:LeastSquares Date:1210Time:22:21 Sample:2005M012008M10 Includedobservations:46 Coeffic ient t-Statist ic Prob. C 65 LOG(RATE) 52 (LOG(RATE))^2 1 (LOG(RATE))*(LOG(PRODU CT)) 77 LOG(PRODUCT) 6 (LOG(PRODUCT))^2 55 R-squared 1 Meandependentvar 0 AdjustedR-squared 6 7 6 Akaikeinfocriterion 6 Sumsquaredresid 3 Schwarzcriterion 4 Loglikelihood 80 Hannan-Quinncriter. 6 F-statistic 6 Durbin-Watsonstat 3 Prob(F-statistic) 5 从表 2-4可以看出，，由 White检验知，在下，查分布表,得临界值（在（2-1）式中只有两项含有解释变量，故自由度为 5），比较计算的统计量与临界值，因为＞，所以拒绝原假设，不拒绝备择假设，表明模型存在异方差。第四，检验模型是否存在序列相关性。首先从图 2-5以看出，残差并不是随机分布。它事实上呈现出明显的变动模式—开始是正的，接着变负的，然后又是正的，再然后又是负的，最后又是正的。如果将对描图，如图 2-6所示，则看的更清楚。图 2-6表明存在着正相关：大多数残差都分布在第一象限和第三象限。另外，从表 2-2知原始回归模型的 D-W 值等于，即。根据 D-W表，对于 n=45(最接近本例的样本容量 46），k=2,在 5%的显著水平下，。由于远低于下临界值，根据德宾---沃森 d检验判定规则，我们得出结论：原始回归模型的残差存在正的序列自相关。图 2-5回归方程（2-1）的残差图 2-6方程（2-1）的残差和对模型采取补救措施由以上回归诊断分析可知模型存在序列相关性，会造成模型参数估计虽然是无偏的，但不再是有效的。这样会造成显著性检验不再可靠。所以，要采取措施弥补存在序列相关性所造成的后果。在此主要是先用拉格朗日乘数检验法判断到底存在几阶自相关回归，然后用杜宾两步法进行修正。第一，拉格朗日乘数检验。首先，对 2阶滞后残差项的辅助模型进行回归。表 2-5LM检验结果（2阶滞后残差项的辅助模型进行回归）： Breusch-GodfreySerialCorrelationLMTest: F-statistic 9 (2,41) Obs*R-squared 8 -Square(2) TestEquation: DependentVariable:RESID Method:LeastSquares Date:1210Time:22:46 Sample:2005M012008M10 Includedobservations:46 Presamplemissingvaluelaggedresidualssettozero. Coeffic ient t-Statist ic Prob. C 1 LOG(RATE) 5 LOG(PRODUCT) 71 RESID(-1) 8 RESID(-2) 6 R-squared 9 Meandependentvar - 15 AdjustedR-square d 8 2 5 Akaikeinfocriterion 6 Sumsquaredresid 6 Schwarzcriterion 1 Loglikelihood 53 Hannan-Quinncriter. 5 F-statistic 4 Durbin-Watsonstat 3 Prob(F-statistic ) 2 由表 2-12得出下列 2阶滞后残差项的辅助方程：（2-4）于是，,该值大于显著水平为 5%，自由度为 2的，由此判断原模型存在 2阶序列自相关性。其次，对 3阶滞后残差项的辅助模型进行回归分析，判断原模型是否存在 3阶序列自相关性。表 2-6格朗日乘数检验，含 3阶滞后残差项的模型摘要 Breusch-GodfreySerialCorrelationLMTest: F-statistic 8 (3,40) Obs*R-squared 7 -Square(3) TestEquation: DependentVariable:RESID Method:LeastSquares Date:1210Time:22:50 Sample:2005M012008M10 Includedobservations:46 Presamplemissingvaluelaggedresidualssettozero. Coeffic ient t-Statist ic Prob. C 3 LOG(RATE) 5 LOG(PRODUCT) 64 RESID(-1) 4 RESID(-2) 2 RESID(-3) 8 R-squared 4 Meandependentvar - 15 AdjustedR-square d 1 2 3 Akaikeinfocriterion 9 Sumsquaredresid 9 Schwarzcriterion 7 Loglikelihood 03 Hannan-Quinncriter. 9 F-statistic 6 Durbin-Watsonstat 5 Prob(F-statistic ) 7 由表 2-6出下列 3阶滞后残差项的辅助方程：（2-5）于是，,该值大于显著水平为 5%，自由度为 3的，由此判断原模型存在 3阶序列自相关性，但由于的参数不显著，说明不存在 3阶序列自相关性。第二，下面采用科克伦-奥科特迭代法进行自相关系数的估计表2-7科克伦-奥科特迭代法进行自相关系数的估计结果： DependentVariable:LNEX Method:LeastSquares Date:1210Time:22:55 Sample(adjusted):2005M032008M10 Includedobservations:44afteradjustments Convergenceachievedafter13iterations Coeffic ient t-Statist ic Prob. C 75 LNRATE 60 LNPRODUCT 8 AR(1) 7 AR(2) 7 R-squared 6 Meandependentvar 2 AdjustedR-square d 8 4 4 Akaikeinfocriterion 8 Sumsquaredresid 1 Schwarzcriterion 7 Loglikelihood 77 Hannan-Quinncriter. 7 F-statistic 6 Durbin-Watsonstat 3 Prob(F-statistic ) 0 InvertedARRoots .83 LNEX=*LNRATE+2.*LNPRODUCT+[AR(1)=,AR(2)=] （2-7）其中,AR(1),AR(2)前的参数值即为随机干扰项的 1阶与 2阶序列相关系数。其次，作差分变换： (2-8) 则关于和的 OLS估计结果见表 2-8： DependentVariable:*LNEX(-1)*LNEX(-2) Method:LeastSquares Date:1210Time:23:11 Sample(adjusted):2005M032008M10 Includedobservations:44afteradjustments Coeffic ient t-Statist ic Prob. C 34 *LNRATE(-1) 6*LNRATE(-2) 14 *LNPRODUCT-(-1 )*LNPRODUCT-(-2) 0 R-squared 7 Meandependentvar 7 AdjustedR-squared 8 1 5 Akaikeinfocriterion 3 Sumsquaredresid 8 Schwarzcriterion 3 Loglikelihood 18 Hannan-Quinncriter. 7 F-statistic 7 Durbin-Watsonstat 3 Prob(F-statistic) 6 表 2-8广义差分结果（2-9）已经不存在自相关性。对（2-9）的回归结果进行怀特检验，检验结果见表 2-9。表2-9：对（2-9）的回归结果进行怀特检验的结果 HeteroskedasticityTest:White F-statistic 5 (5,38) Obs*R-squared 5 -Square(5) ScaledexplainedSS 1 -Square(5) TestEquation: DependentVariable:RESID^2 Method:LeastSquares Date:1210Time:23:15 Sample:2005M032008M10 Includedobservations:44 Coeffic ient t-Statist ic Prob. C 64 *LNRATE(-1) 6*LNRATE(-2) 6 (*LNRATE(-1) 56*LNRATE(-2))^2 1 (*LNRATE(-1) 56*LNRATE(-2))*( 39*LNPRODUCT-(-1)*LNPROD 29 UCT-(-2)) *LNPRODUCT-(-1 )*LNPRODUCT-(-2) 2 (*LNPRODUCT-(- 1)*LNPRODUCT-(-2))^2 4 R-squared 6 Meandependentvar 7 AdjustedR-squared 9 9 7 Akaikeinfocriterion 7 Sumsquaredresid 5 Schwarzcriterion 5 Loglikelihood 17 Hannan-Quinncriter. 4 F-statistic 5 Durbin-Watsonstat 7 Prob(F-statistic) 7 从表 2-9以看出，，由 White检验知，在下，查分布表,得临界值（在（2-9式中只有两项含有解释变量，故自由度为 5），比较计算的统计量与临界值，因为《，所以不拒绝原假设，表明模型不在异方差。1 为了与原始回归方程 OLS估计结果对比，计算：（2-10）于是原模型为：（2-11）偏回归系数度量了出口收入对利率的弹性，即在生产总值保持不变的条件下，汇率升水率每下调一个百分点，平均月出口收入将增加 %。类似地，在汇率保持不变的条件下，月生产总产值每增加一个百分点，月平均出口收入将增加 %. 模型回归结果的分析模型回归结果，自变量 lnrate、lnproduct 与因变量 lnex之间的关系分别为负相关和正相关的关系。也就是说，人民汇率变动与金鹰公司出口收入变动之间是负相关，而金鹰公司总产值与金鹰公司出口收入变动之间是正相关。更具体地说，在这一段时间，在公司总产值不变得情况下，随着近年来我国人民汇率的不断升值金鹰包装制品有限公司出口收入是不断减少的；另一方面，在人民币汇率不变的情况下随着公司总产值不断增加，金鹰公司出口收入是不断增加的。我们可以清晰地从回归结果当中发现人民币升值是影响金鹰公司出口收入的制约因素。在生产总值保持不变的条件下，利率每下调一个百分点，平均月出口收入将增加 %。这一结果与贸易理论相一致。从长远的角度来看，人民币升值对金鹰公司出口情况未必只有负面影响。我国纸包装行业还属于低附加值的产业结构，人民币汇率的提高间接的迫使企业进行产业结构调整，加快从一般加工业为主向先进制造业和高新技术产业为主转变。使产品以高质量、高技术的特点立于国际市场。另一方面公司生产总值的增加对金鹰公司出口收入是有积极影响的。在利率保持不变的条件下，月生产总产值每增加一个百分点，月平均出口收入将增加 %。公司从 03年开始开拓国际市场到现今已经有 6年时间。比较 03年公司年生产总值 64,556, 元 08 年年生产总值为 110,672,元已经将近翻了一翻。开辟国际市场使企业有了更宽的销售渠道，促进企业扩大再生产使企业快速成长；同样地企业扩大再生产使生产能力增强是企业更大份额的占领国际市场有力保障。综合来看，上述初步参数估计没有很完美的反映 ——年期间人民币汇率变动、生产总值对金鹰公司出口收入的影响。究其原因，很有可能在于我们前提假设不能够成立，即金鹰公司在 ——出口收入，同样受到原材料价格、替代品价格，人民币实际汇率等因素影响。因为事实上，每一个出口企业都会受到这些因素的影响，最终这些因素会影响该企业的出口收入。一旦这些要素发生了变化，该模型就不能很好地对现实进行拟合。另一方面由于我们选取的数据具有时间序列性，具有时间序列性的数据一般都会序列正相关。从而影响我们拟合的效果。以上的结果表明，在期间，人民币汇率和企业总产值对金鹰公司出口具有影响。以下，笔者将试图为金鹰公司的外贸发展提供相应的政策建议。 3对策建议（略）附录：实证项目研究（实训报告）示例 2：我国教育投资总额的实证分析教育投资是指一个国家或地区根据教育事业发展的要求，投入教育领域中的人力、物力和则力的总和。具体而言，教育投资是投入教育领域中用于培养不同熟练程度的后备劳动力}i!各种专门人才以及提高人的劳动能力的人力和物力的货币表现，其中包含了两层意思:一是教育投资是投入教育领域而非其他领域的人力和物力的货币表现;一是教育投资的目的是培养和提高人的劳动能力。教育投资与经济增长的关系一直是教育学和经济学关注的重要课题。美 I+I 著名经济学家舒尔茨()对 1929-1957 年美国教育投资对经济增长的关系作了定量研究，得出如卜结论:各级教育投资的平均收益率为 17070;教育投资增长的收益占劳动收入增长的比重为 700}0;教育投资增长的收益占 l 玉}民收入增长的比重为 33070。也就是说，人力资木投资是回报率最高的投资 I4I(-423)在舒尔茨的研究基础上，贝克尔()全而论述了人们为何要进行教育投资、怎样进行教育投资以及教育投资与经济增长的内在联系。他从人力资木投资、人力资木投资收益和人力资木投资收益率等关系出发，给出了基础教育、专业教育和在职培训投资收益率的测度方法与模式，奠定了教育投资测度体系的基木框架 I21(4}4}8y-v7)。 20 世纪 60 年代以来，各国竞相进行教育改革，增加教育投入，提高教育质量，以使劳动者适应经济改革和发展的需求。战后日木经济和亚洲“四小龙”经济的飞速增长，成为教育投资促进经济增长的成功典范。据研究，在 1960-197s年的近一十年中，实施教育投资密集战略的 I+}家和地区实际人均国民生产总值平均增长率为 }0 ，而实施物质资木战略的 I+} 家和地区则为 }o13}()。在知识经济的社会大背景卜，教育投资是人力资木形成的最重要的途径。当今世界，几乎所有国家都把加强教育投资作为推进国家经济可持续发展的核心组成部分，少 i二作为增强综合国力和提高国际竞争力的重大战略措施。木研究以};Vic}}-s(计量经济学软件包)为分析工具，以国家统计局发布的 5年度的统计数据为基础(如表 1所示)，揭示中国教育投资与经济增长之间的内在依存关系，构建相关的数学模型，探讨不同经济发展阶段教育投资对经济增长的贡献率，进而提出优化教育投资结构和提高教育投资效率的策略。计算中国高等教育对经济增长率贡献的基本模型美国经济学家舒尔茨、月尼森于 20111_纪 60 年代创立的关于教育对经济增长 J,献的计 m:方法，出于对经济增长因索计 m:的需要，试图确定增长余值中有多人部分归因于教育的 J,献，在估算教育对经济增长 J,献方而作出了具有开创性的研究。各国学者用于表示教育对经济增长 J,献率的尺皮有多种，其中计算教育对国民收入增长速皮的 J,献比例是较受欢迎的方法，月尼森、麦迪逊等主要山此入手来衡 m:教育对经济增长的 J,献/’/。其基木模型为:假设上地 m:无变化，导致经济增长的因索抽象为资木(K}、劳动力(L}和技术进步率(A少，可相互替代，且能以可变的比例组合。又假设经济发展处于完全竞争的市场经济条件卜，牛产要索都以其边际产品作为报酬，规模报酬保持小变。在时间 t 范围内变化的中性技术进步的产出增长模型构造为:Y,=A_/(K,,L)少。同教育年限的准确数据很难得到，在此仅以 0 年两次人口普查的数据，对上述模型进行扩展，计算出年间 I}}.，等教育对经济增长的 J,献率。分别计算 1989-2005年从业人员人均教育综合指数。用教育综合指数代表山于教育程度的提出}}.，而带来的劳动投入录。根据 0 年间接受初等、中等和高等教育从业人员的平均收入差别，推断出中等教育毕业生劳动生产率是初等教育毕业生劳动生产率的倍， I}}.，等教育毕业生的劳动生产率是初等 2子。另根据 1989-2005 年间接受初等、中等和 I}}.，等教育从业人员的平均收入差别，取中间年限的 1995 年，推断出中等教育毕业生劳动生产率是初等教育毕业生劳动生产率的倍，I}}.，等教育毕业生的劳动生产率是初等教育毕业生劳动生产率的倍/“/。这里也可以分别把及劳动力质 m:折算为劳动力数 m:的系数，而把劳动力人均受教育年限看作是权数，据此计算出劳动力人均教育综合指数。根据我国 1989 年和 2005 年两次人口普查的数据,通过整理计算得出 1990年我国从业人员人均初等、中等和 h，等受教育年限分别为:;2000 年我国从业人员人均初等、中等和 I}}.，等受教育年限分别为: 时，柯布一道格拉斯牛产函数为:Y,=A,KaL尸。考虑到教育因索对劳动力质 m:的作用，教育的作用相当于使初始劳动力投入成倍地增加，因此，可以把 L，分解为初始劳动力件))与教育投入(E)的乘积，这样，柯布一道格拉斯牛产函数可以表示之为:丫=A 式，L..,E 少 Ij，对该式两边取自然对数后，再求时间 t的全导数，然后用差分方程近似代替微分方程，于是得:了=。+at+比)+1}}，这里 1代表年经济增长率， a 为产出的资木投入弹性，人为资木投入的年增长率，1}为产出的劳动投入弹性，a+I}=1,G，为初始劳动力投入的年增长率，。为教育投入年增长率。那么，教育对经济增长率的 J,献可以表示为:R,.=I}xg}}r。在构造的模型中，了为(i}}的年增长率，。为根据从业人员人均受教育年限计算出的教育综合指数的年增长率，’p 系数的确定为假设在市场经济充分竞争、企业追求利润最人化的前提卜，劳动力的工资率等于其边际产品，工资总额与国民收入之比就是劳动对产出的弹性。麦迪逊采用此算法，得出 13系数值为。在柯布一道格拉斯函数基础上，构造回归模型:111Y=1mA+a1nK+I31nL，分别求出 a 和 1}的数值。木文构造的模型采用麦迪逊的 1}系数不削=/即 I}=,也就是认为劳动投入每增加 1070，产出增加录为从中国统计年鉴中查的数据如下：表 1 年份国内生产国内生产总值教育支财政支出总值指数出 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 一．建立模型设模型中有两个解析变量: X1---------GDP X2---------国家财政支出总额被解析变量: Y-------全国教育经费总投入首先绘制 Y与 x1,y与 x2的相关图，如下：由以上相关图可知，Y与 X1、X2都存在明显的线性关系。所以设定模型为多元线性模型。 Yi=β0+β1*X1i+β2*X2i+υi 2．多元线性回归估计依表 1中的数据 DependentVariable:Y Method:LeastSquares Date:0607Time:13:40 Sample:5 Includedobservations:17 Variable Coeffic ient r t-Statis tic Prob. C 2 X1 3 X2 0 R-squared 6 Meandependentvar 11 AdjustedR-squa red 2 10 on 3 Akaikeinfocriter ion 38 Sumsquaredresi d 3 Schwarzcriterion 42 Loglikelihood 26 F-statistic 39 Durbin-Watsons tat 2 Prob(F-statistic ) 00 得到拟合方程 Y^=++ t=1.. R2=ˉ= F== 由以上结果可知，t 统计量比较大，而且拟合程度相当高。 F=,整个方程也是高度显著的。所以估计结果是很可信的。 DW值也比较小，表明存在一阶自相关性。下面进行计量经济学检验。 2异方差检验采用 White检验得： WhiteHeteroskedasticityTest: F-statistic 3 Probabil ity 87 Obs*R-squared 7 Probabil ity 76 取显著性水平为，查表得卡方值为（n=5）,所以模型不存在异方差性自关性检验用广义差分法重新估计模型得到： DependentVariable:Y Method:LeastSquares Date:0607Time:15:22 Sample(adjusted):5 Includedobservations:16afteradjustingendpoint s Convergenceachievedafter13iterations Variable Coeffic ient r t-Statis tic Prob. C 0 X1 7 X2 6 AR(1) 6 R-squared 6 Meandependentvar 66 AdjustedR-squa red 5 88 on 4 Akaikeinfocriter ion 70 Sumsquaredresi d 4 Schwarzcriterion 84 Loglikelihood 57 F-statistic 90 Durbin-Watsons tat 6 Prob(F-statistic ) 00 InvertedARRoot s .59 调整后的模型如下: Y^=++ T=0...076839 R2=ˉ= F== 在进行偏相关检验，可得下图：可见调整过后的模型已不存在自相关性。 4多重共线检验采用相关系数检验法，得到系数矩阵为： X1与 X2的相关系数为，说明两者存在高度相关性。该模型存在多重共线性。下面采用分步回归法探究多重共线性问题。采用逐步回归法消除多重共线对 Y分别于 X1,X2建立一元回归模型： DependentVariable:Y Method:LeastSquares Date:0607Time:16:25 Sample:5 Includedobservations:17 Variable Coeffic ient r t-Statis tic Prob. C 97 8 X1 9 R-squared Meandependentvar 2 11 AdjustedR-squa red 1 10 on 6 Akaikeinfocriter ion 79 Sumsquaredresi d . Schwarzcriterion 81 Loglikelihood 32 F-statistic 63 Durbin-Watsons tat 9 Prob(F-statistic ) 00 Y=+ T= R2== Y与 X2的模型 DependentVariable:Y Method:LeastSquares Date:0607Time:16:31 Sample:5 Includedobservations:17 Variable Coeffic ient r t-Statis tic Prob. C 1 X2 1 R-squared 9 Meandependentvar 11 AdjustedR-squa red 0 10 on 3 Akaikeinfocriter ion 58 Sumsquaredresi d 152150. 6 Schwarzcriterion 61 Loglikelihood 70 F-statistic 60 Durbin-Watsons tat 9 Prob(F-statistic ) 00 Y=+ T= R2== 显然，Y 与 X2 的相关性最强，所以 Y=+ 为基本模型。在该模型中加入 X1，对 Y关于 X1,X2建立二元回归模型，回归结果为： DependentVariable:Y Method:LeastSquares Date:0607Time:16:39 Sample:5 Includedobservations:17 Variable Coeffic ient r t-Statis tic Prob. C 2 X1 3 X2 0 R-squared 6 Meandependentvar 11 AdjustedR-squa red 2 10 on 3 Akaikeinfocriter ion 38 Sumsquaredresi d 3 Schwarzcriterion 42 Loglikelihood 26 F-statistic 39 Durbin-Watsons tat 2 Prob(F-statistic ) 00 可以看出，加入 X1 后，调整后的拟合优度有所提高，系数均显著且符号正确，因此，在模型中保留 X1。虽然解释变量之间仍存在高度相关关系，但是多重共线并没有造成不利的影响，所以，该模型是较好的教育投资模型，即 Y=++.为最终确立的教育投资模型。以上分析了我国的教育投资现状以及教育投资对经济发展的作用，不难看出，我国在教育事业上的资金投入相较西方发达国家而言，真是少之又少。再加上我国人口众多，平摊到每人身上的教育经费就更少了。国人四处嚷嚷要在未来 20年建设若干所世界一流大学，却不愿大放血花钱办教育。香港区区弹丸之地，却已经有好几所大学跻身世界一流大学行列。而其校史不到 20 年。这多亏了港府不惜血本，大力发展高等教育，才有今日之成就。这倒还在其次，尤其对基础教育的投入更让人大跌眼镜。据权威部门统计，从 1994 年到 1996 年，我国义务教育经费中财政预算内拨款的比重从 %下降到 %，其中农村学校下降到 %。义务教育经费支出中财政预算内教育拨款，小学从 %下降到 %；初中从 %下降到 %；义务教育中政府拨款的比重比非义务教育的还要低，是政府拨款比重低的一个层次。从经济学的角度看，一个国家或地区在经济教育发展水平不甚高的情况下，投资基础教育能争取以最小的投入获得最大的产出。我国基础教育之落后，虽然很大程度上是因了我国的具体国情，但是在经济形势一片大好的状况下，加大对基础教育的投资力度也是应有之义。本着公平与效率兼顾的原则，政府应当加大对基础教育的投资，尤其是农村的基础教育。另外还应当鼓励私人办教育。这不但能够节约政府预算，而且也有助于教育事业良性竞争的形成。美国私人教育占有非常大的比重，其高等教育水平是全世界最好的。这足以证明私人教育在某些方面并不逊色于公共教育。所以政府应当大力提倡发展民间教育事业。封面：《经济计量模型建模实训报告》题目成绩姓名学号报告汇报总成绩组长指导教师北京信息科技大学图书馆 805实验室 2014年月日