财务管理财务知识经
济计量实训指导书某
某某
《经济计量模型建模实训》
指导书
《经济计量模型建模实训》
简介
《经济计量模型建模实训》是为经济学专业本科生计量经济学
以及相关课程设置的一个综合性实践教学环节。是一门理论与实践
相结合的一门课程。其主要目的是让学生通经济计量模型建模实训
来掌握在对社会经济现象作定性分析的基础上,探讨如何运用经济
计量模型建模的方法来定量描述具有随机性特征的经济变量关系,
是结合计量经济学理论知识进行实验操作的实训课程。在实训中学
生通过以建立计量经济模型的基本过程为主线,结合样本数据收集,
掌握计量经济模型的建立、估计、检验、应用,综合运用微观、宏
观经济学、统计学、国际贸易、计量经济学等相关课程的理论知识,
学会用计量经济模型对实际经济问题进行实证分析,得到综合运用
所学知识解决实际问题能力的培养和锻炼。
一、实训目的
本实训主要目的是使学生能够应用计量经济学所学的理论
方法,根据经济系统中经济现象反映的问题,提出反映经济现
象本质的经济计量模型,并通过上机实际操作,完成模型的参
数估计,模型的统计检验,从而建立经济计量模型。实训使学
生对经济计量建模过程有一个直观感性的认识,并熟悉现代计
量经济分析软件 Eviews的实际操作流程。学生应达到的实训能
力标准:1、要求学生能用计量经济学的理论解决实际问题,建
立数学模型,通过计量经济学有关软件的实际操作;2、掌握计
量经济学问题的计算机软件操作;3、对于外界条件的变化,具
有一定的分析解决问题的能力。
二、实训时间
根据教学计划的要求,集中进行 16学时的训练。
三、实训方式
建立反映经济现象本质的经济计量模型,利用 Eviews软件完成
模型的参数估计,模型的统计检验等工作,使学生掌握 Eviews 的
实际操作流程。
四、实训内容
1、经济计量模型基础理论
2、实证项目研究的选题
3、模型设定与数据处理
4、经济计量模型建模----模型的估计
5、经济计量模型建模----模型的检验
6、经济计量模型建模----模型的调整
7、经济计量模型建模---模型计量结果的分析
8、经济计量模型建模----撰写研究结果的报告
五、实训要求
1、在实训开始前,组织学生认真阅读《实训指导书》,使学生
明确所作实训项目的实训目的、实训要求、完成的实训内容和实训
原理。
2、指导学生根据《实训指导书》所要求的实训步骤进行实训,
必要时老师可进行演示。
3、计量经济牵涉面广,综合性强,要求思路开阔,综合运用计
量经济及其它相关课程的理论知识,切忌孤立片面地分析回答问题。
4、要求学生根据实验结果进行实验分析总结,认真填写实训
课程报告,并批阅评定成绩。
5、引导学生根据个人兴趣和教师指导,通过实训教学,综合
掌握计量模型的建立步骤、估计原理、检验内容、对模型进行应用,
得到有价值的结论。
6、撰写实训课程报告定量分析要求选用恰当的计量模型,计
算结果要求准确。定性分析要求思路清晰,论点及概念正确,论据
充分,文字表达层次分明,流畅。
六、实训成绩评定
本课程虽为考试课程,但课程总成绩是由多项形成性考核方式
决定,其中实践能力训练是重要组织部分。学生的实训态度、动手
能力、项目完成质量是实践教学评分的主要依据。
1、根据个人提交的经济计量模型实训报告质量给出实训的基
础成绩。
2、根据个人答辩表现给出答辩成绩。
3、每人的总成绩=60%基础成绩+40%答辩成绩
《经济计量模型建模实训》
实验目录
实验一:经济计量模型基础理论
实验二:实证项目研究的选题
实验三:模型设定与数据处理
实验四:经济计量模型建模----模型的估计
实验五:经济计量模型建模----模型的检验
实验六:经济计量模型建模----模型的调整
实验七:经济计量模型建模----模型计量结果的分
析
实验八:经济计量模型建模----研究结果的报告
《经济计量模型建模实训》
实验内容
实验一:经济计量模型基础理论(实验学时:2)
实验内容:了解计量经济学的基础理论和 Eviews 软件的基本操
作
实验说明:全面熟悉经济计量模型建模的相关计量经济学基础知
识,并熟练相关的 Eviews软件操作过程。
操作要求:(以案例分析为例)
实验二:实证项目研究的选题(实验学时:2)
建立我国最终消费支出与国内生产总值(单位:亿元)
之间的回归模型,并进行变量和方程整体的显著性检验。当
显著性水平为 ,2004年国内生产总值为 38000亿元时,
对 2004 年我国最终消费支出和平均最终消费支出进行点预
测和区间预测。
年份 GDP
最终
消费 年份 GDP
最终
消费
1978
3624
.10
2239
.10 1991
1114
6151
.57
1979
3899
.53
2568
.04 1992
1273
7083
.53
1980
4203
.96
2753
.10 1993
1445
7917
.65
1981
4425
.03
2989
.25 1994
1628
8638
.30
1982
4823
.68
3225
.09 1995
1799
9445
.38
1983
5349
.17
3511
.35 1996
1971
1058
1984
6160
.97
3988
.53 1997
2146
1144
1985
6990
.89
4506
.64 1998
2313
1251
1986
7610
.61
4817
.38 1999
2479
1381
1987
8491
.27
5114
.07 2000
2677
1540
1988
9448
.03
5419
.86 2001
2878
1675
1989
9832
.18
5190
.02 2002
3117
1809
1990
1020
5471
.93 2003
3407
1945
一、创建工作文件
建立工作文件的方法
1.菜单方式
在主菜单上依次单击 File→New→Workfile(见图 2-2),
出现对话框“WorkfileRange”。在“Workfilefrequency”中
选择数据频率:
Annual(年度)Weekly(周数据)
Quartrly(季度)Daily(5dayweek)(每周 5天日数据)
SemiAnnual(半年)Daily(7dayweek)(每周 7天日数据)
Monthly(月度)Undatedorirreqular(未注明日期或不规
则的)
时间序列提供起止日期(年、季度、月度、周、日),非
时间序列提供最大观察个数。本例中在 StartData 里输入
1978,在 Enddata里输入 2003,见图 2-3。单击 OK后屏幕出
现 Workfile工作框,如图 2-4所示。
2.命令方式
在命令窗口直接输入建立工作文件的命令 CREATE,
命令格式:CREATE数据频率起始期终止期
其中,数据频率类型分别为 A(年)、Q(季)、M(月)、
U(非时间序列数据)。输入 Eviews命令时,命令字与命令参
数之间只能用空格分隔。如本例可输入命令:
CREATEA3
这时屏幕上出现 WorkfileRange对话框,如图 2-3所示。
工作文件创立后,需将工作文件保存到磁盘,单击工具
条中 Save→输入文件名、路径→保存,或单击菜单兰中 File
→Save或 Saveas→输入文件名、路径→保存。
图2-2Eviews菜单方式创建工作文件示意图
图 2-3
图 2-4
一个新建的工作文件窗口内只有2个对象(Object),分别
为c(系数向量)和resid(残差)。它们当前的取值分别是0
和NA(空值)。可以通过鼠标左键双击对象名打开该对象查
看其数据,也可以用相同的方法查看工作文件窗口中其它对
象的数值。
二、输入和编辑数据
建立或调入工作文件以后,可以输入和编辑数据。输入
数据有两种基本方法:命令方式和菜单方式。
1.命令方式
命令格式:data〈序列名 1〉〈序列名 2〉…〈序列名 n〉
功能:输入新变量的数据,或编辑工作文件中现有变量
的数据。
在本例中,在命令窗口直接输入:
DataYX
2.菜单方式
在主菜单上单击 Objects→Newobject,在 Newobject对
话框里,选 Group 并在 NameforObject 上定义变量名(如变
量 X、Y),单击 OK,屏幕出现数据编辑框。
另一种菜单方式是在主菜单上依次单击 Quick→Group
(见图 2-5),
图 2-5
建立一个空组(见图2-6),在数据编辑窗口中,首先按
上行键“↑”,这时对应的“obs”字样的空格会自动上跳,
在对应列的第二个“obs”有边框的空格键入变量名,如
“X”,再按下行键“↓”,对因变量名下的列出现“NA”字
样,即可依顺序输入相应的数据(见图2-7)。其他变量的数
据 也 可 用 类 似 方 法 输 入 。 若 要 对 数 据 存 盘 , 点 击
“fire/SaveAs”,出现“SaveAs”对话框,在“Drives”点
所要存的盘,在“Directories”点存入的路径(文件名),
在“FireName”对所存文件命名,或点已存的文件名,再点
“ok”。若要读取已存盘数据,点击“fire/Open”,在对话
框的“Drives”点所存的磁盘名,在“Directories”点文件
路径,在“FireName”点文件名,点击“ok”即可。
另外数据还可以从 Excel中直接复制到空组。
然后为每个时间序列取序列名。单击数据表中的 SER01
(见图 2-8),在数据组对话框中的命令窗口输入该序列名称,
如本例中输入 X(见图 2-9),回车后 Yes。采用同样的步骤
修改序列名 Y(见图 2-10)。数据输入操作完成。
图 2-6
图 2-7
图 2-8
图 2-9修改序列名
图 2-10数据输入
数据输入完毕,单击工作文件窗口工具条的 Save或单击
菜单兰的 File→Save将数据存入磁盘。
(3)调入已有数据文件
用户可从主菜单中选择 ProcsreadText-Lotus-Excel,
然后找到 Excel 文件存储路径后,双击文件对应并打开目标
文件名后屏幕出现图 2-11所示对话框。本例调入对话框如图
2-12
图 2-11从外部调入数据对话框
图 2-12 从外部调入数据对话
框
三、图形分析
在估计计量经济模型之前,借助图形分析可以直观地观
察经济变量的变动规律和相关关系,以便合理的确定模型的
数学形式。图形分析中最常用的是趋势图和相关图。
1.菜单方式
在数组窗口工具条上 Views 的下拉菜单中选择 Graph,
出现对话框如图 2-13。
2.命令方式
趋势图:PlotYX(见图 2-14-1)
功能:
(1)分析经济变量的发展变化趋势;
(2)观察经济变量是否存在异常值。
图给出了最终消费支出与国内生产总值的趋势图。
相关图:ScatYX(见图 2-14-2)
功能:
(1)观察经济变量之间的相关程度;
(2)观察经济变量之间的相关类型,判断是线性相关,
还是曲线相关;曲线相关时,大致是哪种类型的曲线。
图 2-13数组窗口下图形选择窗口
图 2-14-1最终消费支出与国内生产总值的趋势图
图 2-14-2最终消费支出与国内生产总值的相关图
重要提示:在 Eviews工作薄中选取变量的顺序是很重要
的。首先选中的变量的数据将表示为 X轴。
四、OLS估计参数
1.命令方式
在主菜单命令行键入
LSYCX(如图 2-15)
图 2-15
2.菜单方式
在主菜单上选 Quick 菜单,单击 EstimateEquation 项
(图 2-16-1),屏幕出现 EstimateEquation估计对话框(图
2-16-2 ), 在 EstimationSettings 中 选 OLS 估 计 , 即
LeastSquares,在方程清单(Specification)窗口输入要建
立的方程(图 2-16-3)。回归方程的书写形式如下:
完整形式:
简化形式:YCX
两种形式等价的。(其中 C 为 Eviews 固定的截距项系
数)。然后 OK,出现方程窗口(见图 2-16-4),输出结果如
表 2-1所示。
图 2-16-1
图 2-16-2方程估计窗口
图 2-16-3方程输入窗口
图 2-16-4方程窗口
在工具栏中,单击 Name,将方程命名就可以把它永久的
保存在工作文件中。我们把它命名为 eq01,如图 2-16-5所示:
图 2-16-5方程保存窗口
表 2-1回归结果
DependentVariable:Y
Method:LeastSquares,
Sample:3
Includedobservations:26
Variable Coeffi
cient
Std.
Error
t-Stat
istic
Prob
.
C
22
153.
9605
05
41
X
14
9135
23
00
R-squared
59
Meandependentva
r
8042
.748
AdjustedR-squa
red
87
r
5177
.609
on
42
Akaikeinfocrite
rion
2700
Sumsquaredresi
d
. Schwarzcriterio
n
2378
Loglikelihood
510
F-statistic 3645
.290
Durbin-Watsons
tat
11
Prob(F-statisti
c)
0000
方程窗口的上半部分为参数估计结果如表 2-2 所示,其
中第 1列分别为解释变量名(包括常数项),第 2列为相应的
参数估计值,第 3列为参数的标准误差,第 4列为 t统计值,
第 5列为 t检验的双侧概率值 p,即 P(|t|>ti)=p。
表 2-2参数估计结果
常数和解
释变量
参数
估计值
参数标
准误差
t统
计量
双
侧概率
C
522
5
3605
41
X
514
5
7623
00
方程窗口的下半部分主要是一些统计检验值,其中各统
计量的含义如表 2-3所示。
表 2-3统计检验值
可决系数
459
被解释变量
均值
8042
.748
调整的可决
系数
187
被解释变量
标准差
5177
.609
回归方程标
准差
742
赤池信息准
则
2700
残差平方和
.
施瓦兹信息
准则
2378
似然函数的
对数
-193.
3510
F统计量
3645
.290
DW统计量
011
F统计量的
概率
0000
在本例中,参数估计的结果为:
单击 Equation窗口中的 Resid按钮,将显示模型的拟合图
和残差图(图 2-17所示)。
图 2-17拟合图和残差图
单击 Equation 窗口中的 View→Actual,Fitted,Resid
→Table 按钮,可以得到拟合直线和残差的有关结果。(图
2-18所示)。
图 2-18拟合直线和残差的有关结果
五、随机项正态分布检验
双击我国最终消费支出和国内生产总值工作文件中的
resid 标志(见图 2-19-1)总是可以获得包括最近一次回归
模型的残差值向量,如图 2-19-2所示:
图 2-19-1
图 2-19-2
点 击
Views/DescriptiveStatistics/HistogramandStats( 如 图
2-19-3),可以得到残差值的直方图和 Jarque-Bera统计量,
如图 2-19-4所示:
图 2-19-3
图 2-19-4
例 中残差的偏度为,说明残差的分布是说明的
分布是不对称的呈现左偏。
例 中残差的峰度为 ,说明残差的分布相对于正
态分布是平坦的,呈现平坦的分布形态。
在正态分布的原假设下,J-B统计量是自由度为 2的 c2
分布。J-B统计量下显示的概率值(P值)是 J-B统计量超出
原假设下的观测值的概率。如果该值很小,则拒绝原假设。
当然,在不同的显著性水平下的拒绝域是不一样的。例
中残差的 J-B 统计量下显示的概率值(P 值)是 ,不
能拒绝原假设,残差服从正态分布。
六、模型检验
1、经济意义检验
所估计的参数,说明我国 GDP每增长一亿元,最终消费支
出平均增长 亿元。这与经济学中最终消费支出与国民生
产总值间的关系相符。
2、拟合优度和统计检验
用 EViews得出回归模型参数估计结果的同时,已经给出了
用于模型检验的相关数据。
拟合优度的度量:由表 2-3中可以看出,本例中可决系数
为 ,说明所建模型整体上对样本数据拟合较好,即
解释变量“国内生产总值”对被解释变量“我国最终消费支
出”的绝大部分差异作出了解释。
对回归系数的 t检验:针对和,由表 2-2中还可以看出,
估计的回归系数的标准误差和 t 值分别为:,;的标准误差
和 t 值分别为:。取,查 t 分布表得自由度为 24 的临界值
因为》,所以应拒绝。这表明,国内生产总值对
我国最终消费支出有显著影响。
六、预测
在 Equation框中选 Forecast项后,弹出 Forecast对话
框(如图 2-20-1),Eviews 自动计算出样本估计期内的被解
释变量的拟合值,拟合变量记为 YF,其拟合值与实际值的对
比图如图 2-20-2 所示。同时在主窗口生成预测值序列 YF
(如图 2-20-3)。
图 2-20-1预测设置窗口
图 2-20-2样本其内预测结果
图 2-20-3
下面预测 2004年我国最终消费支出。
1.首先将样本期范围从 1978-2003年扩展为 1978-2004
年 。 即 单 击 工 作 文 件 框 中 Pros 中 的
Structure/ResizeCurrentPage,如图 2-21-1 所示,并将
1978-2003改为 1978-2004,如图 2-21-2所示。
图 2-21-1
图 2-21-2
2.然后编辑解释变量 X。在 Group数据框中输入变量 X
的 2004年数据 。(见图 2-22)
图 2-22
3.点预测。在前面 Equation对话框中选 Forecast,将
时间 Sample定义在 1978-2004,如图 2-23所示,这时 Eviews
自动计算出=21202.,如图 2-24所示。
图 2-23
图 2-24
4.区间预测。在 Group 数据框中单击 View,选
DescriptiveStats 里的 CommonSampleEviews(如图 2-25 所
示),计算出有关 X和 Y的描述统计结果,如图 2-26所示。
图 2-25
图 2-26X和 Y的描述统计结果
根据图 2-26可计算出如下结果:
850
给定显著性水平 ,查表得,由
可得的预测区间为:
..8587
即的 95%预测区间为(,)。
实验二:实证项目研究的选题(实验学时:2)
实验内容:理解实证项目研究的选题过程:
1、问题的提出
2、研究题目的选择
3、文献资料的利用、综述与评价
实验说明:以完成一个经济计量建模实训报告为例,对实训项目
的计量经济研究的构成要素、基本步骤等提出建议,包括对一般性
原则和常用方法、有关选题、文献综述与评价等内容展开讨论。
操作要求:
1、研究领域要依据自身的专业,或者结合自己在经济学、管理学、
国际贸易等方面的知识结构,去选择感兴趣的领域。
2、要尽量选择在经济和社会领域中受到广泛关注的问题。所研究
问题的题目要具体化,不宜空洞。
3、要明确研究范围。研究范围也决定了收集数据的范围,
4、所选题目的大小要适中。要充分考虑数据来源的可能性。
5、对收集到的相关文献应注意进行整理。对相关文献应当有个总
结性的文字材料,以利于梳理思路。
实验三:模型设定与数据处理(实验学时:2)
实验内容:理解模型设定与数据处理过程:
1、建模的基本思路
2、模型设定的要求
3、模型变量与函数形式的设定:
⑴确定模型包含的变量
根据经济学理论和经济行为分析。
例如:同样是生产方程,电力工业和纺织工业应该选择不同的变量,
为什么?
例如,消费和 GDP之间的因果关系。
考虑数据的可得性。注意因素和变量之间的联系与区别。
考虑入选变量之间的关系。要求变量间互相独立。
⑵确定模型的数学形式
利用经济学和数理经济学的成果
根据样本数据作出的变量关系图
选择可能的形式试模拟
⑶拟定模型中待估计参数的理论期望值区间
符号、大小、关系
例如:ln(人均食品需求量)=α+βln(人均收入)+γln(食品价格)+
δln(其它商品价格)+ε
其中α、β、γ、δ的符号、大小、关系
4、数据的收集与处理:数据来源、数据类型、数据处理
⑴几类常用的样本数据
时间序列数据
截面数据
虚变量离散数据
联合应用
⑵数据质量
完整性
准确性
可比性
一致性
说明:以完成一个经济计量建模实训报告为例,对实训项目的计
量经济研究的构成要素、基本步骤等提出建议,包括对模型选择、
数据收集、论文写作以及一些具体的计量经济建模分析技术等内容
展开讨论。
操作要求:登陆相关数据网站,熟悉数据收集过程。
中国国家统计局:.gov
美国:.
上海统计局:- 美国人口普查局:.gov
信息产业部:.govhyzw 美国会图书馆:.gov/
国家外汇管理局:.gov 美国商业部:-/
国际货币基金组织数据库: 亚洲东盟网站:
经合组织数据库: APEC网站:.sg
国信证券: 美国 IBM公司:/investor
中国人民银行网:.gov 美国:
经济杂志网: 美国纳斯达克网:
北京大学网:.pkuyearbook 搜索网站:
中国疾病预防控制中心:
英文书搜索网站:
国内最常用的一些网上数据来源:
中国经济信息网:.gov
中国经济统计数据库:.gov
中国国家统计局:.gov/tjsj
中国人民银行网:.govtongjishuju/
中国证券监督管理委员会统计数据网页:.govstatinfo/
实验四:经济计量模型建模----模型的估计(实验学时:2)
实验内容:设定的模型确定以后,即用收集的数据去估计模型中
的参数。
1、各种模型参数估计方法
2、如何选择模型参数估计方法
3、关于应用软件的使用
实验原理:(以一元线性回归模型为例介绍 OLS)
1.一元线性回归模型有一元线性回归模型(统计模型)如下,
yt=0+1xt+ut
上式表示变量 yt和 xt之间的真实关系。其中 yt称被解释变量(因
变量),xt称解释变量(自变量),ut称随机误差项,0称常数项,
1称回归系数(通常未知)。上模型可以分为两部分。(1)回归函
数部分,E(yt)=0+1xt,(2)随机部分,ut。
E(yt)=0+1xtut
图 真实的回归直线
这种模型可以赋予各种实际意义,收入与支出的关系;如脉搏与血
压的关系;商品价格与供给量的关系;文件容量与保存时间的关系;
林区木材采伐量与木材剩余物的关系;身高与体重的关系等。
以收入与支出的关系为例。假设固定对一个家庭进行观察,随
着收入水平的不同,与支出呈线性函数关系。但实际上数据来自各
个家庭,来自各个不同收入水平,使其他条件不变成为不可能,所
5
10
15
20
25
30
10 20 30 40 50 60 70
y
x
以由数据得到的散点图不在一条直线上(不呈函数关系),而是散
在直线周围,服从统计关系。随机误差项 ut中可能包括家庭人口数
不同,消费习惯不同,不同地域的消费指数不同,不同家庭的外来
收入不同等因素。所以在经济问题上“控制其他因素不变”是不可
能的。
回归模型的随机误差项中一般包括如下几项内容,(1)非重要
解释变量的省略,(2)人的随机行为,(3)数学模型形式欠妥,(4)
归并误差(粮食的归并)(5)测量误差等。
回归模型存在两个特点。(1)建立在某些假定条件不变前提下
抽象出来的回归函数不能百分之百地再现所研究的经济过程。(2)
也正是由于这些假定与抽象,才使我们能够透过复杂的经济现象,
深刻认识到该经济过程的本质。
通常线性回归函数 E(yt)=0+1xt是观察不到的,利用样本得到
的只是对 E(yt)=0+1xt的估计,即对0和1的估计。
在对回归函数进行估计之前应该对随机误差项 ut做出如下假定。
(1)ut是一个随机变量,ut的取值服从概率分布。
(2)E(ut)=0。
(3)D(ut)=E[ut-E(ut)]2=E(ut)2=2。称 ui具有同方差性。
(4)ut为正态分布(根据中心极限定理)。
以上四个假定可作如下表达。utN(0,)。
(5)Cov(ui,uj)=E[(ui-E(ui))(uj-E(uj))]=E(ui,uj)=0,(ij)。含义
是不同观测值所对应的随机项相互独立。称为 ui的非自相关性。
(6)xi是非随机的。
(7)Cov(ui,xi)=E[(ui-E(ui))(xi-E(xi))]=E[ui(xi-E(xi)]=E[uix
i-uiE(xi)]=E(uixi)=与 xi相互独立。否则,分不清是谁对 yt
的贡献。
(8)对于多元线性回归模型,解释变量之间不能完全相关或高度相
关(非多重共线性)。
在假定(1),(2)成立条件下有 E(yt)=E(0+1xt+ut)=0+1xt。
2.最小二乘估计(OLS)
对于所研究的经济问题,通常真实的回归直线是观测不到的。
收集样本的目的就是要对这条真实的回归直线做出估计。
怎样估计这条直线呢?显然综合起来看,这条直线处于样本数
据的中心位置最合理。怎样用数学语言描述“处于样本数据的中心
位置”?设估计的直线用
=+xt
表示。其中称 yt的拟合值(fittedvalue),和分别是0和1的估计
量。观测值到这条直线的纵向距离用表示,称为残差。
yt=+=+xt+
称为估计的模型。假定样本容量为 T。(1)用“残差和最小”确定
直线位置是一个途径。但很快发现计算“残差和”存在相互抵消的
问题。(2)用“残差绝对值和最小”确定直线位置也是一个途径。
但绝对值的计算比较麻烦。(3)最小二乘法的原则是以“残差平方
和最小”确定直线位置。用最小二乘法除了计算比较方便外,得到
的估计量还具有优良特性。(这种方法对异常值非常敏感)设残差
平方和用 Q表示,
Q===,
则通过 Q最小确定这条直线,即确定和的估计值。以和为变量,把
Q 看作是和的函数,这是一个求极值的问题。求 Q 对和的偏导数并
令其为零,得正规方程,
=2(-1)=0(1)
=2(-xt)=0(2)
下面用代数和矩阵两种形式推导计算结果。首先用代数形式推
导。由(1)、(2)式得,
0(3)
xt=0(4)
(3)式两侧用除 T,并整理得,
=(5)
把(5)式代入(4)式并整理,得,
xt=0(6)
=0(7)
=(8)
因为=0,=0,分别在(8)式的分子和分母上减和得,
=(9)
=(10)
3.最小二乘估计量和的特性
(1) 线性特性
这里指和分别是 yt的线性函数。
(2) 无偏性
(3)有效性
0,1的 OLS估计量的方差比其他估计量的方差小。
Gauss-Marcov 定理:若 ut满足 E(ut)=0,D(ut)=2,那么用 OLS 法
得到的估计量就具有最佳线性无偏性。估计量称最佳线性无偏估计
量。最佳线性无偏估计特性保证估计值最大限度的集中在真值周围,
估计值的置信区间最小。
上面的评价是对小样本而言,若是对大样本而言还应讨论估计量的
渐近无偏性,一致性和渐近有效性。
OLS 估计量都能满足上述渐近特性,但满足渐近特性的估计量不见
得是最佳线性无偏估计量。
注意:分清 4个式子的关系。
(1) 真 实 的 统 计 模 型 ,
yt=0+1xt+ut
(2)估计的统计模型,yt=+xt+
(3) 真 实 的 回 归 直 线 ,
E(yt)=0+1xt
(4)估计的回归直线,=+xt
实验说明:本实训讨论的范围所用的估计方法主要是最小二乘法。
事实上 OLS不仅简便易用,而且在很多情形下都是既简便又适用的
估计方法。方法可以学习系列教学课件中相关内容,以及实验环节
的示例。操作请查看实训软件 spss的帮助功能。
操作要求:(可以参考实验一案例分析为例)
实验五:经济计量模型建模----模型的检验(实验学时:2)
实验内容:由数理统计理论决定,包括拟合优度检验、总体显著
性检验、变量显著性检验
实验原理:
一、线性回归模型检验的种类(以一元为例说明)
根据变量X和Y的样本观测值,应用最小二乘法求得了样本回归直
线,作为总体回归直
线的近似,这种近似是否合理,必须对其进行检验。如果通过检验
发现模型有缺陷,则必须
回到重新设定模型或估计参数。一元线性回归模型的检验包括经济
意义检验、统计检验和计
量检验。
(一)经济意义检验
经济意义检验主要涉及参数估计值的符号和取值范围,如果它
们与经济理论以及人们的
实践经验不相符,就说明模型不能很好地解释现实的经济现象。例
如,前面的家庭消费支出
与可支配收入例子中,2β的取值范围应在0和1之间,如果估计出来
的2b小于0或大于1,
则不能通过经济意义检验。在对实际的经济现象进行回归分析时,
常常会遇到经济意义检验
不能通过的情况。造成这一结果的主要原因是:经济现象的统计数
据无法象自然科学中的统
计数据那样通过有控制的实验去取得,因而所观测的样本容量有可
能偏小,不具有足够的代
表性,或者不能满足标准线性回归分析所要求的假定条件。
(二)统计检验
统计检验是利用统计学中的抽样理论来检验样本回归方程的
可靠性,具体又可分为拟合
程度检验、相关系数检验、参数显著性检验(t检验)和回归方程显
著性检验(F检验),是对所有现象进行回归分析时都必须通过的
检验。
(三)计量检验
计量检验是对标准线性回归模型的假定条件是否满足进行检
验,具体包括序列相关检
验、异方差性检验等。计量检验对于经济现象的定量分析具有特别
重要的意义。
二、拟合优度检验
所谓拟合程度,是指样本观测值聚集在样本回归直线周围的紧
密程度。判断回归模型拟
合程度优劣最常用的数量指标是判定系数
(CoefficientofDetermination)。该指标是建
立在对总离差平方和进行分解的基础之上的。
1、多重判定系数(多重可决系数)
对于多元线性回归模型:
yt=0+1xt1+2xt2+…+k-1xtk-1+ut,
总平方和
SST=
其中是 yt的样本平均数,定义为=。回归平方和为
SSR=
其中的定义同上。残差平方和为
SSE==
则有如下关系存在,
SST=SSR+SSE
R2=
显然有 0R21。R21,拟合优度越好。
2、调整的多重判定系数
当解释变量的个数增加时,通常 R2不下降,而是上升。为调整
因自由度减小带来的损失,又定义调整的多重判定系数如下:
=1-=1-
判定系数是对回归模型拟合程度的综合度量,判定系数越大,
模型拟合程度越高。判定
系数越小,则模型对样本的拟合程度越差。
判定系数R2具有如下性质:
(1)判定系数R2具有非负性。
由判定系数的定义式可知,R2的分子分母均是不可能为负值的平方
和,因此其比
值必大于零。
(2)判定系数的取值范围为0≤R2≤1。
由R2的计算公式可以看出:当所有的观测值都位于回归直线上时,
RSS=0,这时R2=1,说明总离差可以完全由所估计的样本回归直
线来解释;当观测值并
不是全部位于回归直线上时,RSS>0,则RSS/TSS>0,这时R2<
1;当回归直线没有解释任何离差,即模型中解释变量X与因变量
Y完全无关时,Y的总离差全部归于残差平方和,即RSS=TSS,这
时R2=0。
(3)判定系数是样本观测值的函数,它也是一个统计量。
三、相关系数的显著性检验
经济变量之间通常是相关的。问题是相关程度如何,如果在相关程
度过低的变量之间建
立回归模型,就没有很大的意义。这里讨论两个变量之间的线性相
关,称为简单相关。正如
上一章所讨论的,两个变量X和Y之间真实的线性相关程度用总体相
关系数ρ来表示,即
相关系数r具有以下性质:
(1)相关系数r的取值范围在-1至+1之间,当r>0时,称X与Y正相
关;当r<0时,称X
与Y负相关;当r=0时,称X与Y不(线性)相关。当|r|接近于1时,
相关程度越高。
(2)r=±R2,但两者的概念不同。判定系数R2是对变量Y和X作回归分
析得出的,用于
衡量拟合优度,而相关系数r是对变量X和Y作相关分析得出的,用
以判定X与Y的线性相
关程度。
(3)相关系数r接近于1的程度与样本容量n有关:当n较小时,相
关系数的绝对值容易
接近于1;当n较大时,相关系数的绝对值容易偏小。特别是当n=2
时,相关系数的绝对值
总为1。因此仅凭相关系数较大就说变量X与Y之间有密切的线性关
系,则显得匆忙。
样本相关系数在统计上是否显著,即总体X与Y是否显著相关,必须
进行相关系数的
显著性检验。相关系数的显著性检验可采用上一章的检验方法,也
可以按如下步骤进行检验:
(1)计算样本相关系数r;
(2)根据给定的显著性水平α和样本容量n,查相关系数表(附表)
得到临界值rα。
(3)若|r|>rα,则X与Y有显著的线性关系,否则X与Y的线性相关
关系不显著。
四、、回归方程的显著性检验:方差分析与 F检验
与 SST相对应,自由度 T-1也被分解为两部分,
(T-1)=(k-1)+(T-k)
回归均方定义为 MSR=,误差均方定义为 MSE=
表方差分析表
方差来源 平方和 自由度 均方 均方
回归 SSR= k-1 MSR=SSR/(k
-1)
F=
误差 SSE= T-k MSE=SSE/(T
-k)
总和 SST= T-1
H0:1=2=…=k-1=0;H1:j不全为零
F==F(k-1,T-k)
设检验水平为,则检验规则是,若 FF(k-1,T-k),接受 H0;若
F>F(k-1,T-k),拒绝 H0。
0F(k-1,T-k)-t(T-k)0t(T-k)
图 检验示意图图 检验示意图
五、回归参数的显著性检验 t检验
H0:j=0,(j=1,2,…,k-1),H1:j0
t=t(T-k)
判别规则:若ttk接受 H0;若t>tk拒绝 H0。
六、建模过程中应注意的问题
图
(1)研究经济变量之间的关系要剔除物价变动因素。以上图为
例,按当年价格计算,我国 1992年的 GDP是 1980年的 倍,而
按固定价格计算,我国 1992年的 GDP是 1980年的 倍。另外从
图中还可看出,1980-1992 期间按名义价格计算的 GDP 曲线一直是
上升的,而按不变价格(1980 年价格)计算的 GDP 曲线在 1989 年
出现一次下降。可见研究经济变量应该剔除物价变动因素。
(2)依照经济理论以及对具体经济问题的深入分析初步确定解释
变量。
例:我国粮食产量=f(耕地面积、农机总动力、施用化肥量、
农业人口等)。但根据我国目前情况,“耕地面积”不是“粮食产量”
的重要解释变量。粮食产量的提高主要来自科技含量的提高。
例:关于某市的食用油消费量,文革前常驻人口肯定是重要解
释变量。现在则不同,消费水平是重要解释变量,因为食用油供应
方式已改变。
(3)当引用现成数据时,要注意数据的定义是否与所选定的变
量定义相符。
例:“农业人口”要区别是“从事农业劳动的人口”还是相对于城
市人口的“农业人口”。
例:2002年起我国将执行新的规定划分三次产业。即将农、林、牧、
副、渔服务业从原第三产业划归第一产业。
(4)通过散点图,相关系数,确定解释变量与被解释变量的具
体函数关系。(线性、非线性、无关系)
(nonli8)
图
(5)谨慎对待离群值(outlier)。离群值可能是正常值也可能
是异常值。不能把建立模型简单化为一个纯数学过程,目的是寻找
经济规律。
年 INV(投资)IMPORT ( 进
口)
1991
1992
1993
1994
1995
1996
1997
1998
0
(6)过原点回归模型与非过原点回归模型相比有如下不同点。以一
元线性过原点模型,yt=1xt+ut,为例,①=0 不一定成立。原因
是正规方程只有一个(不是两个),
=2(yt-xt)(-xt)=0
即xt=0,而没有=0。所以残差和等于零不一定成立。②可决系数
R2有时会得负值!原因是有时会有 SSE>SST。为维持 SSE+SSR=SST,
迫使 SSR<0。
(7)改变变量的测量单位可能会引起回归系数值的改变,但不会影
响 t值。即不会影响统计检验结果。以一元回归模型的估计公式为
例说明之。
=
t===
(8)回归模型给出估计结果后,首先应进行 F检验。F检验是对模型
整体回归显著性的检验。(检验一次,H0:1=2=…=k-1=0;H1:j不
全为零。)若 F检验结果能拒绝原假设,应进一步作 t检验(检验 k
次,H0:j=0,(j=1,2,…,k-1),H1:j0)。t 检验是对单个解释变
量的回归显著性的检验。若回归系数估计值未通过 t检验,则相应
解释变量应从模型中剔除。剔除该解释变量后应重新回归。按经济
理论选择的变量剔出时要慎重。
(9)在作 F 与 t 检验时,不要把自由度和检验水平用错(正
确查临界值表)。回归系数的 t 检验是双端检验,但 t 检验表的定
义有 P(t>t)=,P(t<t)=
-t(T-k)0t(T-k)F(k-1,T-k)
图 图
(10)对于多元回归模型,当解释变量的量纲不相同时,不能在
估计的回归系数之间比较大小。若要在多元回归模型中比较解释变
量的相对重要性,应该对回归系数作如下变换
*=,j=1,2,…k-1()
其中 s(xt)和 s(yt)分别表示 xt和 yt的样本标准差。*可用来直接比
较大小。
以二元模型为例,标准化的回归模型表示如下(标准化后不存
在截距项),
=1*+2*+…+ut
两侧同乘 s(yt),得
(yt-)=1*(xt1-)+2*(xt2-)+…+uts(yt)
所以有
j*=j,即j*=j,i=1,2,…k-1
既是()式。
(11)利用回归模型预测时,解释变量的值最好不要离开样本范
围太远。原因是①根据预测公式离样本平均值越远,预测误差越大。
以一元回归模型为例;
N(0+1xF,(1++))
从公式看,当 xF=时,的分布方差最小,即预测区间最小,预测精
度最高。而预测点 xF越远离,的分布方差越大,即预测区间越大,
预测精度越差。
②有时,样本以外变量的关系不清楚。当样本外变量的关系与
样本内变量的关系完全不同时,在样本外预测就会发生错误。图
给出青铜硬度与锡含量的关系曲线。若以锡含量为 0-16%为样本,
求得的关系近似是线性的。当把预测点选在锡含量为 16%之外时,
显然这种预测会发生严重错误。因为锡含量超过 16%之后,青铜的
硬度急剧下降,不再遵从锡含量为 0-16%时的关系。
图 的区间预测的变化图 青铜硬度与锡含量的关系
图 图
(12)回归模型的估计结果应与经济理论或常识相一致。如边际
消费倾向估计结果为 ,则模型很难被接受。
(13)残差项应非自相关(用 DW检验,亦可判断虚假回归)。否则说
明①仍有重要解释变量被遗漏在模型之外。②选用的模型形式不
妥。
(14)通过对变量取对数消除异方差。
(15)避免多重共线性。
(16)解释变量应具有外生性,与误差项不相关。
(17)应具有高度概括性。若模型的各种检验及预测能力大致相同,
应选择解释变量较少的一个。
(18)模型的结构稳定性要强,超样本特性要好。
(19)世界是变化的,应该随时间的推移及时修改模型。
实验说明:本实训讨论模型的检验主要包括经济意义的检验、统
计推动检验、计量经济学检验、模型预测检验。此外还有模型的
诊断性检验,主要包括对变量的检验、残差检验和稳定性检验。
具体检验方法可以学习系列教学课件中相关内容,以及实验环节
的示例。操作请查看实训软件 spss的帮助功能。
操作要求:(以案例分析为例)
建立我国国有独立核算工业企业生产函数。根据生产函数理论,
生产函数的基本形式为:,其中,L、K分别为生产过程中投入的劳
动与资金,时间变量 t 反映技术进步的影响。表 3-1 列出了我国
1978-1994 年期间国有独立核算工业企业的有关统计资料;其中产
出 Y 为工业总产值(可比价),L、K 分别为年末职工人数和固定资
产净值(可比价)。
一、创建工作文件
建立工作文件的方法
1.菜单方式
在主菜单上依次单击 File→New→Workfile(见图 3-1),
选择数据类型和起止日期。时间序列提供起止日期(年、季
度、月度、周、日),非时间序列提供最大观察个数。本例中
在 StartData 里输入 1978,在 Enddata 里输入 1994,见图
3-2。单击 OK后屏幕出现 Workfile工作框,如图 3-3所示。
2.命令方式
在命令窗口直接输入建立工作文件的命令 CREATE,
命令格式:CREATE数据频率起始期终止期
其中,数据频率类型分别为 A(年)、Q(季)、M(月)、
U(非时间序列数据)。输入 Eviews命令时,命令字与命令参
数之间只能用空格分隔。如本例可输入命令:
CREATEA4
工作文件创立后,需将工作文件保存到磁盘,单击工具
条中 Save→输入文件名、路径→保存,或单击菜单兰中 File
→Save或 Saveas→输入文件名、路径→保存。
图3-1Eviews菜单方式创建工作文件示意图
这时屏幕上出现 WorkfileRange对话框,如图 3-2所示。
图 3-2
图 3-3
一个新建的工作文件窗口内只有2个对象(Object),分别为c
(系数向量)和resid(残差)。它们当前的取值分别是0和NA(空
值)。可以通过鼠标左键双击对象名打开该对象查看其数据,也可
以用相同的方法查看工作文件窗口中其它对象的数值。
二、输入和编辑数据
建立或调入工作文件以后,可以输入和编辑数据。输入
数据有两种基本方法:命令方式和菜单方式。
1.命令方式
命令格式:data〈序列名 1〉〈序列名 2〉…〈序列名 n〉
功能:输入新变量的数据,或编辑工作文件中现有变量
的数据。
在本例中,在命令窗口直接输入:
DataYtLK
2.菜单方式
在主菜单上单击 Objects→Newobject,在 Newobject对
话框里,选 Group 并在 NameforObject 上定义变量名(如变
量 Y、t、L、K),单击 OK,屏幕出现数据编辑框。
另一种菜单方式是在主菜单上依次单击 Quick→
EmptyGroup(见图 3-4),
图 3-4
建立一个空组(见图 3-5),再用方向键将光标移到每一列的顶
部之后,输入各个变量名,回车后输入数据(见图 3-6)。另外数据
还可以从 Excel中直接复制到空组。
图 3-5
图 3-6录入数据
数据输入完毕,单击工作文件窗口工具条的 Save或单击
菜单兰的 File→Save将数据存入磁盘。
三、图形分析
在估计计量经济模型之前,借助图形分析可以直观地观
察经济变量的变动规律和相关关系,以便合理的确定模型的
数学形式。图形分析中最常用的是趋势图和相关图。
1.菜单方式
在数组窗口工具条上 Views 的下拉菜单中选择 Graph。
(见图 3-7-1)
2.命令方式
趋势图:PlotYtLK(见图 3-8)
功能:
(1)分析经济变量的发展变化趋势;
(2)观察经济变量是否存在异常值。
图 3-12给出了工业总产值与劳动人数、资金的趋势图。
相关图:ScatYt(见图 3-10)
功能:
(1)观察经济变量之间的相关程度;
(2)观察经济变量之间的相关类型,判断是线性相关,
还是曲线相关;曲线相关时,大致是哪种类型的曲线。
图 3-7-1数组窗口趋势图
图 3-7-2数组窗口趋势图对话框
图 3-8工业生产总值和投入趋势图
图 3-9-1数组窗口相关图
图 3-9-2数组窗口相关图
图 3-10工业生产总值和时间相关图
重要提示:在 Eviews工作薄中选取变量的顺序是很重要
的。首先选中的变量的数据将表示为 X轴。
四、建立多元线性回归模型
㈠建立包括时间变量的三元线性回归模型完整过程;
在命令窗口依次键入以下命令即可:
⒈建立工作文件:CREATEA7894
⒉输入统计资料:DATAYLK
⒊生成时间变量t:GENRT=@TREND(77)
⒋建立回归模型:LSYCTLK
其中参数估计OLS方法:
1.命令方式
在主菜单命令行键入
LSYCTLK(如图 3-11-1),单击回车键,即可出现回归结
果表 3-11-2
图 3-11-1
图 3-11-2
2.菜单方式
在主菜单上选 Quick 菜单,单击 EstimateEquation 项
(图 3-12-1),屏幕出现 Equation-Specification估计对话
框(图 3-12-2),在 EstimationSettings中选 OLS估计。许,
即 LeastSquares,在方程清单(Specification)窗口输入
要建立的方程(图 3-12-3)。回归方程的书写形式如下:
完整形式:
简化形式:YCTLK
两种形式等价的。(其中 C 为 Eviews 固定的截距项系
数)。然后 OK,出现方程窗口(见图 3-12-4),输出结果如
表 3-1所示。
图 3-12-1
图 3-12-2方程估计窗口
图 3-12-3方程输入窗口
图 3-12-4方程窗口
在工具栏中,单击 Name,将方程命名就可以把它永久的
保存在工作文件中。我们把它命名为 eq01,如图 3-12-5所示:
图 3-12-5方程保存窗口
则生产函数的估计结果及有关信息如表 3-1所示:
表 3-1我国国有独立核算工业企业生产函数的估计结果
DependentVariable:Y
Method:LeastSquares
Date:0809Time:12:26
Sample:4
Includedobservations:17
Variable
Coefficien
t
t-Statist
ic Prob.
C
T
L
K
R-squared
AdjustedR-squared
Sumsquaredresid
Loglikelihood -Quinncriter.
F-statistic -Watsonstat
Prob(F-statistic)
因此,我国国有独立工业企业的生产函数为:
五、模型检验
1、经济意义检验
模型的计算结果表明,我国国有独立核算工业企业的劳动
力边际产出为 ,资金的边际产出为 ,技术进步
的影响使工业总产值平均每年递增 亿元。回归系数的
符号和数值是较为合理的。
2、拟合优度和统计检验
,说明模型有很高的拟合优度,F检验也是高度显著的,
说明职工人数L、资金K和时间变量t对工业总产值的总影响是
显著的。从表3-1看出,解释变量资金K的t统计量值为,
表明资金对企业产出的影响是显著的。但是,模型中其他变
量(包括常数项)的t统计量值都较小,未通过检验。因此,
需要对以上三元线性回归模型做适当的调整,按照统计检验
程序,一般应先剔除t统计量最小的变量(即时间变量)而重
新建立模型。
单击 Equation窗口中的 Resid按钮,将显示模型的拟合
图和残差图(图 3-13所示)。
图 3-13拟合图和残差图
单击 Equation 窗口中的 View→Actual,Fitted,Resid
→Table 按钮,可以得到拟合直线和残差的有关结果,如图
3-14所示。
图 3-14模型 1的残差分布
㈡建立剔除时间变量的二元线性回归模型;
命令:LSYCLK
则生产函数的估计结果及有关信息如图 3-15所示。在工
具栏中,单击 Name,将方程命名就可以把它永久的保存在工
作文件中。我们把它命名为 eq02。
图 3-15
表3-2我国国有独立核算工业企业生产函数剔除时间变量后的
估计结果
DependentVariable:Y
Method:LeastSquares
Date:0809Time:12:42
Sample:4
Includedobservations:17
Variable
Coeffici
t-Statist
ic Prob.
C
9
L
K
R-squared
9
AdjustedR-squar
ed
2
n
Akaikeinfocriterio
n
1
Sumsquaredresid
5
Loglikelihood
5
Hannan-Quinncriter
.
2
F-statistic -Watsonstat
4
Prob(F-statisti
c)
因此,我国国有独立工业企业的生产函数为:
从表 3-2 的结果看出,回归系数的符号和数值也是合理
的。劳动力边际产出为 ,资金的边际产出为 ,
表明这段时期劳动力投入的增加对我国国有独立核算工业企
业的产出的影响最为明显。模型 2 的拟合优度较模型 1 并无
多大变化,F 检验也是高度显著的。这里,解释变量、常数
项的 t检验值都比较大,显著性概率都小于 ,因此模型
2较模型 1更为合理。
单击 Eq02窗口中的 Resid按钮,将显示最后一次回归模
型的拟合图和残差图(图 3-16所示)。
图 3-15拟合图和残差图(剔除时间变量)
单击 Eq02 窗口中的 View→ Actual,Fitted,Resid→
Table按钮,可以得到拟合直线和残差的有关结果,如图 3-16
所示。
图 3-16模型 2的残差分布
六、随机项正态分布检验
双击我国工业总值工作文件中的 resid 标志(见图
3-17-1)总是可以获得包括最近一次回归模型的残差值向量,
如图 3-22-2所示:
图 3-17-1
图 3-17-2
点 击
Views/DescriptiveStatistics/HistogramandStats( 如 图
3-17-3),可以得到残差值的直方图和 Jarque-Bera统计量,
如图 3-17-4所示:
图 3-17-3
图 3-17-4
七、比较、选择最佳模型
估计过程中,对每个模型检验以下内容,以便选择出一个
最佳模型:
㈠回归系数的符号及数值是否合理;
㈡模型的更改是否提高了拟合优度;
㈢模型中各个解释变量是否显著;
㈣残差分布情况
以上比较模型的㈠、㈡、㈢步在步骤一中已有阐述,现分
析模型1和模型2的残差分布情况。
分 别 在 模 型 1 ~ 模 型 2 的 各 方 程 窗 口 中 点 击
View/Actual,Fitted,Residual/Actual,Fitted,ResidualTa
ble(图3-18),可以得到各个模型相应的残差分布表(图
3-19-1至图3-19-2)。
3-18
图 3-19-1模型 1的残差分布
图 3-19-2模型 2的残差分布
可以看出,模型 1的各期残差中大多数都落在±σˆ的虚
线框内,且残差分布不存在明显的规律性。但是,由步骤五
中的分析可知,模型 1中除了解释变量 K之外,其余变量均
没有通过变量显著性检验,因此,该模型也应舍弃。
模型 2具有合理的经济意义,都通过了 t检验和 F检验,
拟合优度高,理论上讲可以描述资本、劳动的投入与产出的
关系。因此可以选择模型 2为我国国有工业企业生产函数。
七、预测
从方程 eq02 的工具栏中,点击 View/Representations,
便得到目标方程的表达式,加黑的部分就是回归方程估计结
果的表达式,如图 3-20所示:
图 3-20
当 L=5010,K= 时,我们将预测国内工业总产值
是多少?
将加黑的方程复制到 Eviews 的命令窗口,如图 3-21 所
示:
图 3-21
然后编辑,首先进行左边因变量名称的修改,这点很重
要,要避免覆盖因变量 Y.为此我们没有使用命令造一个变量
(Series),而只是造一个纯量(scalar),或者说是一个常
数。我们将新纯量命名为 R3,输入命令如图 3-22所示:
图 3-22
点击回车键,注意:该命令的执行会导致在文档中产生
一个永久纯量图标,如图 3-23阴影部分所示:
图 3-23
通过双击图标 R3,可以在任何时间显示在 Eviews 主窗
口左下角的状态栏里,如图 3-24所示:
图 3-28
显然,当 L=5010,K= 时,我们将预测国内工业
总产值是 12017.。
实验六:经济计量模型建模----模型的调整(实验学时:2)
实验内容:模型的调整,是指对模型检验提出的问题如何予以解
决,包括多重共线性、异方差性、自相关性以及模型设定误差、测
量误差等。
实验原理:
一、多重共线性
1、多重共线性的概念:对于模型
Yi=b0+b1X1i+b2X2i+¼+bkXki+mii=1,2,…,n
其基本假设之一是解释变量是互相独立的。
如果某两个或多个解释变量之间出现了相关性,则称为多重共线性
(Multicollinearity)。
2、多重共线性的经济解释
(1)经济变量在时间上有共同变化的趋势。如在经济上升时期,
收入、消费、就业率等都增长,当经济收缩期,收入、消费、就业
率等又都下降。当这些变量同时进入模型后就会带来多重共线性问
题。
(2)解释变量与其滞后变量同作解释变量。
3、多重共线性的理论后果
(1)即使是在接近共线性的情形下,普通最小二乘法估计量仍
然是无偏的。但要记住的是,无偏性是一个重复抽样的性质。
(2)接近共线性也并未破坏普通最小二乘估计量的最小方差性:
在所有线性无偏估计量中,普通最小二乘法估计量的方差最小。但
最小方差并不意味着方差值也较小。
(3)即使变量 X与总体(也即 PRF)不线性相关,但却可能与某一
样本线性相关,从这个意义上说,多重共线性本质上是一个样本(回
归)现象。
4、多重共线性的实际后果
(1)普通最小二乘法估计量的方差和标准差较大,普通最小二乘
法估计量的精确度降低。
(2)置信区间变宽。由于标准差较大,所以总体参数的置信区间
也就变大了。
(3)t值不显著。
(4)R2值较高,但 t值则并不都显著。
(5)普通最小二乘估计量及其标准差对数据的微小变化非常敏感;
也就是说,它们趋于不稳定。
(6)回归系数符号有误。
(7)难以衡量各个解释变量对回归平方和(ESS)或者 R2的贡献。
5、多重共线性的检验
(1)初步观察。当模型的拟合优度(R2)很高,F值很高,而每个
回归参数估计值的方差 Var(j)又非常大(即 t 值很低)时,说明
解释变量间可能存在多重共线性。
(2)Klein 判别法。计算多重可决系数 R2及解释变量间的简单相
关系数 rxixj。若有某个
rxixj>R2,则 xi,xj间的多重共线性是有害的。
(3)此外还有其他一些检验方法,如主成分分析法等,很复杂。
6、多重共线性的克服方法
(1)直接合并解释变量
当模型中存在多重共线性时,在不失去实际意义的前提下,可
以把有关的解释变量直接合并,从而降低或消除多重共线性。
如果研究的目的是预测全国货运量,那么可以把重工业总产值
和轻工业总产值合并为工业总产值,从而使模型中的解释变量个数
减少到两个以消除多重共线性。甚至还可以与农业总产值合并,变
为工农业总产值。解释变量变成了一个,自然消除了多重共线性。
(2)利用已知信息合并解释变量
通过经济理论及对实际问题的深刻理解,对发生多重共线性的
解释变量引入附加条件从而减弱或消除多重共线性。比如有二元回
归模型
yt=0+1xt1+2xt2+ut()
x1与 x2间存在多重共线性。如果依据经济理论或对实际问题的深入
调查研究,能给出回归系数1与2的某种关系,例如
2=1()
其中为常数。把上式代入模型(),得
yt=0+1xt1+1xt2+ut=0+1(xt1+xt2)+ut()
令
xt=xt1+xt2
得
yt=0+1xt+ut()
模型()是一元线性回归模型,所以不再有多重共线性问
题。用普通最小二乘法估计模型(),得到,然后再利用
()式求出。
(3)增加样本容量或重新抽取样本
这种方法主要适用于那些由测量误差而引起的多重共线性。当
重新抽取样本时,克服了测量误差,自然也消除了多重共线性。另
外,增加样本容量也可以减弱多重共线性的程度。
(4)合并截面数据与时间序列数据
这种方法属于约束最小二乘法(RLS)。其基本思想是,先由截
面数据求出一个或多个回归系数的估计值,再把它们代入原模型中,
通过用因变量与上述估计值所对应的解释变量相减从而得到新的
因变量,然后建立新因变量对那些保留解释变量的回归模型,并利
用时间序列样本估计回归系数。
(5)逐步回归法
(1)用被解释变量对每一个所考虑的解释变量做简单回归。(2)
以对被解释变量贡献最大的解释变量所对应的回归方程为基础,以
对被解释变量贡献大小为顺序逐个引入其余的解释变量。这个过程
会出现 3种情形。①若新变量的引入改进了 R2,且回归参数的 t检
验在统计上也是显著的,则该变量在模型中予以保留。②若新变量
的引入未能改进 R2,且对其他回归参数估计值的 t检验也未带来什
么影响,则认为该变量是多余的,应该舍弃。③若新变量的引入未能
改进 R2,且显著地影响了其他回归参数估计值的符号与数值,同时
本身的回归参数也通不过 t检验,这说明出现了严重的多重共线性。
舍弃该变量。
进行逐步回归的SPSS操作步骤如下:
(1)在SPSS中输入变量数据,设变量名分别为Y、X1、X2。
(2)选择主菜单[Analyze]=>[Regression]=>[Linear…],显
示如图8-82所示的对话框。选择
Y进入因变量框,选择X1、X2进入自变量列表框。选择[Method(方
法)]为[Stepwise]。
(3)单击[Options]按钮,打开[LinearRegression:Options]
子对话框(如图8-90所示),该对
话框的[SteppingMethodCriteria]栏给出了引入/删除自变量的
默认F临界值/p值。本例采用
SPSS默认值,单击[Continue]按钮返回。
图8-90回归分析选项对话框
(4)单击主对话框中的[OK]按钮,输出结果为:
二、异方差
1、异方差的概念
2、异方差的后果
异方差对最小二乘估计量(OLS)的影响:
1、OLS仍是线性
2、OLS仍是无偏的
3、OLS不再是最小方差,不再是最有效的
4、OLS估计量方差的公式得到的方差是有偏的。
6、建立在 t分布和 F分布的置信区间和假设检验不可靠。
3、异方差检验
定性分析异方差
(1)经济变量规模差别很大时容易出现异方差。如个人收入与支出
关系,投入与产出关系。
(2)利用散点图做初步判断。因变量 Y与解释变量 X的散点图
当 Y与 X的散点图分布的区域逐渐变宽、变窄或出现不规则的
复杂变化时,都可能存
在异方差。如图 8-92 所示,(A)为同方差的情形,(B)为递增异
方差的情形,(C)为递减
异方差的情形,(D)为复杂异方差的情形。
(3)利用残差图做初步判断。
残差平方e2与X的散点图
如果扰动项ε存在异方差,在残差平方e2与X的散点图上,e2
不会近似于某一常数。
因此可依此判断是否存在异方差。各种异方差情形所对应的 e2
与 X 的散点图如图 8-95 所示。
异方差检验
2 25 / . .ie d f 、 不再是真实 的无偏估计量
(1)White检验
White检验由 年提出。Goldfeld-Quandt检验必
须先把数据按解释变量的值从小到大排序。Glejser检验通常要试
拟合多个回归式。White检验不需要对观测值排序,也不依赖于随
机误差项服从正态分布,它是通过一个辅助回归式构造2统计量进
行异方差检验。White检验的具体步骤如下。以二元回归模型为例,
yt=0+1xt1+2xt2+ut()
①首先对上式进行 OLS回归,求残差。
②做如下辅助回归式,
=0+1xt1+2xt2+3xt12+4xt22+5xt1xt2+vt()
即用对原回归式中的各解释变量、解释变量的平方项、交叉积项进
行 OLS回归。注意,上式中要保留常数项。求辅助回归式()的
可决系数 R2。
③White检验的零假设和备择假设是
H0:()式中的 ut不存在异方差,
H1:()式中的 ut存在异方差
④在不存在异方差假设条件下统计量
TR22(5)()
其中 T表示样本容量,R2是辅助回归式()的 OLS估计式的可决
系数。自由度 5表示辅助回归式()中解释变量项数(注意,不
计算常数项)。TR2属于 LM统计量。
⑤判别规则是
若 TR2 2(5),接受 H0(ut具有同方差)
若 TR2>2(5),拒绝 H0(ut具有异方差)
(2)Goldfeld-Quandt检验
H0:ut具有同方差,H1:ut具有递增型异方差。
构造 F 统计量。①把原样本分成两个子样本。具体方法是把成
对(组)的观测值按解释变量的大小顺序排列,略去 m个处于中心
位置的观测值(通常 T30时,取 mT/4,余下的 T-m个观测值自然
分成容量相等,(T-m)/2,的两个子样本。)
{x1,x2,…,xi-1,xi,xi+1,…,xT-1,xT}
n1=(T-m)/2m=T/4n2=(T-m)/2
②用两个子样本分别估计回归直线,并计算残差平方和。相对
于 n2和 n1分别用 SSE2和 SSE1表式。③F统计量是
F==,(k为模型中被估参数个数)
在 H0成立条件下,FF(n2-k,n1-k)
④判别规则如下,
若 FF(n2-k,n1-k),接受 H0(ut具有同方差)
若 F>F(n2-k,n1-k),拒绝 H0(递增型异方差)
注意:
①当摸型含有多个解释变量时,应以每一个解释变量为基准检
验异方差。
②此法只适用于递增型异方差。
③对于截面样本,计算 F统计量之前,必须先把数据按解释变
量的值从小到大排序。
(3)Glejser检验
检验是否与解释变量 xt存在函数关系。若有,则说明存在异方差;
若无,则说明不存在异方差。通常应检验的几种形式是
=a0+a1xt
=a0+a1xt2
=a0+a1,….
Glejser检验的特点是:
①既可检验递增型异方差,也可检验递减型异方差。
②一旦发现异方差,同时也就发现了异方差的具体表现形
式。
③计算量相对较大。
④当原模型含有多个解释变量值时,可以把拟合成多变
量回归形式。
4、补救措施
由于异方差存在时普通最小二乘估计量是非有效的,所以对于
已经检验出存在异方差的
回归模型,就不应再直接采用普通最小二乘法来估计模型的参数。
常用于处理异方差问题的
方法是采用加权最小二乘法(WLS,WeightedLeastSquares)。
分两种情况处理:
1、误差的真实值是已知的
2、误差的真实值是未知的
误差的真实值是已知的加权最小二乘法(WLS)
误差的真实值是未知的
需要对做假定
1、误差与 Xi成比例:平方根变换
三、自相关
1、自相关的性质:
E(ui,uj)=0,i不等于 j
2、自相关产生的原因
惯性
模型设定误差
蛛网现象
数据加工
3、自相关的后果
OLS仍是线性的无偏的
OLS不再是有效的
OLS估计量的方差是有偏的。
1 2
1 2
1
( ) ( )
i i i
i i i
i i i i
Y B B X
Y X
B B
变为
2
i
2
i
2
i
t和 F检验不在可靠
σ=RSS/.是真实σ的有偏估计量
R的测度不在真实
计算预测的方差和标准差也可能无效
3、自相关的诊断
(1) 图示法
图示法是一种直观的检验方法,是把给定的回归模型直接用OLS法
估计参数,求出残
差项e,e作为扰动项ε的真实值的估计值,再绘出残差e的散点图,
根据e的相关性来判
断扰动项ε的自相关性。残差e的散点图通常有两种绘制方式:绘
制−1−ttee的散点图和按
时间顺序绘制残差的散点图。在−1−ttee散点图中,如果大部分点落
在第一、三象限,表明
扰动项ε存在正自相关,如图8-100(A)所示;如果大多数点落在
第二、四象限,表明扰动项
ε存在负自相关,如图8-100(B)所示。在ett−−散点图中,如果te
随时间变化并不频繁地改
变符号,而是相几个正的te后面跟着几个负的te,表明扰动项存在
正自相关,如图8-100(C)
所示;如果te随着时间的逐次变化频繁地改变符号,表明扰动项存
在负自相关,如图8-100(D)
所示。
(2) DW(Durbin-Watson)检验法
DW 检验是 , 于 1950,1951 年提出的。它是利
用残差 et构成的统计量推断误差项 ut是否存在自相关。使用 DW检
验,应首先满足如下三个条件。
(1) 误差项 ut的自相关为一阶自回归形式。
(2) 因变量的滞后值 yt-1不能在回归模型中作解释变量。
(3) 样本容量应充分大(T15)
DW检验步骤如下。给出假设
H0:=0(ut不存在自相关)
H1:0(ut存在一阶自相关)
用残差值 et计算统计量 DW。
DW=()
其中分子是残差的一阶差分平方和,分母是残差平方和。把上式展
开,
DW=()
因为有
≈≈,()
代入()式,
DW≈=2(1-)=2(1-).()
因为的取值范围是[-1,1],所以 DW 统计量的取值范围是[0,4]。
与 DW值的对应关系见表 。
表 与 DW值的对应关系及意义
DW ut的表现
=0 DW=2 ut非自相关
=1 DW=0 ut完全正自相关
=-1 DW=4 ut完全负自相关
0<<1 0<DW<2 ut 有某种程度的
正自相关
-1<<0 2<DW<4 ut 有某种程度的
负自相关
实际中 DW=0,2,4 的情形是很少见的。当 DW 取值在(0,2),
(2,4)之间时,怎样判别误差项 ut是否存在自相关呢?推导统计
量 DW 的精确抽样分布是困难的,因为 DW 是依据残差 et计算的,
而 et的值又与 xt的形式有关。DW 检验与其它统计检验不同,它没
有唯一的临界值用来制定判别规则。然而 Durbin-Watson根据样本
容量和被估参数个数,在给定的显著性水平下,给出了检验用的上、
下两个临界值 dU和 dL。判别规则如下:
图
(1)若 DW 取值在(0,dL)之间,拒绝原假设 H0,认为 ut存在一阶正
自相关。
(2)若 DW取值在(4-dL,4)之间,拒绝原假设 H0,认为 ut存在一
阶负自相关。
(3)若 DW 取值在(dU,4-dU)之间,接受原假设 H0,认为 ut非自
相关。
(4)若 DW取值在(dL,dU)或(4-dU,4-dL)之间,这种检验没有
结论,即不能判别
ut是否存在一阶自相关。判别规则可用图 表示。
当 DW值落在“不确定”区域时,有两种处理方法。①加大样本容
量或重新选取样本,重作 DW检验。有时 DW值会离开不确定区。②选
用其它检验方法。
DW 检验表 4 给出 DW 检验临界值。DW 检验临界值与三个参数有
关。①检验水平,②样本容量 T,③原回归模型中解释变量个数 k
(不包括常数项)。
注意:①因为 DW统计量是以解释变量非随机为条件得出的,所
以当有滞后的内生变量作解释变量时,DW检验无效。②不适用于联
立方程模型中各方程的序列自相关检验。③DW统计量不适用于对高
阶自相关的检验。
SPSS可以输出DW值。在回归分析对话框中单击[Statistics]
按钮,打开[Linear
Regression:Statistics]子对话框,在[Residuals]栏中选择
[Durbin-Watson]选项,单击[Continue]
按钮返回再单击主对话框[OK]按钮。这样在SPSS的输出结果中将
包含DW值,根据该值就
可以进行检验。
4、克服自相关
如果模型的误差项存在自相关,首先应分析产生自相关的原因。
如果自相关是由于错误地设定模型的数学形式所致,那么就应当修
改模型的数学形式。怎样查明自相关是由于模型数学形式不妥造成
的?一种方法是用残差 et对解释变量的较高次幂进行回归,然后对
新的残差作 DW 检验,如果此时自相关消失,则说明模型的数学形
式不妥。
如果自相关是由于模型中省略了重要解释变量造成的,那么解
决办法就是找出略去的解释变量,把它做为重要解释变量列入模型。
怎样查明自相关是由于略去重要解释变量引起的?一种方法是用
残差 et对那些可能影响因变量但又未列入模型的解释变量回归,并
作显著性检验,从而确定该解释变量的重要性。如果是重要解释变
量,应该列入模型。
只有当以上两种引起自相关的原因都消除后,才能认为误差项
ut“真正”存在自相关。在这种情况下,解决办法是变换原回归模
型,使变换后的随机误差项消除自相关,进而利用普通最小二乘法
估计回归参数。这种变换方法称作广义最小二乘法。下面介绍这种
方法。
设原回归模型是
yt=0+1x1t+2x2t+…+kxkt+ut(t=1,2,…,T)()
其中 ut具有一阶自回归形式
ut=ut-1+vt
其中 vt满足通常的假定条件,把上式代入()式,
yt=0+1x1t+2x2t+…+0xkt+ut-1+vt
求模型()的(t-1)期关系式,并在两侧同乘,
yt-1=0+1x1t-1+2x2t-1+…+kxkt-1+ut-1
用()式与上式相减得
yt-yt-1=0(1-)+1(x1t-x1t-1)+…+k(xkt-xkt-1)+vt()
令
yt*=yt-yt-1,
xjt*=xjt-xjt-1,j=1,2,…k
0*=0(1-),
则模型()表示如下,
yt*=0*+1x1t*+2x2t*+…+kxkt*+vt(t=2,3,…T)()
上述变换称作广义差分变换。上式中的误差项 vt是非自相关的,
满足假定条件,所以可对上式应用最小二乘法估计回归参数。所得
估计量具有最佳线性无偏性。上式中的1…k就是原模型()
中的1…k,而0*与模型()中的0有如下关系,
0*=0(1-),0=0*/(1-)()
注意:
(1)对()式进行 OLS估计得到的0,1,…,k的估计量称
作普通最小二乘估计量;对()式进行 OLS 估计得到的
0,1,,…,k的估计量称作广义最小二乘估计量。
(3)当误差项 ut的自相关具有高阶自回归形式时,仍可用与上
述相类似的方法进行广义差分变换。比如 ut具有二阶自回归形式,
ut=1ut-1+2ut–2+vt,
则变换过程应首先求出原模型(t-1)期与(t-2)期的两个关系式,
然后利用与上述相类似的变换方法建立符合假定条件的广义差分
模型。若 ut具有 k阶自回归形式,则首先求 k个不同滞后期的关系
式,然后通过广义差分变换使模型的误差项符合假定条件。
需要注意的是对二阶自回归形式,作广义差分变换后,要损失
两个观测值;对 k阶自回归形式,作广义差分变换后,将损失 k个
观测值。
(4)当用广义差分变量回归的结果中仍存在自相关时,可以对广
义差分变量继续进行广义差分直至回归模型中不存在自相关为止。
5、自相关系数的估计
上一节介绍了解决自相关的方法。这种方法的应用还有赖于知道
值。下面介绍两种估计的方法。
(1)用 DW统计量估计。
由()式,DW=2(1-),得
=1-(DW/2)
首先利用残差 et求出 DW 统计量的值,然后利用上式求出自相关系
数的估计值。
注意:①用此法时样本容量不宜过小。②此法不适用于动态模
型(即被解释变量滞后项做解释变量的模型)。
(3) 用残差进行自回归的方法估计(特别对高阶自回归形
式)。
实验说明:值得注意的是,模型的检验与调整并不是截然分离的,
这里只是为了论证方便,认为地将其分为两个阶段去说明。模型的
估计、检验和调整通常是一个统一体中的不同侧面,相辅相成;并
且模型的估计、检验和调整要进行若干的重复,即所谓的重新估计、
重新检验和重新调整,直到模型满意为止。
操作要求:具体 Eviews 操作以下面的案例分析为例说明。要求
至少用一种方法进行模型多重共线性、异方差型、自相关性的检验,
如果存在问题,并运用合适的方法进行修正补救,直到模型满意为
止。
例 1:关于中国电信业务总量的计量经济模型(多重共线性问题
的处理)
经初步分析,认为影响中国电信业务总量变化的主要因素是邮
政业务总量、中国人口数、市镇人口占总人口的比重、人均 GDP、
全国居民人均消费水平。用 1991-1999年数据建立中国电信业务总
量计量经济模型。具体数据见表 1
Lny=+–++
()()()()()()
R2=,F=,DW=,T=9,(1991-1999),(3)=,
R2=,而每个回归参数的 t检验在统计上都不显著,这说明
模型中存在严重的多重共线性。
表 1变量 y,x1,x2,x3,x4,x5的数据
年 电信业务
总量
邮政业务
总量
中国人
口数
市镇人口
比重
人均
GDP
人均消费
水平
y x1 x2 x3 x4 x5
199
1
199
2
199
3
199
4
199
5
199
6
199
7
199
8
199
9
资料来源:《中国统计年鉴》2000
操作步骤与过程:
1、创建工作文件
在主菜单上依次单击 File→New→Workfile,选择数据类
型和起止日期。时间序列提供起止日期(年、季度、月度、
周、日),非时间序列提供最大观察个数。本例中在 StartData
里输入 1991,在 Enddata里输入 1999,单击 OK后屏幕出现
Workfile工作框,如图 6-1所示。
工作文件创立后,需将工作文件保存到磁盘,单击工具
条中 Save→输入文件名、路径→保存,或单击菜单兰中 File
→Save或 Saveas→输入文件名、路径→保存。
图 6-1
2、输入和编辑数据
在 Object菜单里选 Newobject中的 Group项,进入输入数据
的对话框见图 6-2输入 Y、x1、x2、x3、x4、x5数据见图
6-3。
图 6-2
图 6-3
数据输入完毕,单击工作文件窗口工具条的 Save或单击
菜单兰的 File→Save将数据存入磁盘。
3、建立如下多元线性回归模型,进行参数估计
ln()
用 最 小 二 乘 法 对 式 ( ) 中 的 参 数 进 行 估 计 , 选
Quick/EstimateEquation项,在弹出的估计对话框中输入变量(图
6-4),点击确定对话参数做 OLS估计,输出结果见图 6-5。
图 6-4估计对话框
图 6-5回归分析结果
由回归结果可以看出 F检验结果是显著的,但是由于可决系数
R2= 很高,可是所有的变量显著性检验都没有通过检验,表
明方程存在严重多重共线性。
4、多重共线性诊断
下面用 Klein判别法进行分析。首先给出解释变量间的简单相
关系数矩阵。
用 EViews求相关系数矩阵有如下两种方法:
(1)点击 Quick键并依次选择 GroupStatistics,Correlations,
将出现一个要求填写序列名的对话框(SeriesList)(图 6-6),填
好序列名后按 OK,即可得到相关系数矩阵(图 6-7)。
(2)在 Workfile窗口中用鼠标选中序列名,点击 Show键,OK键,
从而打开数据组(Group)窗口。在数据组窗口点击 View键选择
Correlations。
图 6-6
图 6-7
因为其中有一个简单相关系数大于 R2=,所以根据 Klein
判别法,模型中存在严重的多重共线性。
5、用逐步回归法修正多重共线性
用逐步回归法筛选解释变量。
(1)用每个解释变量分别对被解释变量做简单回归,以可决系
数为标准确定解释变量的重要程度,为解释变量排序。
Lny=+206x1
()()R2=,F=204,T=9
Lny=-291x2
()()R2=,F=555,T=9
Lny=+7075x3
()()R2=,F=,T=9
Lny=+
()()R2=,F=,T=9
Lny=+
()()R2=,F=,T=9
解释变量的重要程度依次为 x2,x3,x1,x4,x5。
(2)以 Lny=-291x2为基础,依次引入 x3,x1,x4,x5。首
先把 x3引入模型,
Lny=-2024x2+
()()()R2=,F=,T=9
因为 x3的引入使各回归系数的 t 值下降,同时 x3的系数也未通过
t检验,所以应剔除 x3。接着把 x1引入模型,
Lny=––
()()()R2=,F=,T=9
同理剔除 x1引入 x4
Lny=–+
()()()R2=,F=,T=9
同理剔除 x4引入 x5
Lny=–+
()()()R2=,F=,T=9
同理剔除 x5,最后确定的模型是(回归结果见图 6-8)
Lny=-291x2
()()R2=,F=555,T=9
图 6-8逐步回归最后确定回归结果
或者用解释变量之间相关系数值最小的 x1和 x4同做解释变量
与 Lny回归(回归结果见图 6-9),得
图 6-9
Lny=–+
()()()R2=,F=184,T=9
例 2:案例分析(异方差问题的处理)
1、问题的提出和模型设定
为了给制定医疗机构的规划提供依据,分析比较医疗机构与人
口数量的关系,建立卫生医疗机构数与人口数的回归模型。假定医
疗机构数与人口数之间满足线性约束,则理论模型设定为
()
其中表示卫生医疗机构数,表示人口数。由 2001 年《四川统计年
鉴》得到如下数据。
表 四川省 2000年各地区医疗机构数与人口数
地区 人口数(万
人)
X
医疗机构数
(个)Y
地区 人口数(万
人)
X
医疗机构数
(个)Y
成都 6304 眉山 827
自贡 315 911 宜宾 1530
攀枝
花
103 934 广安 1589
泸州 1297 达州 2403
德阳 1085 雅安 866
绵阳 1616 巴中 1223
广元 1021 资阳 1361
遂宁 371 1375 阿坝 536
内江 1212 甘孜 594
乐山 1132 凉山 1471
南充 4064
2、创建工作文件
在主菜单上依次单击 File→New→Workfile,选择数据类
型和起止日期。在工作文件定义对话框(图 7-1)中的
“ Workfilestructuretype” 下 拉 菜 单 中 选 择
Unstructured/Undated,在“Datarange”框中输入 21,给工
作文件命名为:实验 7案例分析,点击 OK按钮即可建立了新
的工作文件。
工作文件创立后,需将工作文件保存到磁盘,单击工具
条中 Save→输入文件名、路径→保存,或单击菜单兰中 File
→Save或 Saveas→输入文件名、路径→保存。
图 7-1
2、输入和编辑数据
在 Object菜单里选 Newobject中的 Group项,进入输入数
据的对话框见图 7-2 输入 Y、x数据见图 7-3.
.
图 7-2
图 7-3
数据输入完毕,单击工作文件窗口工具条的 Save或单击
菜单栏的 File→Save将数据存入磁盘。
3、建立如下线性回归模型,进行参数估计
()
用 最 小 二 乘 法 对 式 ( ) 中 的 参 数 进 行 估 计 , 选
Quick/EstimateEquation项,在弹出的估计对话框中输入变量(图
7-4),点击确定对参数做 OLS估计,输出结果见图 7-5。
图 7-4估计对话框
图 7-5回归分析结果
估计结果为
Y=+5.*X()
4.检验模型的异方差
本例用的是四川省 2000 年各地市州的医疗机构数和人口数,
由于地区之间存在的不同人口数,因此,对各种医疗机构的设置数
量会存在不同的需求,这种差异使得模型很容易产生异方差,从而
影响模型的估计和运用。为此,必须对该模型是否存在异方差进行
检验。
(一)图形法
a、对 Y 和 X 两变量绘制散点图,在主窗口菜单栏中选择
QuickScatter,弹出图 7-6 所示的对话框,在对话框中输入“XY”,
点击 OK按钮便得到了 X和 Y两变量散点图(见图 7-7)
图 7-6序列选择对话框
图 和 xt散点图
从 yt和 xt观测值的散点图(见图 )可以发现数据中存在异
方差。
b、再对()回归残差平方 E2与 x绘制散点图。
具体 EViews软件操作过程:
第 一 步 : 由 路 径 : Quick/EstimateEquation , 进 入
EquationSpecification窗口,键入“ycx”,确认并“ok”,得样本
回归估计结果,见图 7-5.
第二步:生成残差平方序列。在得到图 估计结果后,立即
用生成命令建立序列,记为 e2。生成过程如下,先按路径:
Quick/GenerateSeries,进入 GenerateSeriesbyEquation对话框,
在弹出的对话框中输入生成序列 E2 的公式“E2=Resid^2”(图 )。
图 生成新序列对话框
即,在 GenerateSeriesbyEquation对话框中(如图 )输入“e2=
(resid)^2”,则生成序列。
第三步:绘制对的散点图。选择变量名 X 与 e2(注意选择变量
的顺序,先选的变量将在图形中表示横轴,后选的变量表示纵轴),
进入数据列表,再按路径 viewscatter,可得散点图,见图 .
图 和 X的散点图
第四步:判断。由图 看出,残差平方对解释变量 X 的散点
图主要分布在图形中的下三角部分,大致看出残差平方随的变动呈
增大的趋势,因此,模型很可能存在异方差。但是否确实存在异方
差还应通过更进一步的检验。
(二)Goldfeld-Quanadt检验
1、EViews软件操作。
(1)对变量取值排序(按递增或递减)。在 Procs 菜单里选
SortSeries 命令,出现排序对话框,如果以递增型排序,选
Ascenging,如果以递减型排序,则应选 Descending,键入 X,点
ok。本例选递增型排序,这时变量 Y与 X将以 X按递增型排序。
(2)构造子样本区间,建立回归模型。在本例中,样本容量 n=21,
删除中间 1/4的观测值,即大约 5个观测值,余下部分平分得两个
样本区间:1—8和 14—21,它们的样本个数均是 8个,即。
在 Sample菜单里,将区间定义为 1—8,然后用 OLS方法求得如
下结果
表
在 Sample菜单里,将区间定义为 14—21,再用 OLS方法求得如
下结果
表
(3)求 F 统计量值。基于表 和表 中残差平方和的数
据,即 Sumsquaredresid的值。由表 计算得到的残差平方和为,
由表 计算得到的残差平方和为,根据 Goldfeld-Quanadt检验,
F统计量为
()
(4)判断。在下,式()中分子、分母的自由度均为 6,
查 F分布表得临界值为,因为,所以拒绝原假设,表明模型确实存
在异方差。
(三)White检验
在估计的结果窗口菜单栏(见图 7-10)上,按路径
view/residualtests/whiteheteroskedasticity
(nocrosstermsorcrossterms),进入 White 检验对话框(见图
7-11-1 ), 在 TestType 中 选 择 white 方 法 , 并 选 择 上
Includewhitecrossterms,则辅助函数为
()
经估计出现 White检验结果,见表 。
从表 可以看出,,由 White检验知,在下,查分布表,得临
界值(在()式中只有两项含有解释变量,故自由度为 2),比
较计算的统计量与临界值,因为>,所以拒绝原假设,不拒绝备择
假设,表明模型存在异方差。
图 7-11怀特检验菜单项选择
图 7-11-1white检验对话框
表 怀特检验结果
HeteroskedasticityTest:White
F-statistic
8 (2,18)
Obs*R-squared
1 -Square(2)
ScaledexplainedS
S
0 -Square(2)
TestEquation:
DependentVariable:RESID^2
Method:LeastSquares
Date:1210Time:23:33
Sample:121
Includedobservations:21
Coeffic
ient
t-Statist
ic Prob.
C
823375.
5
X
78
X^2
7
R-squared
5 Meandependentvar
351198.
3
AdjustedR-square
d
8
454261.
0
178711.
1 Akaikeinfocriterion
9
Sumsquaredresid
+1
1 Schwarzcriterion
1
Loglikelihood
32 Hannan-Quinncriter.
8
F-statistic
8 Durbin-Watsonstat
5
Prob(F-statistic
)
0
5、异方差性的修正
(一)加权最小二乘法(WLS)
在 Eviews中生成新序列,就在 OLS估计中使用加权处理方式来
完 成 加 权 最 小 二 乘 估 计 : 在 主 菜 单 中 选 择 选
Quick/EstimateEquation项,在弹出的估计对话框(图 7-4)中,
在 窗 口 的 “ Equationspecification” 栏 中 输 入 YCX, 在
“ Estimationsettings” 的 “ Method” 下 拉 菜 单 栏 中 选 择
“LS-LeastSquares(NLSandARMA)”.该窗口填写完毕后点击窗口
上方的“Options”按钮出现如图 7-12所示的模型估计窗口。在窗
口中选择 WeightedLS/TSLS 选项,再在 Weight 项后填写权数序列
名(见图 7-12),在运用 WLS法估计过程中,我们分别选用了权数。
权数的生成过程如下,由图 ,在对话框中的 Weight 处,按如
下格式分别键入:;;,单击确定,经估计检验发现用权数的效果
最好。下面仅给出用权数的结果(表 7-4)。
表
DependentVariable:Y
Method:LeastSquares
Date:1210Time:23:37
Sample:121
Includedobservations:21
Weightingseries:1/X^2
Coeffic
ient
t-Statist
ic Prob.
C
3
X
7
WeightedStatistic
s
R-squared
9 Meandependentvar
9
AdjustedR-square
d
4
7
7 Akaikeinfocriterion
2
Sumsquaredresid . Schwarzcriterion
0
Loglikelihood
89 Hannan-Quinncriter.
1
F-statistic
8 Durbin-Watsonstat
0
Prob(F-statistic
)
6
UnweightedStatist
ics
R-squared
3 Meandependentvar
3
AdjustedR-square
d
9
5
3 Sumsquaredresid 5
Durbin-Watsonsta
t
9
表 的估计结果如下
Y=+2.*X()
可以看出运用加权小二乘法消除了异方差性后,参数的 t 检验
均显著,可决系数大幅提高,F 检验也显著,并说明人口数量每增
加 1 万人,平均说来将增加 个卫生医疗机构,而不是
()中得出的增加 个医疗机构。虽然这个模型可能还
存在某些其他需要进一步解决的问题,但这一估计结果或许比
()中的结论更为接近真实情况。
例 3:案例分析(自相关问题的处理)
一、研究目的
2003年中国农村人口占 %,而消费总量却只占 %,农
村居民的收入和消费是一个值得研究的问题。消费模型是研究居民
消费行为的常用工具。通过中国农村居民消费模型的分析可判断农
村居民的边际消费倾向,这是宏观经济分析的重要参数。同时,农
村居民消费模型也能用于农村居民消费水平的预测。
二、模型设定
影响居民消费的因素很多,但由于受各种条件的限制,通常只
引入居民收入一个变量做解释变量,即消费模型设定为
()
式中,Yt为农村居民人均消费支出,Xt为农村人均居民纯收入,ut
为随机误差项。表 是从《中国统计年鉴》收集的中国农村居民
1985-2003年的收入与消费数据。
表 -2003年农村居民人均收入和消费单位:元
年份
全年人均纯收
入
(现价)
全年人均消费性
支出
(现价)
消费价格指数
(1985=100)
人均实际纯收
入
(1985可比
价)
人均实际消费性
支出
(1985可比价)
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
注:资料来源于《中国统计年鉴》1986-2004。
为了消除价格变动因素对农村居民收入和消费支出的影响,不
宜直接采用现价人均纯收入和现价人均消费支出的数据,而需要用
经消费价格指数进行调整后的 1985 年可比价格计的人均纯收入和
人均消费支出的数据作回归分析。
具体操作步骤与过程:
三、创建工作文件
在主菜单上依次单击 File→New→Workfile,选择数据类
型和起止日期。在工作文件定义对话框(图 7-1)中的
“ Workfilestructuretype ” 下 拉 菜 单 中 选 择
Dated/regularfrequency,本例中在 StartData里输入 1985,
在 Enddata里输入 2003,单击 OK后屏幕出现 Workfile工作
框,如图 8-3 所示。给工作文件命名为:实验 8 案例分析,
点击 OK按钮即可建立了新的工作文件。
工作文件创立后,需将工作文件保存到磁盘,单击工具
条中 Save→输入文件名、路径→保存,或单击菜单兰中 File
→Save或 Saveas→输入文件名、路径→保存。
图 8-3
四、输入和编辑数据
在 Object菜单里选 Newobject中的 Group项,进入输入数
据的对话框见图 8-4 输入 Y、x数据见图 8-5.
.
图 8-4
图 8-5
数据输入完毕,单击工作文件窗口工具条的 Save或单击
菜单栏的 File→Save将数据存入磁盘。
五、建立如下线性回归模型,进行参数估计
()
用 最 小 二 乘 法 对 式 ( ) 中 的 参 数 进 行 估 计 , 选
Quick/EstimateEquation项,在弹出的估计对话框中输入变量(图
8-6),点击确定对参数做 OLS估计,输出结果见表 8-3。
图 8-6估计对话框
表 8-3回归分析结果
DependentVariable:Y
Method:LeastSquares
Date:1210Time:11:21
Sample:3
Includedobservations:19
Coeffic
ient
t-Statist
ic Prob.
C
4
X
1
R-squared
1 Meandependentvar
5
AdjustedR-square
d
6
0
3 Akaikeinfocriterion
5
Sumsquaredresid
1 Schwarzcriterion
0
Loglikelihood
64 Hannan-Quinncriter.
0
F-statistic
9 Durbin-Watsonstat
8
Prob(F-statistic
)
0
根据表 中调整后的 1985年可比价格计的人均纯收入和人均消
费支出的数据,使用普通最小二乘法估计消费模型,根据表 8-3可
得
(8-11)
Se=()()
t=()()
R2=,F=,df=17,DW=
六、序列相关性的检验
(1)D.W统计量检验
根据表 8-3的参数估计结果可以知道,该回归方程可决系数较
高,回归系数均显著。对样本量为 19、一个解释变量的模型、5%显
著水平,查 DW统计表可知,dL=,dU=,模型中
DW=<dL,显然消费模型中有自相关。
这一点残差图中也可从看出,点击 EViews方程输出窗口的按钮
Resids可得到残差图,如图 所示。
图 残差图
图 残差图中,残差的变动有系统模式,连续为正和连续为
负,表明残差项存在一阶正自相关,模型中 t统计量和 F统计量的
结论不可信,需采取补救措施。
(3)LM检验
在方程工具栏中选择
View/residualTests/SerialCorrelationLMTest,在弹出的图
所示的滞后阶数定义对话框中设定滞后阶数,上面已经检验到序列
存在一阶自相关,现我们设定滞后的阶数为 2,点击 OK按钮得到 LM
检验结果(见表 8-4)。表中的 LM统计量显示,在 5%的显著性水平
上,c2(2)=,因为 LM=TR2=>c2(2)=,所以拒绝原假
设,即序列存在二阶序列相关性。
图 8-8滞后阶数对话框
表 8-4LM检验结果:
Breusch-GodfreySerialCorrelationLMTest:
F-statistic
7 (2,15)
Obs*R-squared
4 -Square(2)
TestEquation:
DependentVariable:RESID
Method:LeastSquares
Date:1210Time:11:27
Sample:3
Includedobservations:19
Presamplemissingvaluelaggedresidualssettozero.
Coeffic
ient
t-Statist
ic Prob.
C
65
X
6
RESID(-1)
5
RESID(-2)
85
R-squared
8 Meandependentvar
-1
4
AdjustedR-square
d
1
2
4 Akaikeinfocriterion
4
Sumsquaredresid
2 Schwarzcriterion
4
Loglikelihood
38 Hannan-Quinncriter.
4
F-statistic
1 Durbin-Watsonstat
7
Prob(F-statistic
)
7
七、序列相关性的修正
(1)已知自相关系数
为解决自相关问题,本案例用残差直接自回归的方法估计 r。由
模型()可得残差序列 et,在 EViews中,每次回归的残差存
放在 resid序列中,为了对残差进行回归分析,需生成命名为 e的
残差序列。在主菜单选择 Quick/GenerateSeries或点击工作文件
窗口工具栏中的 Procs/GenerateSeries,在弹出的对话框中输入
e=resid,点击 OK得到残差序列 et。使用 et进行滞后一期的自回归,
在 EViews命今栏中输入 lsee(-1)可得回归方程结果如下:
et=-1()
由式()可知=,对原模型进行广义差分,得到广义
差分方程()
对式()的广义差分方程进行回归,在 EViews命令栏中输
入 *Y(-1)*X(-1),回车后可得方程输出结果
如表 。
表 用残差直接自回归的方法估计 r的广义差分方程输出结
果
DependentVariable:*Y(-1)
Method:LeastSquares
Date:1210Time:11:39
Sample(adjusted):3
Includedobservations:18afteradjustments
Coeffic
ient
t-Statist
ic Prob.
C
6
*X(-1)
1
R-squared
2 Meandependentvar
5
AdjustedR-square
d
9
0
0 Akaikeinfocriterion
6
Sumsquaredresid
9 Schwarzcriterion
7
Loglikelihood
39 Hannan-Quinncriter.
7
F-statistic
5 Durbin-Watsonstat
5
Prob(F-statistic
)
0
由表 可得回归方程为
()
se=()()
t=()()
R2===16DW=
式中,。
由于使用了广义差分数据,样本容量减少了 1 个,为 18 个。查 5%
显著水平的 DW统计表可知 dL=,dU=,模型中 DW=>dU,
说明广义差分模型中已无自相关,不必再进行迭代。同时可见,可
决系数 R2、t、F统计量也均达到理想水平。
对比模型()和(),很明显普通最小二乘法低估了回
归系数的标准误差。[原模型中 Se()=,广义差分模型中为
Se()=。
经广义差分后样本容量会减少 1个,为了保证样本数不减少,可以
使用普莱斯—温斯腾变换补充第一个观测值,方法是和。在本例中
即为和。由于要补充因差分而损失的第一个观测值,所以在 EViews
中就不能采用前述方法直接在命令栏输入 Y和 X的广义差分函数
表达式,而是要生成 X和 Y的差分序列 X*和 Y*。在主菜单选择
Quick/GenerateSeries或点击工作文件窗口工具栏中的
Procs/GenerateSeries,在弹出的对话框中输入
Y*=*Y(-1),点击 OK得到广义差分序列 Y*,同样的方法得
到广义差分序列 X*。此时的 X*和 Y*都缺少第一个观测值,需计算
后补充进去,计算得=,=275.,双击工作文件窗口的 X*打
开序列显示窗口,点击 Edit+/-按钮,将=到 1985年对应
的栏目中,得到 X*的 19个观测值的序列。同样的方法可得到 Y*的
19个观测值序列。在命令栏中输入 LsY*cX*得到普莱斯—温斯腾变
换的广义差分模型回归结果(见表 8-6)为:
表 8-6:普莱斯—温斯腾变换的广义差分模型回归结果
DependentVariable:Y1
Method:LeastSquares
Date:1210Time:11:53
Sample:3
Includedobservations:19
Coeffic
ient
t-Statist
ic Prob.
C
0
X1
3
R-squared
6 Meandependentvar
6
AdjustedR-square
d
3
3
4 Akaikeinfocriterion
6
Sumsquaredresid
1 Schwarzcriterion
1
Loglikelihood
01 Hannan-Quinncriter.
1
F-statistic
1 Durbin-Watsonstat
1
Prob(F-statistic
)
0
由表 8-6,可得到普莱斯—温斯腾变换的广义差分模型回归结果为
()
()
t=(()
R2===19DW=
对比模型()和()可发现,两者的参数估计值和各
检验统计量的差别很微小,说明在本例中使用普莱斯—温斯腾变换
与直接使用科克伦—奥克特两步法的估计结果无显著差异,这是因
为本例中的样本还不算太小。如果实际应用中样本较小,则两者的
差异会较大。通常对于小样本,应采用普莱斯—温斯腾变换补充第
一个观测值。
由差分方程()有
()
由此,我们得到最终的中国农村居民消费模型为
Yt=+()
由()的中国农村居民消费模型可知,中国农村居民的边际消
费倾向为 ,中国农民每增加收入 1 元,将增加消费支出
元。
(2)未知自相关系数(用科克伦-奥科特迭代法)
假设检验到模型()存在 p阶序列相关,用科克兰内-奥克
特法对模型进行修正,直接在 Eviews中输入命令
LSYCXAR(1)AR(2)-----AR(p)
或 在 图 8-6 所 示 的 方 程 估 计 对 话 框 中 输 入
YCXAR(1)AR(2)-----AR(p),便可以得到修正后的参数估计结果。
见表 8-7
表8-7科克伦-奥科特迭代法回归结果:
DependentVariable:Y
Method:LeastSquares
Date:1210Time:12:01
Sample(adjusted):3
Includedobservations:17afteradjustments
Convergenceachievedafter5iterations
Coeffic
ient
t-Statist
ic Prob.
C
4
X
9
AR(1)
3
AR(2)
58
R-squared
2 Meandependentvar
6
AdjustedR-square
d
1
1
0 Akaikeinfocriterion
5
Sumsquaredresid
8 Schwarzcriterion
5
Loglikelihood
56 Hannan-Quinncriter.
3
F-statistic
1 Durbin-Watsonstat
4
Prob(F-statistic
)
0
InvertedARRoots
.
i .39+.52i
Y=+*X+[AR(1)=,AR(2)=]
取 a=5%,DW>du=1..401(样本容量:19)
表明:广义差分模型已不存在序列相关性。
实验七:经济计量模型建模----模型计量结果的分析(实验学时:
2)
实验内容:经过检验证明所估计的模型是符合要求的,最后应对
模型所提供的数量信息作具体的分析。根据建立模型的目的,可能
是经济结构分析、经济预测、政策评价,其中经济预测和政策评价
都要以所确立的经济结构为基础。
实验说明:对实证分析结果的解释力度做出说明,主要体现在对
回归系数的符号、大小以及检验结果的解释方式上。
操作要求:具体问题具体分析,注重分析角度全面、定性与定量
分析相结合,应对所估计的参数数值与符号的经济意义做具体研究
和评价。除了必须做一般性的解释外,如回归系数的符号、大小和
统计显著性等,还可以从灵敏度分析、弹性分析等多个角度,对回
归系数的经济意义进行说明,也可从不同估计方法差异性比较的角
度进行解释。
实验八:经济计量模型建模----研究结果的报告(实验学时:2)
实验内容:实证项目的计量经济研究的结论得到以后,为了让别
人了解研究的成果,应形成研究报告(或课程论文)。实训报告通
常可以考虑包括的内容如下:引言、理论分析与研究思路、计量经
济模型与估计方法、数据及处理、结果分析、结论。
1、引言
一定要非常清楚地在引言中交代如下几个问题:
第一,本文研究了什么问题。直接在文章开头写:本文研究了
什么什么问题,显得很清楚,开门见山。人们看你文章的第一个目
的就是发现你的文章为什么重要。
当你提出问题以后,你要去告诉别人为什么重要,这里面你就
需要说明创新,这时你就要把你的文章和既有的文献作比较,这就
涉及到了文献评论。如果文献评论不是非常长时,你可以把他简单
地放在引言部分。如果比较长,可以把最主要的、最经典的、最有
意义的放在这里,突出你研究的重要性和创新,其余放在第二部分
文献综述中再去说。第三就是概括你的工作,很清楚地告诉大家你
解决了什么问题。千万不要只说本文研究了什么。问题这么多,你
需要告诉大家你解决了什么问题,运用了什么方法。
2、理论分析与研究思路
接下来,我们来看理论怎么做,实证怎么做。先讲理论。无论
数学模型也好,用文字表述的理论也好,你首先要界定问题是什么,
你要揭示的现象是什么,界定哪些因素对这个问题是重要的。接下
来我们讲实证。你首先要知道你想看什么,你模型背后的理论基础
是什么,这些决定了你放什么变量。因为在不同的理论机制下,可
以有不同的解释变量,这完全取决于你想看什么。我特别强调,要
注意阅读文献,了解文献中的变量是怎么设置的,怎么度量的,十
分重要。千万不要不知所以地往模型塞变量。实证模型的设定要跟
着理论走。
3、计量经济模型与估计方法
对自己所建的计量经济学模型进行系统全面地论述。主要包括
两个方面的内容:一是关于模型的描述、对整个建模思路进行说明,
替别是研究的主要对象(被解释变量)的确定、影响因素的分析及
解释变量的选择、模型函数形式的假设等;二是关于推断方法的描
述,主要是选择得估计和假设检验的方法,指出所用方法与他人在
研究类似问题所使用的方法的差异性。这里要注意显著变量的处理
问题,很多人喜欢把不显著变量扔掉,但如果这个不显著的变量是
应该控制的,那么,把它扔到了残差项里的话,就可能导致遗漏变
量偏误。
那么最后一个问题是:R平方高不高是不是问题?很多同学在做
实证文章的时候常常问,我的 R平方只有 到 ,也就是说
我的模型只能解释数据的 8%到 9%。我说恭喜你,已经不错了,因
为在实证文章里有时 R平方只有 。R平方是什么意思?就是说,
我们的模型能解释数据的 variance的多少,可能对于绝大部分的
variance的解释,经济学家是不知道的。
4、数据的处理
这里要强调数据可以截面的、可以是面板的,数据来源可以是
公开的、可以是调查的。实证研究里,经常被大家提到的问题就是
内生性问题,这主要就是说你观察到的一个变量对另一个变量的影
响并不一定完全是它对另一个变量的影响。比如,教育程度高的人
收入水平也高,但收入水平高是不是因为受教育程度高?不一定。
因为教育程度高的人能力也高,所以这里面就存在一个估计偏误问
题,属于遗失变量的内生性问题。两个实际变量有共同时间趋势,
放在一起看来是相关的,但是只是因为它们有共同时间趋势而已,
这是伪回归问题。
5、结果分析
结果分析包括给出规范格式报告回归分析计算结果,以及估计
和假设检验结果经济意义的解释,还包括关于模型解释力度的讨论
等。
6、结论
在论文的结论部分,我建议大家的是要准确,不能夸大。你不
能总结出一个你的模型没有说明的结论。政策含义最好有,但不一
定必要。如果有,一定要是严格基于理论发现的结论。不基于理论
发现的结论,哪怕是正确的也不要说。因为你是在做科学的论文,
而不是政策建议的报告。如果是后者,没问题,你可以基于别人的
理论。有一个误区就是我们很多作者写文章,写了一大堆的政策结
论,每一句话都对,但真正跟他有关系的没多少。
最后也可以提出若干未解决的问题,这在写文章时起到的作用
有两个:一、在自己写完以后告诉读者这篇文章什么问题没解决;
二、如果你的文章里存在缺陷,自己讲出来要比审稿人讲好,与其
让审稿人讲,不如主动交代。此外,不要迷信别人在文章中提到的
没有解决的问题,道理很简单,如果这个问题是可以解决的,作者
早就解决了。不要因为别人提到这是个有待研究的方向你就去做,
因为作者这样写,可能是解决不了审稿人认为应该解决的问题,就
跟审稿人讲您说的是对的,但这个问题已超出了本文研究的范围,
我已经在文章的结尾将这个问题作为未来研究的方向提出来了。我
想经济学家都是这么做的。你在理解别人提出的未来研究方向时,
一定要小心,听听在这个领域专家的看法非常重要,那些专家可以
告诉你这些问题是否真的可以做。
实验说明:
1、研究报告并没有固定的格式,上述实验内容只是对通常可以
考虑包括的内容提供一些建议。
2、附录中,给出了一篇本科学生计量经济学课程论文的示例,
这是一篇对经济理论做实际验证性质的研究报告。应当指出,这里
只是作为实证项目研究报告形式的举例,对于报告中的内容和方法
是否恰当,大家可以充分展开讨论。
操作要求:具体 Eviews 操作同前。参看附录文章,每位同学完
成一份感兴趣论题的实训报告,不少于 5000 字,在个人成绩评定
中占 60%;同时每位同学要完成小结报告,便于口试陈述,在个人
成绩评定中占 40%。
附录:实证项目研究(实训报告)示例 1:
人民币汇率调整对金鹰包装制品公司出口收入影响
的实证分析
引言
纸制品包装行业在全国包装行业七大门类中,纸包装业
的产值排在首位,约占 37%。这些年随着国民经济的发展和
人民物质文化生活水平的提高,纸包装业发展的速度很快。
随着中国进入 WTO,许多纸包装企业也开始开拓海外市场,
转变了以前单一的销售渠道。北京金鹰包装制品有限公司是
一家生产纸包装的民营企业。从 2003年以来金鹰公司开始从
事出口贸易,2008年年出口额为 20,489,元人民币。
在这期间正值我国汇率制度改革,从 2005年 7月 21日,我
国开始实施以市场供求为基础、参考一篮子货币进行调节、
有管理的浮动汇率制度,截止到 2009年 4月 1日,人民币升
值的幅度已经超过 21%。理论上认为人民币升值会对出口企
业产生影响,但人民币升值对出口企业个体的影响程度我们
并不能一概而论。为此,本文以北京金鹰包装制品有限公司
为例从人民币汇率变动的情况出发,对人民币升值对出口企
业的影响和对策进行了分析和探讨。
本文尝试运用微观定量的实证分析方法,并以国际贸易
理论为基础,通过对北京金鹰包装制品有限公司将近 5 年的
经济数据进行经济计量分析,估计出金鹰公司出口收入与人
民币汇率以及金鹰公司总产值的多元线性回归模型。并结合
金鹰公司的实际情况,根据分析结果,对金鹰公司今后的发
展提出相应的建议和对策。
1人民币汇率变动情况概述及相关理论
人民币汇率调整历程
我国加入 WTO 已经进入了第八个年头,在这八年中随着
我国对外开放的不断深入,人民币汇率制度不断的改革与完
善,人民币汇率水平调整的幅度有不断扩大的趋势。自 1994
年以来,从市场的角度看,人们对人民币汇率的预期也经历
了一个从预期贬值到预期升值、升值、持续升值的相对完整
的转变过程。
表 1-1人民币汇率变化表(单位:元)
年份 人民币汇率年均值 环比升值率
1994
1995
1996
1997
1998
1999 -05
2000 -05
2001
2002 -06
2003 -05
2004 -05
2005
2006
2007
2008
东南亚金融危机期间及结束后一段时间,国际市场乃至
国内市场上,人们普遍预期人民币会像周边国家货币一样采
取贬值的作法。杨帆(1999)认为,亚洲金融危机过程中,
周边国家货币纷纷贬值使得我国出口增速减缓,我国没有必
要也没有力量对亚洲地区经济承担稳定的责任,要改变国际
市场不利状况,人民币存在贬值的可能性。过了不到两年的
时间,市场参与者的预期发生了逆转,预期人民币升值的看
法逐渐盛行。温思凯(2004)认为,由于我国国际收支“双
顺差”余额不断扩大,人民币的升值压力逐渐显现。近两年
我国市场参与者开始对人民币升值现状进行反思。宋晓金
(2008)认为,在现阶段人民币币值并没有被严重低估,而
是被高估中国政府应抵住各方压力,通过制定相应的外贸政
策来保持经济平稳发展。
图 1-11994年-2008年人民币汇率调整折线图
1994 年 1 月 1 日起,我国实现人民币汇率并轨,实行以
市场供求为基础的、单一的、有管理的浮动汇率制。到 1996
年底,人民币汇率由并轨初的 1美元兑换 元人民币升至
1 美元兑换 元人民币。1998 年之后,人民币汇率始终在
较窄范围内浮动,人民币兑 1美元保持在 ~元之间。
1998~2005 年 7 月 21 日,人民币汇率钉住了美元,基本保持
不变自 2005 年 7 月 21 日起,我国开始实行以市场供求为基
础、参考一篮子货币进行调节、有管理的浮动汇率制度。人
民币汇率不再盯住单一美元,形成更富弹性的人民币汇率机
制。自 2005年 7月 21日 19∶00时人民币对美元交易价格调
整为 1 美元兑 元人民币以来,人民币持续升值,到 2009
年 4 月 1 日,人民币对美元汇率中间价为 1 美元兑 元
人民币,升值幅度达 128%。
汇率变动对贸易收支影响理论
汇率是一个国家进行国际经济活动时最重要的综合性价
格指标,它的变化对一国对外贸易的平衡与国内经济活动的
波动都具有深刻的影响。
名义汇率
名义有效汇率是一种指数,它是对本国和其贸易伙伴国
及竞争国的双边汇率指数的一种加权平均。
实际汇率
实际有效汇率则是在名义有效汇率的基础上剔除本国物
价相对于贸易伙伴国本国物价的上涨因素,它也可以表示为
一种对双边实际汇率的加权平均指数。它反映了本国和贸易
伙伴国家的物价水平的相对变化对本国货币实际购买力的影
响,是一种多边实际汇率。实际有效汇率不仅考虑了所有双边
名义汇率的相对变动情况,而且还剔除了通货膨胀对货币本
身价值变动的影响,能够综合地反映本国货币的对外价值和
相对购买力。
自 1994 年起至 2005 年 7 月,我国一直实行盯住美元的
汇率制度。虽然 07年改革后改为一篮子汇率制度。我国汇率
受美元汇率变动影响很深,而且研究发现,名义汇率的变动和
实际汇率的变动高度相关,本文据此直接采用数据最容易收
集的名义汇率。
我国包装行业出口贸易发展现状
包装行业主要分三大类:纸制品包装、塑料制品包装、
金属制品包装。其中纸制品包装出口贸易在我国包装行业对
外经贸往来中占有举足轻重的地位,据我国海关统计,2008
年第一季度我国纸制品(海关税号:)出口数量为
亿公斤,比 2007年同期增长 %;出口金额为
亿美元,同比增长 %。纸制品包装行业在北京同样也是出
口创汇商品。据石家庄海关统计,2009年 1-4月北京市纸及
纸板;纸浆、纸或纸板制品出口 23, 千美元;其中 4
月北京市纸及纸板;纸浆、纸或纸板制品出口 8,千美
元。
人民币汇率变动与纸制品包装出口贸易之间的
关系
在进行国际贸易时,其他条件相对稳定时,汇率是影响
商品进出口的重要因素之一,是相对价格。一般来讲,其他
05. 7- 09. 3我国纸制品出口额, 汇率变化折线图
- 2
- 1. 5
- 1
- 0. 5
0
0. 5
1
200
7年
7月
200
7年
9月
200
7年
11月
200
8年
1月
200
8年
3月
200
8年
5月
200
8年
7月
200
8年
9月
200
8年
11月
200
9年
1月
200
9年
3月
时间
我国纸制品月
环比出口额
我国汇率月环
比出口额( %)
条件不变时,本国货币对外升值,则在外国市场上,以外币
表示的本国商品的价格会升高,这样,外国居民对本国商品
的需求会减少,相应地,本国商品的出口会下降,在出口需
求弹性较大时,会造成出口收入降低;在出口需求弹性较小
时,出口收入会增加。反之则相反。
图 1-22005年 7月-2009年 3月我国制止品出口额、汇率变
化折线图
2实证模型构建
准确地把握人民币汇率变化对出口贸易的影响,我们还
得采用实证的分析方法。因为:第一,影响出口贸易的因素
是多种多样的,有的是正面的因素,有的是负面的因素;第
二,影响出口贸易因素的贡献大小不一样,有的影响大,有
的影响小,有的影响因素直觉大实际小,有的影响因素知觉
小但实际大;第三,在出口贸易不断多元化的背景下,仍然
用人民币兑美元汇率的变化作为人民币升值的依据去解释对
出口的影响,具有较大的片面性。
关于模型的说明
为了便于分析,研究人民币汇率、公司生产总值与纸制
品包装出口收入之间的关系时,模型设计可将其他因素作为
外生变量来看待;由于人们所看到的是变量人民币汇率中间
价,所以模型中人民币汇率和纸制品包装出口收入变量均直
接采用货币值。这样,可以将模型设计为:
(2-1)
----代表对出口收入取自然数为底的对数;
----代表对人民币名义汇率取自然数为底的对数;
----代表对月生产总值取自然数为底的对数;
----为模型的随机干扰项。
和为偏回归系数;为截距项;为随机干扰项。
本文利用多元线性回归方法对北京金鹰包装制品有限公
司(以下称为简称为公司)的历史数据进行分析,并据此初
步判断人民币名义汇率和金鹰公司总产值对公司出口收入的
影响。上述模型一个隐含的前提是除人民币汇率以及公司总
产值,其他影响出口收入的要素都不发生变化。这些要素包
括原材料价格、替代品价格,人民币实际汇率等微观及宏观
变量。事实上,社会经济系统是动态的,其内部各要素都处
于不断的变化发展过程中,这些因索的变化发展又最终推动
了社会经济系统的发展和变化。由此,上述模型适合于在其
他变量保持不变的情况下对公司出口收入的变化进行描述。
一旦这些要素发生了变化,该模型就不能很好地对现实进行
拟合。得出回归方程之后,再对回归拟合的显著性进行检验,
主要是进行 t 检验,例如以判断人民币汇率对公司出口收入
是否有显著影响。其次要进行模型整体线性关系是否成立的
F检验。
根据汇率决定理论,如果人民币币值变动是公司出口收
入的约束因素,那么,长期来看,人民币升值会使得公司纸
制品包装出口收入降低;又由于人民币名义汇率,人民币汇
率值减小表示人民币对外升值。所以,如果模型符合理论分
析,则β1值应该为正。
相关数据——指标的选取、测算口径及时段
基于统计数据的可获得性,本文采用 2005年 1月-2009
年 3月北京金鹰包装制品有限公司出口收入为因变量、2005
年 1月-2009年 3月人民币名义汇率中间价月平均值和公司
月生产总值来作为自变量,并分别对以上原始数据取自然数
为底的对数。公司出口收入数据选自《金鹰包装制品有限公
司销售纪录》,包含 2005年 1月到 2009年 3月共 46(51个
数据剔除个别月份出口收入为 0的)个月的金鹰公司的出口
收入;人民币名义汇率中间价数据选自外汇管理网站。
表 出口数据及人民币汇率表(单位:
元)
序号 汇率 月出口收入 生产总值
1 7,327, 13,590,
2 8,977, 16,650,
3 6,930, 12,854,
4 6,680, 12,389,
5 8,130, 15,079,
6 7,890, 14,634,
7 13,421, 24,892,
8 17,165, 31,836,
9 16,212, 30,070,
10 14,577, 27,037,
11 24,207, 44,961,
12 16,715, 31,022,
13 550, 14,392,
14 99, 8,886,
15 1,442, 11,411,
16 31, 8,744,
17 548, 9,806,
18 342, 10,195,
19 662, 15,110,
20 770, 16,012,
21 418, 15,455,
22 291, 15,736,
23 225, 7,225,
24 238, 9,033,
25 276, 7,178,
26 2,314, 8,090,
27 712, 8,096,
28 1,626, 6,806,
29 1,647, 7,718,
30 614, 8,051,
31 494, 8,688,
32 582, 7,245,
33 952, 7,768,
34 1,270, 6,093,
35 573, 6,763,
36 3,139, 7,697,
37 2,148, 8,051,
38 2,921, 10,233,
39 1,976, 10,061,
40 2,351, 10,258,
41 2,011, 9,074,
42 727, 8,215,
43 2,416, 10,404,
44 2,359, 9,929,
45 782, 7,219,
46 3,302, 7,572,
图 时间序列分布图:
从图 2-1,我们可以看出,中间部分明显出现大幅度的
波动。直观来看出口收入与生产总值的关系相当明显。
回归的估计与分析
对模型的初步回归和分析
我们利用原始数据和 Eviews软件进行多元回归分析,建
立如式(2-1)的回归模型,并对模型的显著性进行分析。
Eviews回归结果如下表 2-2:
表 2-2Eviews回归结果
DependentVariable:LOG(EX)
Method:LeastSquares
Date:1210Time:21:48
Sample(adjusted):2005M012008M10
Includedobservations:46afteradjustments
Coeffic
ient
t-Statist
ic Prob.
C
21
LOG(RATE)
98
LOG(PRODUCT)
9
R-squared
4 Meandependentvar
0
AdjustedR-square
d
0
9
9 Akaikeinfocriterion
1
Sumsquaredresid
6 Schwarzcriterion
0
Loglikelihood
42 Hannan-Quinncriter.
6
F-statistic
4 Durbin-Watsonstat
7
Prob(F-statistic
)
1
根据表2-2,可以建立如下回归方程:
(2-2)
从表2-2可以看出,经T检验,当月汇率取对数()和当
月生产总值取对数()的概率p值分别为和,按给
定的显著性水平的情形下,均有显著意义。偏回归系数度量
了出口收入对汇率的弹性,即在生产总值保持不变的条件下,
汇率升水率每增加一个百分点,平均月出口收入将增加
%。类似地,在汇率保持不变的条件下,月生产总产值
每增加一个百分点,月平均出口收入将增加%。
从表 2-2 可以看出,模型观察值的 F 统计量的值为
,概率率 p值为 ,在显著性水平为的情形下,可
以认为当月出口收入取对数()与当月利率取对数()和当
月生产总值取对数()之间有整体线性关系。
对模型回归诊断
由于线性回归模型参数估计的最小二乘法是建立经典假
设基础之上的,所以有必要对模型是否满足基本假设进行分
析。
第一,判断模型中随机干扰项是否服从正态分布。从图
2-3 可以看出残差分布基本是一个左偏的正态分布;残差的
J-B 统计量下显示的概率值(P 值)是 ,不能拒绝原
假设,残差服从正态分布。
图 2-3回归标准化残差的直方图
第二,对模型是否存在多重共线性进行检验。
表 2-3变量相关系数矩阵
LNEX LNPRODUCT LNRATE
LNEX
LNPRODUCT
LNRATE
从表 2-3 中可以看出,各变量间的 Peaeson 相关系数,
当月利率取对数和当月生产总值取对数存在相关性,但相关
程度不高。方程有可能存在多重共线性问题,但是由于多重
共线性的主要问题在于使参数估计量的方差变大。参数估计
量的方差是由随机干扰项的方差、变量的变异程度与方差膨
胀因子一起决定的。如果存在多重共线性,但随机干扰项的
方差很小,或变量的变异程度很大,都可能得到较小的参数
估计量的方差。这时,即使有严重的多重共线性,也不会带
来不良后果。因此,只要回归方程估计的参数标准差值为很
小,t 统计值为较大,就没有必要过于关心是否存在多重共
线性问题。在模型中,从表 2-2 中得到该值为 ,比
较小,同时可以从表 2-2 中看到 t 值比较大。所以,本模型
中多重共线性问题不必过于关心。
第三,检验模型是否存在异方差。
首先从图 2-4可以看到残差平方对被解释解释变量估计
值的散点图主要分布在图形中的下三角部分,大致看出残差
平方随的变动呈增大的趋势,因此,模型很可能存在异方差。
但是否确实存在异方差还应通过更进一步的检验。
图 2-4与预测值的散点图
其次可进行怀特异方差检验:参看表 2-4
表 2-4怀特异方差检验结果
HeteroskedasticityTest:White
F-statistic
6 (5,40)
Obs*R-squared
2 -Square(5)
ScaledexplainedSS -Square(5)
2
TestEquation:
DependentVariable:RESID^2
Method:LeastSquares
Date:1210Time:22:21
Sample:2005M012008M10
Includedobservations:46
Coeffic
ient
t-Statist
ic Prob.
C
65
LOG(RATE)
52
(LOG(RATE))^2
1
(LOG(RATE))*(LOG(PRODU
CT))
77
LOG(PRODUCT)
6
(LOG(PRODUCT))^2
55
R-squared
1 Meandependentvar
0
AdjustedR-squared
6
7
6 Akaikeinfocriterion
6
Sumsquaredresid
3 Schwarzcriterion
4
Loglikelihood
80 Hannan-Quinncriter.
6
F-statistic
6 Durbin-Watsonstat
3
Prob(F-statistic)
5
从表 2-4可以看出,,由 White检验知,在下,查分布表,得临界值(在
(2-1)式中只有两项含有解释变量,故自由度为 5),比较计算的统计
量与临界值,因为>,所以拒绝原假设,不拒绝备择假设,表明模型存
在异方差。
第四,检验模型是否存在序列相关性。首先从图 2-5以
看出,残差并不是随机分布。它事实上呈现出明显的变动模
式—开始是正的,接着变负的,然后又是正的,再然后又是
负的,最后又是正的。如果将对描图,如图 2-6所示,则看
的更清楚。图 2-6表明存在着正相关:大多数残差都分布在
第一象限和第三象限。另外,从表 2-2知原始回归模型的 D-W
值等于 ,即。根据 D-W表,对于 n=45(最接近本例的样
本容量 46),k=2,在 5%的显著水平下,。由于 远低于
下临界值 ,根据德宾---沃森 d检验判定规则,我们得
出结论:原始回归模型的残差存在正的序列自相关。
图 2-5回归方程(2-1)的残差图 2-6方程(2-1)的残差和
对模型采取补救措施
由以上回归诊断分析可知模型存在序列相关性,会造成
模型参数估计虽然是无偏的,但不再是有效的。这样会造成
显著性检验不再可靠。所以,要采取措施弥补存在序列相关
性所造成的后果。在此主要是先用拉格朗日乘数检验法判断
到底存在几阶自相关回归,然后用杜宾两步法进行修正。
第一,拉格朗日乘数检验。首先,对 2阶滞后残差项的
辅助模型进行回归。
表 2-5LM检验结果(2阶滞后残差项的辅助模型进行回归):
Breusch-GodfreySerialCorrelationLMTest:
F-statistic
9 (2,41)
Obs*R-squared
8 -Square(2)
TestEquation:
DependentVariable:RESID
Method:LeastSquares
Date:1210Time:22:46
Sample:2005M012008M10
Includedobservations:46
Presamplemissingvaluelaggedresidualssettozero.
Coeffic
ient
t-Statist
ic Prob.
C
1
LOG(RATE)
5
LOG(PRODUCT)
71
RESID(-1)
8
RESID(-2)
6
R-squared
9 Meandependentvar
-
15
AdjustedR-square
d
8
2
5 Akaikeinfocriterion
6
Sumsquaredresid
6 Schwarzcriterion
1
Loglikelihood
53 Hannan-Quinncriter.
5
F-statistic
4 Durbin-Watsonstat
3
Prob(F-statistic
)
2
由表 2-12得出下列 2阶滞后残差项的辅助方程:
(2-4)
于是,,该值大于显著水平为 5%,自由度为 2的,由此
判断原模型存在 2阶序列自相关性。
其次,对 3阶滞后残差项的辅助模型进行回归分析,判
断原模型是否存在 3阶序列自相关性。
表 2-6格朗日乘数检验,含 3阶滞后残差项的模型摘要
Breusch-GodfreySerialCorrelationLMTest:
F-statistic
8 (3,40)
Obs*R-squared
7 -Square(3)
TestEquation:
DependentVariable:RESID
Method:LeastSquares
Date:1210Time:22:50
Sample:2005M012008M10
Includedobservations:46
Presamplemissingvaluelaggedresidualssettozero.
Coeffic
ient
t-Statist
ic Prob.
C
3
LOG(RATE)
5
LOG(PRODUCT)
64
RESID(-1)
4
RESID(-2)
2
RESID(-3)
8
R-squared
4 Meandependentvar
-
15
AdjustedR-square
d 1 2
3 Akaikeinfocriterion
9
Sumsquaredresid
9 Schwarzcriterion
7
Loglikelihood
03 Hannan-Quinncriter.
9
F-statistic
6 Durbin-Watsonstat
5
Prob(F-statistic
)
7
由表 2-6出下列 3阶滞后残差项的辅助方程:
(2-5)
于是,,该值大于显著水平为 5%,自由度为 3的,由此
判断原模型存在 3阶序列自相关性,但由于的参数不显著,
说明不存在 3阶序列自相关性。
第二,下面采用科克伦-奥科特迭代法进行自相关系数的估计
表2-7科克伦-奥科特迭代法进行自相关系数的估计结果:
DependentVariable:LNEX
Method:LeastSquares
Date:1210Time:22:55
Sample(adjusted):2005M032008M10
Includedobservations:44afteradjustments
Convergenceachievedafter13iterations
Coeffic
ient
t-Statist
ic Prob.
C
75
LNRATE
60
LNPRODUCT
8
AR(1)
7
AR(2)
7
R-squared
6 Meandependentvar
2
AdjustedR-square
d
8
4
4 Akaikeinfocriterion
8
Sumsquaredresid
1 Schwarzcriterion
7
Loglikelihood
77 Hannan-Quinncriter.
7
F-statistic
6 Durbin-Watsonstat
3
Prob(F-statistic
)
0
InvertedARRoots .83
LNEX=*LNRATE+2.*LNPRODUCT+[AR(1)=,AR(2)=]
(2-7)
其中,AR(1),AR(2)前的参数值即为随机干扰项的 1阶与
2阶序列相关系数。
其次,作差分变换:
(2-8)
则关于和的 OLS估计结果见表 2-8:
DependentVariable:*LNEX(-1)*LNEX(-2)
Method:LeastSquares
Date:1210Time:23:11
Sample(adjusted):2005M032008M10
Includedobservations:44afteradjustments
Coeffic
ient
t-Statist
ic Prob.
C
34
*LNRATE(-1)
6*LNRATE(-2)
14
*LNPRODUCT-(-1
)*LNPRODUCT-(-2)
0
R-squared
7 Meandependentvar
7
AdjustedR-squared
8
1
5 Akaikeinfocriterion
3
Sumsquaredresid
8 Schwarzcriterion
3
Loglikelihood
18 Hannan-Quinncriter.
7
F-statistic
7 Durbin-Watsonstat
3
Prob(F-statistic)
6
表 2-8广义差分结果
(2-9)
已经不存在自相关性。
对(2-9)的回归结果进行怀特检验,检验结果见表
2-9。
表2-9:对(2-9)的回归结果进行怀特检验的结果
HeteroskedasticityTest:White
F-statistic
5 (5,38)
Obs*R-squared
5 -Square(5)
ScaledexplainedSS
1 -Square(5)
TestEquation:
DependentVariable:RESID^2
Method:LeastSquares
Date:1210Time:23:15
Sample:2005M032008M10
Includedobservations:44
Coeffic
ient
t-Statist
ic Prob.
C
64
*LNRATE(-1)
6*LNRATE(-2)
6
(*LNRATE(-1)
56*LNRATE(-2))^2
1
(*LNRATE(-1)
56*LNRATE(-2))*(
39*LNPRODUCT-(-1)*LNPROD
29
UCT-(-2))
*LNPRODUCT-(-1
)*LNPRODUCT-(-2)
2
(*LNPRODUCT-(-
1)*LNPRODUCT-(-2))^2
4
R-squared
6 Meandependentvar
7
AdjustedR-squared
9
9
7 Akaikeinfocriterion
7
Sumsquaredresid
5 Schwarzcriterion
5
Loglikelihood
17 Hannan-Quinncriter.
4
F-statistic
5 Durbin-Watsonstat
7
Prob(F-statistic)
7
从表 2-9以看出,,由 White检验知,在下,查分布表,得临界值(在
(2-9式中只有两项含有解释变量,故自由度为 5),比较计算的统计量
与临界值,因为《,所以不拒绝原假设,表明模型不在异方差。1
为了与原始回归方程 OLS估计结果对比,计算:
(2-10)
于是原模型为:
(2-11)
偏回归系数度量了出口收入对利率的弹性,即
在生产总值保持不变的条件下,汇率升水率每下调一个百分
点,平均月出口收入将增加 %。类似地,在汇率保持不
变的条件下,月生产总产值每增加一个百分点,月平均出口
收入将增加 %.
模型回归结果的分析
模型回归结果,自变量 lnrate、lnproduct 与因变量
lnex之间的关系分别为负相关和正相关的关系。也就是说,
人民汇率变动与金鹰公司出口收入变动之间是负相关,而金
鹰公司总产值与金鹰公司出口收入变动之间是正相关。更具
体地说,在这一段时间,在公司总产值不变得情况下,随着
近年来我国人民汇率的不断升值金鹰包装制品有限公司出口
收入是不断减少的;另一方面,在人民币汇率不变的情况下
随着公司总产值不断增加,金鹰公司出口收入是不断增加的。
我们可以清晰地从回归结果当中发现人民币升值是影响
金鹰公司出口收入的制约因素。在生产总值保持不变的条件
下,利率每下调一个百分点,平均月出口收入将增加 %。
这一结果与贸易理论相一致。从长远的角度来看,人民币升
值对金鹰公司出口情况未必只有负面影响。我国纸包装行业
还属于低附加值的产业结构,人民币汇率的提高间接的迫使
企业进行产业结构调整,加快从一般加工业为主向先进制造
业和高新技术产业为主转变。使产品以高质量、高技术的特
点立于国际市场。
另一方面公司生产总值的增加对金鹰公司出口收入是有
积极影响的。在利率保持不变的条件下,月生产总产值每增
加一个百分点,月平均出口收入将增加 %。公司从 03年
开始开拓国际市场到现今已经有 6年时间。比较 03年公司年
生 产 总 值 64,556, 元 08 年 年 生 产 总 值 为
110,672,元已经将近翻了一翻。开辟国际市场使企业
有了更宽的销售渠道,促进企业扩大再生产使企业快速成长;
同样地企业扩大再生产使生产能力增强是企业更大份额的占
领国际市场有力保障。
综合来看,上述初步参数估计没有很完美的反映
——年期间人民币汇率变动、生产总值对金鹰公
司出口收入的影响。究其原因,很有可能在于我们前提假设
不能够成立,即金鹰公司在 ——出口收入,同样受
到原材料价格、替代品价格,人民币实际汇率等因素影响。
因为事实上,每一个出口企业都会受到这些因素的影响,最
终这些因素会影响该企业的出口收入。一旦这些要素发生了
变化,该模型就不能很好地对现实进行拟合。另一方面由于
我们选取的数据具有时间序列性,具有时间序列性的数据一
般都会序列正相关。从而影响我们拟合的效果。
以上的结果表明,在 期间,人民币汇率和企
业总产值对金鹰公司出口具有影响。以下,笔者将试图为金
鹰公司的外贸发展提供相应的政策建议。
3对策建议(略)
附录:实证项目研究(实训报告)示例 2:
我国教育投资总额的实证分析
教育投资是指一个国家或地区根据教育事业发展的要求,投入
教育领域中的人力、物力和则力的总和。具体而言,教育投资是投
入教育领域中用于培养不同熟练程度的后备劳动力}i!各种专门人
才以及提高人的劳动能力的人力和物力的货币表现,其中包含了两
层意思:一是教育投资是投入教育领域而非其他领域的人力和物力
的货币表现;一是教育投资的目的是培养和提高人的劳动能力。
教育投资与经济增长的关系一直是教育学和经济学关注的重要课
题。美 I+I 著名经济学家舒尔茨()对 1929-1957 年美
国教育投资对经济增长的关系作了定量研究,得出如卜结论:各级
教育投资的平均收益率为 17070;教育投资增长的收益占劳动收入
增长的比重为 700}0;教育投资增长的收益占 l 玉}民收入增长的比
重为 33070。也就是说,人力资木投资是回报率最高的投资
I4I(-423)在舒尔茨的研究基础上,贝克尔()全而
论述了人们为何要进行教育投资、怎样进行教育投资以及教育投资
与经济增长的内在联系。他从人力资木投资、人力资木投资收益和
人力资木投资收益率等关系出发,给出了基础教育、专业教育和在
职培训投资收益率的测度方法与模式,奠定了教育投资测度体系的
基木框架 I21(4}4}8y-v7)。
20 世纪 60 年代以来,各国竞相进行教育改革,增加教育投入,提
高教育质量,以使劳动者适应经济改革和发展的需求。战后日木经
济和亚洲“四小龙”经济的飞速增长,成为教育投资促进经济增长
的成功典范。据研究,在 1960-197s年的近一十年中,实施教育投
资密集战略的 I+}家和地区实际人均国民生产总值平均增长率为
}0 , 而 实 施 物 质 资 木 战 略 的 I+} 家 和 地 区 则 为
}o13}()。
在知识经济的社会大背景卜,教育投资是人力资木形成的最重要的
途径。当今世界,几乎所有国家都把加强教育投资作为推进国家经
济可持续发展的核心组成部分,少 i二作为增强综合国力和提高国
际竞争力的重大战略措施。
木研究以};Vic}}-s(计量经济学软件包)为分析工具,以国家统计
局发布的 5年度的统计数据为基础(如表 1所示),揭示中国教育投
资与经济增长之间的内在依存关系,构建相关的数学模型,探讨不
同经济发展阶段教育投资对经济增长的贡献率,进而提出优化教育
投资结构和提高教育投资效率的策略。
计算中国高等教育对经济增长率贡献的基本模型
美国经济学家舒尔茨、月尼森于 20111_纪 60 年代创立的关于
教育对经济增长 J,献的计 m:方法,出于对经济增长因索计 m:的需
要,试图确定增长余值中有多人部分归因于教育的 J,献,在估算教
育对经济增长 J,献方而作出了具有开创性的研究。各国学者用于表
示教育对经济增长 J,献率的尺皮有多种,其中计算教育对国民收入
增长速皮的 J,献比例是较受欢迎的方法,月尼森、麦迪逊等主要山
此入手来衡 m:教育对经济增长的 J,献/’/。
其基木模型为:假设上地 m:无变化,导致经济增长的因索抽象
为资木(K}、劳动力(L}和技术进步率(A少,可相互替代,且能
以可变的比例组合。又假设经济发展处于完全竞争的市场经济条件
卜,牛产要索都以其边际产品作为报酬,规模报酬保持小变。在时
间 t 范 围 内 变 化 的 中 性 技 术 进 步 的 产 出 增 长 模 型 构 造
为:Y,=A_/(K,,L)少。同教育年限的准确数据很难得到,在此仅以 0
年两次人口普查的数据,对上述模型进行扩展,计算出
年间 I}}.,等教育对经济增长的 J,献率。
分别计算 1989-2005年从业人员人均教育综合指数。用教育综合指
数代表山于教育程度的提出}}.,而带来的劳动投入录。根据 0 年
间接受初等、中等和高等教育从业人员的平均收入差别,推断出中
等教育毕业生劳动生产率是初等教育毕业生劳动生产率的 倍,
I}}.,等教育毕业生的劳动生产率是初等 2子。另根据 1989-2005
年间接受初等、中等和 I}}.,等教育从业人员的平均收入差别,取
中间年限的 1995 年,推断出中等教育毕业生劳动生产率是初等教
育毕业生劳动生产率的 倍,I}}.,等教育毕业生的劳动生产
率是初等教育毕业生劳动生产率的 倍/“/。这里也可以分别
把 及 劳动力质 m:折算为劳动力数 m:的系数,而
把劳动力人均受教育年限看作是权数,据此计算出劳动力人均教育
综合指数。根据我国 1989 年和 2005 年两次人口普查的数据,通过
整理计算得出 1990年我国从业人员人均初等、中等和 h,等受教育
年限分别为:;2000 年我国从业人员人均初等、中
等和 I}}.,等受教育年限分别为: 时,柯布一道格
拉斯牛产函数为:Y,=A,KaL尸。考虑到教育因索对劳动力质 m:的作
用,教育的作用相当于使初始劳动力投入成倍地增加,因此,可以
把 L,分解为初始劳动力件))与教育投入(E)的乘积,这样,柯布一
道格拉斯牛产函数可以表示之为:丫=A 式,L..,E 少 Ij,对该式两
边取自然对数后,再求时间 t的全导数,然后用差分方程近似代替
微分方程,于是得:了=。+at+比)+1}},这里 1代表年经济增长率,
a 为产出的资木投入弹性,人为资木投入的年增长率,1}为产出的
劳动投入弹性,a+I}=1,G,为初始劳动力投入的年增长率,。为教
育投入年增长率。那么,教育对经济增长率的 J,献可以表示
为:R,.=I}xg}}r。
在构造的模型中,了为(i}}的年增长率,。为根据从业人员人均受
教育年限计算出的教育综合指数的年增长率,’p 系数的确定为假
设在市场经济充分竞争、企业追求利润最人化的前提卜,劳动力的
工资率等于其边际产品,工资总额与国民收入之比就是劳动对产出
的弹性。麦迪逊采用此算法,得出 13系数值为 。在柯布一道格
拉斯函数基础上,构造回归模型:111Y=1mA+a1nK+I31nL,分别求出
a 和 1}的数值。木文构造的模型采用麦迪逊的 1}系数不削=/即
I}=,也就是认为劳动投入每增加 1070,产出增加录为
从中国统计年鉴中查的数据如下:
表 1
年份 国内生产 国内生产总值 教育支 财政支出
总值 指数 出
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
一.建立模型
设模型中有两个解析变量:
X1---------GDP
X2---------国家财政支出总额
被解析变量:
Y-------全国教育经费总投入
首先绘制 Y与 x1,y与 x2的相关图,如下:
由以上相关图可知,Y与 X1、X2都存在明显的线性关系。所以
设定模型为多元线性模型。
Yi=β0+β1*X1i+β2*X2i+υi
2.多元线性回归估计
依表 1中的数据
DependentVariable:Y
Method:LeastSquares
Date:0607Time:13:40
Sample:5
Includedobservations:17
Variable Coeffic
ient
r
t-Statis
tic
Prob.
C
2
X1
3
X2
0
R-squared
6
Meandependentvar
11
AdjustedR-squa
red
2
10
on
3
Akaikeinfocriter
ion
38
Sumsquaredresi
d
3
Schwarzcriterion
42
Loglikelihood
26
F-statistic
39
Durbin-Watsons
tat
2
Prob(F-statistic
)
00
得到拟合方程
Y^=++
t=1..
R2=ˉ=
F==
由以上结果可知,t 统计量比较大,而且拟合程度相当高。
F=,整个方程也是高度显著的。所以估计结果是很可信的。
DW值也比较小,表明存在一阶自相关性。下面进行计量经济学检验。
2异方差检验
采用 White检验得:
WhiteHeteroskedasticityTest:
F-statistic
3
Probabil
ity
87
Obs*R-squared
7
Probabil
ity
76
取显著性水平为 ,查表得卡方值为 (n=5),所以模型
不存在异方差性
自关性检验
用广义差分法重新估计模型得到:
DependentVariable:Y
Method:LeastSquares
Date:0607Time:15:22
Sample(adjusted):5
Includedobservations:16afteradjustingendpoint
s
Convergenceachievedafter13iterations
Variable Coeffic
ient
r
t-Statis
tic
Prob.
C
0
X1
7
X2
6
AR(1)
6
R-squared
6
Meandependentvar
66
AdjustedR-squa
red
5
88
on
4
Akaikeinfocriter
ion
70
Sumsquaredresi
d
4
Schwarzcriterion
84
Loglikelihood
57
F-statistic
90
Durbin-Watsons
tat
6
Prob(F-statistic
)
00
InvertedARRoot
s
.59
调整后的模型如下:
Y^=++
T=0...076839
R2=ˉ=
F==
在进行偏相关检验,可得下图:
可见调整过后的模型已不存在自相关性。
4多重共线检验
采用相关系数检验法,得到系数矩阵为:
X1与 X2的相关系数为 ,说明两者存在高度相关性。该
模型存在多重共线性。
下面采用分步回归法探究多重共线性问题。
采用逐步回归法消除多重共线
对 Y分别于 X1,X2建立一元回归模型:
DependentVariable:Y
Method:LeastSquares
Date:0607Time:16:25
Sample:5
Includedobservations:17
Variable Coeffic
ient
r
t-Statis
tic
Prob.
C
97
8
X1
9
R-squared Meandependentvar
2 11
AdjustedR-squa
red
1
10
on
6
Akaikeinfocriter
ion
79
Sumsquaredresi
d
. Schwarzcriterion
81
Loglikelihood
32
F-statistic
63
Durbin-Watsons
tat
9
Prob(F-statistic
)
00
Y=+
T=
R2==
Y与 X2的模型
DependentVariable:Y
Method:LeastSquares
Date:0607Time:16:31
Sample:5
Includedobservations:17
Variable Coeffic
ient
r
t-Statis
tic
Prob.
C
1
X2
1
R-squared
9
Meandependentvar
11
AdjustedR-squa
red
0
10
on
3
Akaikeinfocriter
ion
58
Sumsquaredresi
d
152150.
6
Schwarzcriterion
61
Loglikelihood
70
F-statistic
60
Durbin-Watsons
tat
9
Prob(F-statistic
)
00
Y=+
T=
R2==
显然,Y 与 X2 的相关性最强,所以 Y=+ 为基本
模型。在该模型中加入 X1,对 Y关于 X1,X2建立二元回归模型,回归
结果为:
DependentVariable:Y
Method:LeastSquares
Date:0607Time:16:39
Sample:5
Includedobservations:17
Variable Coeffic
ient
r
t-Statis
tic
Prob.
C
2
X1
3
X2
0
R-squared
6
Meandependentvar
11
AdjustedR-squa
red
2
10
on
3
Akaikeinfocriter
ion
38
Sumsquaredresi
d
3
Schwarzcriterion
42
Loglikelihood
26
F-statistic
39
Durbin-Watsons
tat
2
Prob(F-statistic
)
00
可以看出,加入 X1 后,调整后的拟合优度有所提高,系数均显著
且符号正确,因此,在模型中保留 X1。虽然解释变量之间仍存在高
度相关关系,但是多重共线并没有造成不利的影响,所以,该模型
是较好的教育投资模型,即 Y=++.为
最终确立的教育投资模型。
以上分析了我国的教育投资现状以及教育投资对经济发展的作用,
不难看出,我国在教育事业上的资金投入相较西方发达国家而言,
真是少之又少。再加上我国人口众多,平摊到每人身上的教育经费
就更少了。国人四处嚷嚷要在未来 20年建设若干所世界一流大学,
却不愿大放血花钱办教育。香港区区弹丸之地,却已经有好几所大
学跻身世界一流大学行列。而其校史不到 20 年。这多亏了港府不
惜血本,大力发展高等教育,才有今日之成就。这倒还在其次,尤
其对基础教育的投入更让人大跌眼镜。据权威部门统计,从 1994
年到 1996 年,我国义务教育经费中财政预算内拨款的比重从
%下降到 %,其中农村学校下降到 %。义务教育经
费支出中财政预算内教育拨款,小学从 %下降到 %;初
中从 %下降到 %;义务教育中政府拨款的比重比非义务
教育的还要低,是政府拨款比重低的一个层次。
从经济学的角度看,一个国家或地区在经济教育发展水平不甚
高的情况下,投资基础教育能争取以最小的投入获得最大的产出。
我国基础教育之落后,虽然很大程度上是因了我国的具体国情,但
是在经济形势一片大好的状况下,加大对基础教育的投资力度也是
应有之义。本着公平与效率兼顾的原则,政府应当加大对基础教育
的投资,尤其是农村的基础教育。
另外还应当鼓励私人办教育。这不但能够节约政府预算,而且
也有助于教育事业良性竞争的形成。美国私人教育占有非常大的比
重,其高等教育水平是全世界最好的。这足以证明私人教育在某些
方面并不逊色于公共教育。所以政府应当大力提倡发展民间教育事
业。
封面:
《经济计量模型建模实训报告》
题目
成绩
姓名 学号 报告 汇报
总成
绩
组长
指导教师
北京信息科技大学图书馆 805实验室
2014年月日