《计量经济学》(第二版) Econometrics
电子教案
第一章 绪论
关于绪论
课程教学大纲
计量经济学
经典计量经济学模型的建模步骤
计量经济学模型的应用
0 .1 关于绪论
○绪论是课程的纲。
○学好绪论,可以说学好了课程的一半。参观一个城市,先站在最高处俯瞰,然后走街串巷;了解一座建筑,先看模型,后走进每一个房间。各起一半作用。
○绪论课的目的:了解课程的性质和在课程体系中的地位;了解课程完整的内容体系和将要讲授的内容;了解课程的重点和难点;了解课程的学习方法;介绍课程中不讲的但是必须了解的课程内容。
○不必全懂,只需似懂非懂。
《计量经济学》教学大纲
⒈ 课程
计量经济学
课号:3020081-0
学分:3
课程性质:教育部规定核心课程
⒉ 教师
主讲教师: 徐占东
办公地点: 师学斋 603
电话: 84739663
E-mail: zhandongx@
网络教学平台:
或者:
QQ: 372823638
⒊ 课程说明
⑴ 教学目的
经济学是一门科学,实证的方法,尤其是数量分析方法是经济学研究的基本方法论。通过该门课程教学,使学生掌握计量经济学的基本理论与方法,并能够建立实用的计量经济学应用模型。
⑵ 先修课程
中级微观经济学、中级宏观经济学、经济统计学、微积分、线性代数、概率论与数理统计、应用数理统计。
⑶ 教材及参考书
《计量经济学(第2版)》,李子奈、潘文卿,高等教育出版社,2005年
《计量经济学习题集》,潘文卿、李子奈、高吉丽,高等教育出版社,2005年
《Basic Econometrics》(fourth edition),Damodar N. Gujarrati,2003
《Introductory Econometrics》(2E),Jeffrey M. Woodldridge,2003(英文改编版《计量经济学导论》,已经由高等教育出版社2005年4月出版)
《高等计量经济学》,李子奈、叶阿忠,清华大学出版社,2000年
《计量经济学—方法与应用》,李子奈,清华大学出版社,1992年
⑷ 课堂资料下载
内容:补充资料、课件、数据集、教学基本要求、教学大纲、复习要点等。
⑸ 教学讨论区
网络教学平台:
或者:
(6)课程内容提纲及学时安排
(总课时:48学时,课内外周学时:3/6)
第一章 绪论 3学时
第二章 经典单方程计量经济学模型:
一元线性回归模型 3学时
第三章 经典单方程计量经济学模型:
多元线性回归模型 3学时
第四章 经典单方程计量经济学模型:
放宽基本假定的模型 6学时
第五章 经典单方程计量经济学模型:
专门问题 3学时
第六章 联立方程计量经济学模型:
理论与方法 6学时
第七章 经典计量经济学应用模型 9学时
第八章 扩展的单方程计量经济学模型 6学时
第九章 时间序列计量经济学模型 6学时
⑻ 课程成绩
作 业:20分
课堂表现:10分
期末考核:70分
⒋ 关于学习方法的说明
⑴ 理论与应用并重。既要重视理论方法,也要重视应用模型和应用中实际问题的解决;
⑵ 以教材中的经典理论方法为主,也要理解适当引入的、教材中没有的非经典理论方法;
⑶ 对于理论方法,重点是思路而不是数学过程;
⑷ 对于应用模型,重点不是每种模型本身,而是它们演变与发展的方法论;
⑸ 必须十分重视综合练习;
⑹ 必须掌握一种应用软件,注意课堂的软件应用演示,“师傅领进门,修行在个人”,多练。
§ 计量经济学
一、计量经济学
二、计量经济学模型
三、计量经济学的内容体系
四、计量经济学是一门经济学科
五、计量经济学在经济学科中的地位
一、计量经济学
△ 经济学的一个分支学科(揭示经济活动中客观存在的数量关系为内容的学科)
○1926年挪威经济学家提出Econometrics
○ 1930年成立世界计量经济学会
○ 1933年创刊《Econometrics》
○ 20世纪四五十年代的大发展和60年代的扩张
○ 20世纪70年代以来非经典(现代)计量经济学的发展
△ 定义
“用数学方法探讨经济学可以从好几个方面着手,但任何一个方面都不能和计量经济学混为一谈。计量经济学与经济统计学绝非一码事;它也不同于我们所说的一般经济理论,尽管经济理论大部分具有一定的数量特征;计量经济学也不应视为数学应用于经济学的同义语。经验表明,统计学、经济理论和数学这三者对于真正了解现代经济生活的数量关系来说,都是必要的,但本身并非是充分条件。三者结合起来,就是力量,这种结合便构成了计量经济学。”
△ 在经济学科中占据极重要的地位
克莱因():“计量经济学已经在经济学科中居于最重要的地位”,“在大多数大学和学院中,计量经济学的讲授已经成为经济学课程表中最有权威的一部分”。
萨缪尔森() :“第二次大战后的经济学是计量经济学的时代”。
二、计量经济学模型
△ 模型:是对现实的描述和模拟。如语义模型、物理模型、几何模型、数学模型等。
△ 数学模型:用数学语言来描述现实,揭示现实活动中的数量关系。
△ 经济数学模型:利用数学方法描述经济活动。
△ 计量经济学模型:解释经济活动中各个因素之间的定量关系,用随机性的数学方程加以描述。
△ 经济理论分析(行为分析)→数理分析 →数量分析:揭示经济活动各个因素之间的理论关系,用确定性的数学方程加以描述。
三、计量经济学的内容体系
△ 广义计量经济学和狭义计量经济学
△ 初、中、高级计量经济学
△ 理论计量经济学和应用计量经济学
△ 经典计量经济学和非经典计量经济学
△ 微观计量经济学和宏观计量经济学
△广义计量经济学和狭义计量经济学
广义计量经济学是利用经济理论、数学以及统计学定量研究经济现象的经济计量方法的统称,包括回归分析方法、投入产出分析方法、时间序列分析方法等。
狭义计量经济学,也就是我们通常所说的计量经济学,以揭示经济现象中的因果关系为目的,在数学上主要应用回归分析方法。
本课程中的计量经济学模型,就是狭义计量经济学意义上的经济数学模型。
△ 初、中、高级计量经济学
初级以计量经济学的数理统计学基础知识和经典的线性单方程模型理论与方法为主要内容;
中级以用矩阵描述的经典的线性单方程模型理论与方法、经典的线性联立方程模型理论与方法,以及传统的应用模型为主要内容;
高级以非经典的、现代的计量经济学模型理论、方法与应用为主要内容。
本定位于中级水平上,适当引入高级的内容。
△ 理论计量经济学和应用计量经济学
理论计量经济学是以介绍、研究计量经济学的理论与方法为主要内容,侧重于理论与方法的数学证明与推导,与数理统计联系极为密切。除了介绍计量经济模型的数学理论基础、普遍应用的计量经济模型的参数估计方法与检验方法外,还研究特殊模型的估计方法与检验方法,应用了广泛的数学知识。
应用计量经济学则以建立与应用计量经济学模型为主要内容,强调应用模型的经济学和经济统计学基础,侧重于建立与应用模型过程中实际问题的处理。
本课程是二者的结合。
△ 经典计量经济学和非经典计量经济学
经典计量经济学(Classical Econometrics)一般指20世纪70年代以前发展并广泛应用的计量经济学。
创立
建立了它的概率论基础
成为其理论与应用的集大成者
经典计量经济学在理论方法方面特征是:
⑴ 模型类型——随机模型;
⑵ 模型导向——理论导向;
⑶ 模型结构——线性或者可以化为线性,因果分析,解释变量具有同等地位,模型具有明确的形式和参数;
⑷ 数据类型——以时间序列数据或者截面数据为样本,被解释变量为服从正态分布的连续随机变量;
⑸ 估计方法——仅利用样本信息,采用最小二乘方法或者最大似然方法估计模型。
经典计量经济学在应用方面的特征是:
⑴ 应用模型方法论基础——实证分析、经验分析、归纳;
⑵ 应用模型的功能——结构分析、政策评价、经济预测、理论检验与发展;
⑶ 应用模型的领域——传统的应用领域,例如生产、需求、消费、投资、货币需求,以及宏观经济等。
非经典计量经济学一般指20世纪70年代以来发展的计量经济学理论、方法及应用模型,也称为现代计量经济学。
非经典计量经济学主要包括:微观计量经济学、非参数计量经济学、时间序列计量经济学和动态计量经济学等。
非经典计量经济学的内容体系:模型类型非经典的计量经济学问题、模型导向非经典的计量经济学问题、模型结构非经典的计量经济学问题、数据类型非经典的计量经济学问题和估计方法非经典的计量经济学问题。
本课程以经典计量经济学为主,适当引入一些简单的、应用较多的现代计量经济学理论方法。理由:
一方面,从理论方法角度,经典计量经济学理论方法是非经典计量经济学理论方法的基础;
另一方面,从应用的角度,经典计量经济学模型仍然是目前应用最为普遍的计量经济学模型。
△ 微观计量经济学和宏观计量经济学
微观计量经济学 于2000年诺贝尔经济学奖公报中正式提出;
微观计量经济学的内容集中于“对个人和家庭的经济行为进行经验分析”;
“微观计量经济学的原材料是微观数据”,微观数据表现为截面数据和平行(penal)数据;
赫克曼()和麦克法登() 对微观计量经济学作出原创性贡献。
微观计量经济学教科书和课程有:“Microeconometrics”
“Advanced Microeconometrics”
“Applied Microeconometrics”
“Topics in Microeconometrics”
“Methods in Microeconometrics”
微观计量经济学的主要内容包括:
平行(penal)数据模型的理论方法
离散选择模型的理论方法
选择性样本模型的理论方法
宏观计量经济学名称由来已久,但是它的主要内容和研究方向发生了变化。
经典宏观计量经济学:利用计量经济学理论方法,建立宏观经济模型,对宏观经济进行分析、评价和预测。
现代宏观计量经济学的主要研究方向:单位根检验、协整理论以及动态计量经济学。
四、计量经济学是一门经济学科
△ 从计量经济学的定义看
△ 从计量经济学在西方国家经济学科中的地位看
△ 从计量经济学与数理统计学的区别看
△ 从建立与应用计量经济学模型的全过程看
△ 从诺贝尔经济学奖看
△诺贝尔经济学奖与计量经济学
55位获奖者中10位直接因为对计量经济学发展的贡献而获奖
1969 R. Frish J. Tinbergen
1973 W. Leotief
1980 L. R. Klein
1984 R. Stone
1989 T. Haavelmo
2000 J. J. Heckman D. L. McFadden
2003 R. F. Engle C. W. J. Granger
近20位担任过世界计量经济学会会长
30余位左右在获奖成果中应用了计量经济学
获奖者名单
2004 Finn Kydland , Edward Prescott
2003 Robert F. Engle, Clive W. J. Granger
2002 Daniel Kahneman, Vernon L. Smith
2001 George A. Akerlof, A. Michael Spence,
Joseph E. Stiglitz
2000 James J Heckman, Daniel L McFadden
1999 Robert A. Mundell
1998 Amartya Sen
1997 Robert C. Merton, Myron S. Scholes
1996 James A. Mirrlees, William Vickrey
1995 Robert E. Lucas Jr.
1994 John C. Harsanyi, John F. Nash Jr.,
Reinhard Selten
1993 Robert W. Fogel, Douglass C. North
1992 Gary S. Becker
1991 Ronald H. Coase
1990 Harry M. Markowitz, Merton H. Miller,
William F. Sharpe
1989 Trygve Haavelmo
1988 Maurice Allais
1987 Robert M. Solow
1986 James M. Buchanan Jr.
1985 Franco Modigliani
1984 Richard Stone
1983 Gerard Debreu
1982 George J. Stigler
1981 James Tobin
1980 Lawrence R. Klein
1979 Theodore W. Schultz, Sir Arthur Lewis
1978 Herbert A. Simon
1977 Bertil Ohlin, James E. Meade
1976 Milton Friedman
1975 Leonid Vitaliyevich Kantorovich
Tjalling C. Koopmans
1974 Gunnar Myrdal
Friedrich August von Hayek
1973 Wassily Leontief
1972 John R. Hicks, Kenneth J. Arrow
1971 Simon Kuznets
1970 Paul A. Samuelson
1969 Ragnar Frisch, Jan Tinbergen
The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel 1969
"for having developed and applied dynamic models for the analysis of economic processes"
Ragnar Frisch
Norway
Jan Tinbergen the etherlands
The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel 1973
"for the development of the input-output method and for its application to important economic problems"
Wassily Leontief
USA
The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel 1980
"for the creation of econometric models and the application to the analysis of economic fluctuations and economic policies"
Lawrence R. Klein
USA
The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel 1984
"for having made fundamental contributions to the development of systems of national accounts and hence greatly improved the basis for empirical economic analysis"
Richard Stone
Great Britain
The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel 1989
"for his clarification of the probability theory foundations of econometrics and his analyses of simultaneous economic structures"
Trygve Haavelmo
Norway
经典计量经济学
创立
建立第1个应用模型
建立概率论基础
发展数据基础
发展应用模型
Tinbergen
Frisch
Haavelmo
Stone
Klein
建立投入产出模型
Leontief
The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel 2000
"for his development of theory and methods for analyzing selective samples”
James J Heckman
USA
The Bank of Sweden Prize in Economic Sciences inMemory of Alfred Nobel 2000
"for his development of theory and
methods for analyzing discrete choice"
Daniel L McFadden
USA
The Bank of Sweden Prize in Economic Sciences inMemory of Alfred Nobel 2003
"for methods of analyzing economic time series with common trends (cointegration)"
Clive W. J. Granger
UK
The Bank of Sweden Prize in Economic Sciences inMemory of Alfred Nobel 2003
"for methods of analyzing economic time series with time-varying volatility (ARCH)"
Robert F. Engle
USA
非
经典计量经济学
微观计量:
选择性样本模型
微观计量:
离散选择模型
时间序列:
协整理论—现代宏观计量
时间序列:
ARCH—现代金融计量
Engle
Heckman
McFadden
Granger
五、计量经济学在经济学科中的地位
△ 从现代西方经济学的特征看
△ 从西方经济学的发展历史看
△ 从世界一流大学经济学课程表看
△ 从国际经济学刊物论文看
△ 从经济学的“世界先进水平”看
§ 建立计量经济学模型的步骤和要点
一、理论模型的设计
二、样本数据的收集
三、模型参数的估计
四、模型的检验
五、计量经济学模型成功的三要素
一、理论模型的建立
⑴ 确定模型包含的变量
根据经济学理论和经济行为分析。
例如:同样是生产方程,电力工业和纺织工业应该选择不同的变量,为什么?
在时间序列数据样本下可以应用Grange统计检验等方法。
例如,消费和GDP之间的因果关系。
考虑数据的可得性。
注意因素和变量之间的联系与区别。
考虑入选变量之间的关系。
要求变量间互相独立。
⑵ 确定模型的数学形式
利用经济学和数理经济学的成果
根据样本数据作出的变量关系图
选择可能的形式试模拟
⑶ 拟定模型中待估计参数的理论期望值区间
符号、大小、 关系
例如:ln(人均食品需求量)=α+βln(人均收入)
+γln(食品价格) +δln(其它商品价格)+ε
其中α 、β、γ、δ的符号、大小、 关系
二、样本数据的收集
⑴ 几类常用的样本数据
时间序列数据
截面数据
虚变量离散数据
联合应用
⑵ 数据质量
完整性
准确性
可比性
一致性
三、模型参数的估计
⑴ 各种模型参数估计方法
⑵ 如何选择模型参数估计方法
⑶ 关于应用软件的使用
课堂教学结合Eviews
能够熟练使用一种
四、模型的检验
⑴ 经济意义检验
根据拟定的符号、大小、关系
例如:ln(人均食品需求量)=-(人均收入) -(食品价格) +(其他商品价格)
ln(人均食品需求量)=+(人均收入)-(食品价格)+(其他商品价格)
ln(人均食品需求量)=+(人均收入)-(食品价格) +(其他商品价格)
⑵ 统计检验
由数理统计理论决定
包括拟合优度检验
总体显著性检验
变量显著性检验
⑶ 计量经济学检验
由计量经济学理论决定
包括异方差性检验
序列相关性检验
共线性检验
⑷ 模型预测检验
由模型的应用要求决定
包括稳定性检验:扩大样本重新估计
预测性能检验:对样本外一点进行 实际预测
五、计量经济学模型成功的三要素
理论
数据
方法
§ 计量经济学模型的应用
一、结构分析
二、经济预测
三、政策评价
四、理论检验与发展
一、结构分析
经济学中的结构分析是对经济现象中变量之间相互关系的研究。
结构分析所采用的主要方法是弹性分析、乘数分析与比较静力分析。
计量经济学模型的功能是揭示经济现象中变量之间的相互关系,即通过模型得到弹性、乘数等。
应用举例
二、经济预测
计量经济学模型作为一类经济数学模型,是从用于经济预测,特别是短期预测而发展起来的。
计量经济学模型是以模拟历史、从已经发生的经济活动中找出变化规律为主要技术手段。
对于非稳定发展的经济过程,对于缺乏规范行为理论的经济活动,计量经济学模型预测功能失效。
模型理论方法的发展以适应预测的需要。
三、政策评价
政策评价的重要性。
经济政策的不可试验性。
计量经济学模型的“经济政策实验室”功能。
四、理论检验与发展
实践是检验真理的唯一标准。
任何经济学理论,只有当它成功地解释了过去,才能为人们所接受。
计量经济学模型提供了一种检验经济理论的好方法。
对理论假设的检验可以发现和发展理论。
第二章 经典单方程计量经济学模型:
一元线性回归模型
回归分析概述
一元线性回归模型的参数估计
一元线性回归模型检验
一元线性回归模型预测
实例
§ 回归分析概述
一、变量间的关系及回归分析的基本概念
二、总体回归函数(PRF)
三、随机扰动项
四、样本回归函数(SRF)
一、变量间的关系及回归分析的基本概念
1. 变量间的关系
(1)确定性关系或函数关系:研究的是确定现象非随机变量间的关系。
(2)统计依赖或相关关系:研究的是非确定现象随机变量间的关系。
对变量间统计依赖关系的考察主要是通过相关分析(correlation analysis)或回归分析(regression analysis)来完成的
注意
①不线性相关并不意味着不相关。
②有相关关系并不意味着一定有因果关系。
③回归分析/相关分析研究一个变量对另一个(些)变量的统计依赖关系,但它们并不意味着一定有因果关系。
④相关分析对称地对待任何(两个)变量,两个变量都被看作是随机的。回归分析对变量的处理方法存在不对称性,即区分应变量(被解释变量)和自变量(解释变量):前者是随机变量,后者不是。
2. 回归分析的基本概念
回归分析(regression analysis)是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。
其目的在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。
被解释变量(Explained Variable)或应变量(Dependent Variable)。
解释变量(Explanatory Variable)或自变量(Independent Variable)。
回归分析构成计量经济学的方法论基础,其主要内容包括:
(1)根据样本观察值对经济计量模型参数进行估计,求得回归方程;
(2)对回归方程、参数估计值进行显著性检验;
(3)利用回归方程进行分析、评价及预测。
二、总体回归函数
回归分析关心的是根据解释变量的已知或给定值,考察被解释变量的总体均值,即当解释变量取某个确定值时,与之统计相关的被解释变量所有可能出现的对应值的平均值。
例:一个假想的社区有100户家庭组成,要研究该社区每月家庭消费支出Y与每月家庭可支配收入X的关系。 即如果知道了家庭的月收入,能否预测该社区家庭的平均月消费支出水平。
为达到此目的,将该100户家庭划分为组内收入差不多的10组,以分析每一收入组的家庭消费支出。
由于不确定因素的影响,对同一收入水平X,不同家庭的消费支出不完全相同;
但由于调查的完备性,给定收入水平X的消费支出Y的分布是确定的,即以X的给定值为条件的Y的条件分布(Conditional distribution)是已知的,例如:P(Y=561|X=800)=1/4。
因此,给定收入X的值Xi,可得消费支出Y的条件均值(conditional mean)或条件期望(conditional expectation):E(Y|X=Xi)。
该例中:E(Y | X=800)=561
描出散点图发现:随着收入的增加,消费“平均地说”也在增加,且Y的条件均值均落在一根正斜率的直线上。这条直线称为总体回归线。
0
500
1000
1500
2000
2500
3000
3500
500
1000
1500
2000
2500
3000
3500
4000
每月可支配收入X(元)
每
月
消
费
支
出
Y
(元)
在给定解释变量Xi条件下被解释变量Yi的期望轨迹称为总体回归线(population regression line),或更一般地称为总体回归曲线(population regression curve)。
称为(双变量)总体回归函数(population regression function, PRF)。
相应的函数:
含义:回归函数(PRF)说明被解释变量Y的平均状态(总体条件期望)随解释变量X变化的规律。
函数形式:可以是线性或非线性的。
例中,将居民消费支出看成是其可支配收入的线性函数时:
为一线性函数。其中,0,1是未知参数,称为回归系数(regression coefficients)。
三、随机扰动项
总体回归函数说明在给定的收入水平Xi下,该社区家庭平均的消费支出水平。
但对某一个别的家庭,其消费支出可能与该平均水平有偏差。
称为观察值围绕它的期望值的离差(deviation),是一个不可观测的随机变量,又称为随机干扰项(stochastic disturbance)或随机误差项(stochastic error)。
例中,给定收入水平Xi ,个别家庭的支出可表示为两部分之和:(1)该收入水平下所有家庭的平均消费支出E(Y|Xi),称为系统性(systematic)或确定性(deterministic)部分;(2)其他随机或非确定性(nonsystematic)部分i。
称为总体回归函数(PRF)的随机设定形式。表明被解释变量除了受解释变量的系统性影响外,还受其他因素的随机性影响。由于方程中引入了随机项,成为计量经济学模型,因此也称为总体回归模型。
随机误差项主要包括下列因素:
在解释变量中被忽略的因素的影响;
变量观测值的观测误差的影响;
模型关系的设定误差的影响;
其他随机因素的影响。
产生并设计随机误差项的主要原因:
理论的含糊性;
数据的欠缺;
节省原则。
四、样本回归函数(SRF)
问题:能从一次抽样中获得总体的近似的信息吗?如果可以,如何从抽样中获得总体的近似信息?
例:在例的总体中有如下一个样本,能否从该样本估计总体回归函数PRF?
回答:能
该样本的散点图(scatter diagram):
画一条直线以尽好地拟合该散点图,由于样本取自总体,可以该直线近似地代表总体回归线。该直线称为样本回归线(sample regression lines)。
记样本回归线的函数形式为:
称为样本回归函数(sample regression function,SRF)。
注意:这里将样本回归线看成总体回归线的近似替代
则
样本回归函数的随机形式/样本回归模型:
同样地,样本回归函数也有如下的随机形式:
由于方程中引入了随机项,成为计量经济模型,因此也称为样本回归模型(sample regression model)。
▼回归分析的主要目的:根据样本回归函数SRF,估计总体回归函数PRF。
即,根据
估计
注意:这里PRF可能永远无法知道。
§ 一元线性回归模型的参数估计
一、一元线性回归模型的基本假设
二、参数的普通最小二乘估计(OLS)
三、参数估计的最大或然法(ML)
四、最小二乘估计量的性质
五、参数估计量的概率分布及随机干
扰项方差的估计
说 明
单方程计量经济学模型分为两大类:线性模型和非线性模型
线性模型中,变量之间的关系呈线性关系
非线性模型中,变量之间的关系呈非线性关系
一元线性回归模型:只有一个解释变量
i=1,2,…,n
Y为被解释变量,X为解释变量,0与1为待估参数, 为随机干扰项
回归分析的主要目的是要通过样本回归函数(模型)SRF尽可能准确地估计总体回归函数(模型)PRF。
估计方法有多种,其中最广泛使用的是普通最小二乘法(ordinary least squares, OLS)。
为保证参数估计量具有良好的性质,通常对模型提出若干基本假设。
实际这些假设与所采用的估计方法紧密相关。
一、线性回归模型的基本假设
假设1. 解释变量X是确定性变量,不是随机变量;
假设2. 随机误差项具有零均值、同方差和不序列相关性:
E(i)=0 i=1,2, …,n
Var (i)=2 i=1,2, …,n
Cov(i, j)=0 i≠j i,j= 1,2, …,n
假设3. 随机误差项与解释变量X之间不相关:
Cov(Xi, i)=0 i=1,2, …,n
假设4. 服从零均值、同方差、零协方差的正态分布
i~N(0, 2 ) i=1,2, …,n
如果假设1、2满足,则假设3也满足;
如果假设4满足,则假设2也满足。
注意:
以上假设也称为线性回归模型的经典假设或高斯(Gauss)假设,满足该假设的线性回归模型,也称为经典线性回归模型(Classical Linear Regression Model, CLRM)。
另外,在进行模型回归时,还有两个暗含的假设:
假设5. 随着样本容量的无限增加,解释变量X的样本方差趋于一有限常数。即
假设6. 回归模型是正确设定的
假设5旨在排除时间序列数据出现持续上升或下降的变量作为解释变量,因为这类数据不仅使大样本统计推断变得无效,而且往往产生所谓的伪回归问题(spurious regression problem)。
假设6也被称为模型没有设定偏误(specification error)
二、参数的普通最小二乘估计(OLS)
给定一组样本观测值(Xi, Yi)(i=1,2,…n)要求样本回归函数尽可能好地拟合这组值.
普通最小二乘法(Ordinary least squares, OLS)给出的判断标准是:二者之差的平方和
最小。
方程组(*)称为正规方程组(normal equations)。
记
上述参数估计量可以写成:
称为OLS估计量的离差形式(deviation form)。
由于参数的估计结果是通过最小二乘法得到 的,故称为普通最小二乘估计量(ordinary least squares estimators)。
顺便指出 ,记
则有
可得
(**)式也称为样本回归函数的离差形式。
(**)
注意:
在计量经济学中,往往以小写字母表示对均值的离差。
三、参数估计的最大或然法(ML)
最大或然法(Maximum Likelihood,简称ML),也称最大似然法,是不同于最小二乘法的另一种参数估计方法,是从最大或然原理出发发展起来的其他估计方法的基础。
基本原理:
对于最大或然法,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大。
在满足基本假设条件下,对一元线性回归模型:
随机抽取n组样本观测值(Xi, Yi)(i=1,2,…n)。
那么Yi服从如下的正态分布:
于是,Y的概率函数为
(i=1,2,…n)
假如模型的参数估计量已经求得,为
因为Yi是相互独立的,所以的所有样本观测值的联合概率,也即或然函数(likelihood function)为:
将该或然函数极大化,即可求得到模型参数的极大或然估计量。
由于或然函数的极大化与或然函数的对数的极大化是等价的,所以,取对数或然函数如下:
解得模型的参数估计量为:
可见,在满足一系列基本假设的情况下,模型结构参数的最大或然估计量与普通最小二乘估计量是相同的。
例:在上述家庭可支配收入-消费支出例中,对于所抽出的一组样本数,参数估计的计算可通过下面的表进行。
因此,由该样本估计的回归方程为:
四、最小二乘估计量的性质
当模型参数估计出后,需考虑参数估计值的精度,即是否能代表总体参数的真值,或者说需考察参数估计量的统计性质。
一个用于考察总体的估计量,可从如下几个方面考察其优劣性:
(1)线性性,即它是否是另一随机变量的线性函数;
(2)无偏性,即它的均值或期望值是否等于总体的真实值;
(3)有效性,即它是否在所有线性无偏估计量中具有最小方差。
这三个准则也称作估计量的小样本性质。
拥有这类性质的估计量称为最佳线性无偏估计量(best liner unbiased estimator, BLUE)。
(4)渐近无偏性,即样本容量趋于无穷大时,是否它的均值序列趋于总体真值;
(5)一致性,即样本容量趋于无穷大时,它是否依概率收敛于总体的真值;
(6)渐近有效性,即样本容量趋于无穷大时,是否它在所有的一致估计量中具有最小的渐近方差。
当不满足小样本性质时,需进一步考察估计量的大样本或渐近性质:
高斯—马尔可夫定理(Gauss-Markov theorem)
在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线性无偏估计量。
证:
易知
故
同样地,容易得出
(2)证明最小方差性
其中,ci=ki+di,di为不全为零的常数
则容易证明
普通最小二乘估计量(ordinary least Squares Estimators)称为最佳线性无偏估计量(best linear unbiased estimator, BLUE)
由于最小二乘估计量拥有一个“好”的估计量所应具备的小样本特性,它自然也拥有大样本特性。
五、参数估计量的概率分布及随机干扰项方差的估计
2. 随机误差项的方差2的估计
2又称为总体方差。
由于随机项i不可观测,只能从i的估计——残差ei出发,对总体方差进行估计。
可以证明, 2的最小二乘估计量为
它是关于2的无偏估计量。
在最大或然估计法中,
因此, 2的最大或然估计量不具无偏性,但却具有一致性。
§ 一元线性回归模型的统计检验
一、拟合优度检验
二、变量的显著性检验
三、参数的置信区间
说 明
回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归线。
尽管从统计性质上已知,如果有足够多的重复 抽样,参数的估计值的期望(均值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。
那么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验。
主要包括拟合优度检验、变量的显著性检验及参数的区间估计。
一、拟合优度检验
拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。
度量拟合优度的指标:判定系数(可决系数)R2
问题:采用普通最小二乘估计方法,已经保证了模型最好地拟合了样本观测值,为什么还要检验拟合程度?
1、总离差平方和的分解
已知由一组样本观测值(Xi,Yi),i=1,2…,n得到如下样本回归直线
如果Yi=Ŷi 即实际观测值落在样本回归“线”上,则拟合最好。
可认为,“离差”全部来自回归线,而与“残差”无关。
对于所有样本点,则需考虑这些点与样本均值离差的平方和,可以证明:
TSS=ESS+RSS
记
总体平方和(Total Sum of Squares)
回归平方和(Explained Sum of Squares)
残差平方和(Residual Sum of Squares )
Y的观测值围绕其均值的总离差(total variation)可分解为两部分:一部分来自回归线(ESS),另一部分则来自随机势力(RSS)。
在给定样本中,TSS不变,
如果实际观测点离样本回归线越近,则ESS在TSS中占的比重越大,因此
拟合优度:回归平方和ESS/Y的总离差TSS
2、可决系数R2统计量
称 R2 为(样本)可决系数/判定系数(coefficient of determination)。
可决系数的取值范围:[0,1]
R2越接近1,说明实际观测点离样本线越近,拟合优度越高。
在例的收入-消费支出例中,
注:可决系数是一个非负的统计量。它也是随着抽样的不同而不同。为此,对可决系数的统计可靠性也应进行检验,这将在第3章中进行。
二、变量的显著性检验
回归分析是要判断解释变量X是否是被解释变量Y的一个显著性的影响因素。
在一元线性模型中,就是要判断X是否对Y具有显著的线性性影响。这就需要进行变量的显著性检验。
变量的显著性检验所应用的方法是数理统计学中的假设检验。
计量经济学中,主要是针对变量的参数真值是否为零来进行显著性检验的。
1、假设检验
所谓假设检验,就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设。
假设检验采用的逻辑推理方法是反证法
先假定原假设正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设。
判断结果合理与否,是基于“小概率事件不易发生”这一原理的
2、变量的显著性检验
检验步骤:
(1)对总体参数提出假设
H0: 1=0, H1:10
(2)以原假设H0构造t统计量,并由样本计算其值
(3)给定显著性水平,查t分布表得临界值t /2(n-2)
(4) 比较,判断
若 |t|> t /2(n-2),则拒绝H0 ,接受H1 ;
若 |t| t /2(n-2),则拒绝H1 ,接受H0 ;
对于一元线性回归方程中的0,可构造如下t统计量进行显著性检验:
在上述收入—消费支出例中,首先计算2的估计值
t统计量的计算结果分别为:
给定显著性水平=,查t分布表得临界值
t
|t1|>,说明家庭可支配收入在95%的置信度下显著,即是消费支出的主要解释变量;
|t2|<,表明在95%的置信度下,无法拒绝截距项为零的假设。
假设检验可以通过一次抽样的结果检验总体参数可能的假设值的范围(如是否为零),但它并没有指出在一次抽样中样本参数值到底离总体参数的真值有多“近”。
三、参数的置信区间
要判断样本参数的估计值在多大程度上可以“近似”地替代总体参数的真值,往往需要通过构造一个以样本参数的估计值为中心的“区间”,来考察它以多大的可能性(概率)包含着真实的参数值。这种方法就是参数检验的置信区间估计。
如果存在这样一个区间,称之为置信区间(confidence interval); 1-称为置信系数(置信度)(confidence coefficient), 称为显著性水平(level of significance);置信区间的端点称为置信限(confidence limit)或临界值(critical values)。
一元线性模型中,i (i=1,2)的置信区间:
在变量的显著性检验中已经知道:
意味着,如果给定置信度(1-),从分布表中查得自由度为(n-2)的临界值,那么t值处在(-t/2, t/2)的概率是(1- )。表示为:
即
于是得到:(1-)的置信度下, i的置信区间是
在上述收入-消费支出例中,如果给定 =,查表得:
由于
于是,1、0的置信区间分别为:
(,)
(,)
由于置信区间一定程度地给出了样本参数估计值与总体参数真值的“接近”程度,因此置信区间越小越好。
要缩小置信区间,需要
(1)增大样本容量n。因为在同样的置信水平下,n越大,t分布表中的临界值越小;同时,增大样本容量,还可使样本参数估计量的标准差减小;
(2)提高模型的拟合优度。因为样本参数估计量的标准差与残差平方和呈正比,模型拟合优度越高,残差平方和应越小。
由于置信区间一定程度地给出了样本参数估计值与总体参数真值的“接近”程度,因此置信区间越小越好。
要缩小置信区间,需
(1)增大样本容量n,因为在同样的置信水平下,n越大,t分布表中的临界值越小;同时,增大样本容量,还可使样本参数估计量的标准差减小;
(2)提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型拟合优度越高,残差平方和应越小。
§ 一元线性回归分析的应用:预测问题
一、Ŷ0是条件均值E(Y|X=X0)或个值Y0的一个无偏估计
二、总体条件均值与个值预测值的置信区间
对于一元线性回归模型
给定样本以外的解释变量的观测值X0,可以得到被解释变量的预测值Ŷ0 ,可以此作为其条件均值E(Y|X=X0)或个别值Y0的一个近似估计。
严格地说,这只是被解释变量的预测值的估计值,而不是预测值。原因:
(1)参数估计量不确定;
(2)随机项的影响
说 明
一、Ŷ0是条件均值E(Y|X=X0)或个值Y0的一个无偏估计
对总体回归函数E(Y|X=X0)=0+1X,X=X0时
E(Y|X=X0)=0+1X0
于是
可见,Ŷ0是条件均值E(Y|X=X0)的无偏估计。
对总体回归模型Y=0+1X+,当X=X0时
于是
二、总体条件均值与个值预测值的置信区间
1、总体均值预测值的置信区间
由于
于是
可以证明
因此
故
于是,在1-的置信度下,总体均值E(Y|X0)的置信区间为
其中
2、总体个值预测值的预测区间
由 Y0=0+1X0+ 知:
于是
式中 :
从而在1-的置信度下, Y0的置信区间为
在上述收入—消费支出例中,得到的样本回归函数为:
则在 X0=1000处,
Ŷ0 = –+×1000=
而
因此,总体均值E(Y|X=1000)的95%的置信区间为:
< E(Y|X=1000) <+
或 (, )
同样地,对于Y在X=1000的个体值,其95%的置信区间为:
- <Yx=1000 < +
或 (, )
总体回归函数的置信带(域)(confidence band)
个体的置信带(域)
对于Y的总体均值E(Y|X)与个体值的预测区间(置信区间):
(1)样本容量n越大,预测精度越高,反之预测精度越低;
(2)样本容量一定时,置信带的宽度当在X均值处最小,其附近进行预测(插值预测)精度越大;X越远离其均值,置信带越宽,预测可信度下降。
§ 实例:时间序列问题
一、中国居民人均消费模型
二、时间序列问题
一、中国居民人均消费模型
例 考察中国居民收入与消费支出的关系。
GDPP: 人均国内生产总值(1990年不变价)
CONSP:人均居民消费(以居民消费价格指数(1990=100)缩减)。
1. 建立模型
拟建立如下一元回归模型
采用Eviews软件进行回归分析的结果见下表
该两组数据是1978—2000年的时间序列数据(time series data);
前述收入—消费支出例中的数据是截面数据(cross-sectional data)。
一般可写出如下回归分析结果:
() ()
R2= F==
R2=
T值:C:, GDPP:
临界值:
斜率项:0<<1,符合绝对收入假说
2. 模型检验
3. 预测
2001年:GDPP=(元)(1990年不变价)
点估计:CONSP2001= +
= (元)
2001年实测的CONSP(1990年价):元,
相对误差: %。
2001年人均居民消费的预测区间
人均GDP的样本均值与样本方差:
E(GDPP) =
Var(GDPP) = =
在95%的置信度下,E(CONSP2001)的预测区间为:
=
或: (,)
同样地,在95%的置信度下,CONSP2001的预测区间为:
=
或 (, )
二、时间序列问题
上述实例表明,时间序列完全可以进行类似于截面数据的回归分析。
然而,在时间序列回归分析中,有两个需注意的问题:
第一,关于抽样分布的理解问题。
能把表中的数据理解为是从某个总体中抽出的一个样本吗?
可决系数R2,考察被解释变量Y的变化中可由解释变量X的变化“解释”的部分。
这里“解释”能否换为“引起”?
第二,关于“伪回归问题”(spurious regression problem)。
在现实经济问题中,对时间序列数据作回归,即使两个变量间没有任何的实际联系,也往往会得到较高的可决系数,尤其对于具有相同变化趋势(同时上升或下降)的变量,更是如此。这种现象被称为“伪回归”或“虚假回归”。
第三章 经典单方程计量经济学模型:多元线性回归模型
多元线性回归模型
多元线性回归模型的参数估计
多元线性回归模型的统计检验
多元线性回归模型的预测
回归模型的其他形式
回归模型的参数约束
§ 多元线性回归模型
一、多元线性回归模型
二、多元线性回归模型的基本假定
一、多元线性回归模型
多元线性回归模型:表现在线性回归模型中的解释变量有多个。
一般表现形式:
i=1,2…,n
其中:k为解释变量的数目,j称为回归参数(regression coefficient)。
也被称为总体回归函数的随机表达形式。它 的非随机表达式为:
表示:各变量X值固定时Y的平均响应。
习惯上:把常数项看成为一虚变量的系数,该虚变量的样本观测值始终取1。于是:
模型中解释变量的数目为(k+1)
总体回归模型n个随机方程的矩阵表达式为:
其中
j也被称为偏回归系数,表示在其他解释变量保持不变的情况下,X j每变化1个单位时,Y的均值E(Y)的变化;
或者说j给出了X j的单位变化对Y均值的“直接”或“净”(不含其他变量)影响。
用来估计总体回归函数的样本回归函数为:
其随机表示式:
ei称为残差或剩余项(residuals),可看成是总体回归函数中随机扰动项i的近似替代。
样本回归函数的矩阵表达:
或
其中:
二、多元线性回归模型的基本假定
假设1,解释变量是非随机的或固定的,且各X之间互不相关(无多重共线性)。
假设2,随机误差项具有零均值、同方差及不序列相关性。
假设3,解释变量与随机项不相关
假设4,随机项满足正态分布
上述假设的矩阵符号表示 式:
假设1,n(k+1)矩阵X是非随机的,且X的秩=k+1,即X满秩。
假设2,
假设4,向量 有一多维正态分布,即
同一元回归一样,多元回归还具有如下两个重要假设:
假设5,样本容量趋于无穷时,各解释变量的方差趋于有界常数,即n∞时,
假设3,E(X’)=0,即
其中:Q为一非奇异固定矩阵,矩阵x是由各解释变量的离差为元素组成的nk阶矩阵
假设6,回归模型的设定是正确的。
或
§ 多元线性回归模型的估计
一、普通最小二乘估计
*二、最大或然估计
*三、矩估计
四、参数估计量的性质
五、样本容量问题
六、估计实例
说 明
估计方法:
3大类方法:OLS、ML或者MM
在经典模型中多应用OLS
在非经典模型中多应用ML或者MM
在本节中, ML与MM为选学内容
一、普通最小二乘估计
对于随机抽取的n组观测值
如果样本函数的参数估计值已经得到,则有:
i=1,2…n
根据最小二乘原理,参数估计值应该是右列方程组的解
其中
于是得到关于待估参数估计值的正规方程组:
解该(
k+1)
个方程组成的线性代数方程组,即
可得到(k+1)
个待估参数的估计值
$
,
,
,
,
,
b
j
j
=
0
1
2
L
。
k
□正规方程组的矩阵形式
即
由于X’X满秩,故有
将上述过程用矩阵表示如下:
即求解方程组:
得到:
于是:
例:在例的家庭收入-消费支出例中,
可求得:
于是:
⃟正规方程组 的另一种写法
对于正规方程组
于是
或
(*)或(**)是多元线性回归模型正规方程组的另一种写法。
(*)
(**)
⃟样本回归函数的离差形式
i=1,2…n
其矩阵形式为:
其中 :
在离差形式下,参数的最小二乘估计结果为
⃟随机误差项的方差的无偏估计
可以证明,随机误差项的方差的无偏估计量为:
*二、最大或然估计
对于多元线性回归模型
易知
Y的随机抽取的n组样本观测值的联合概率
对数或然函数为
对对数或然函数求极大值,也就是对
求极小值。
即为变量Y的或然函数
因此,参数的最大或然估计为
结果与参数的普通最小二乘估计相同
*三、矩估计(Moment Method, MM)
OLS估计是通过得到一个关于参数估计值的正规方程组
并对它进行求解而完成的。
该正规方程组 可以从另外一种思路来导:
求期望 :
称为原总体回归方程的一组矩条件,表明了原总体回归方程所具有的内在特征。
由此得到正规方程组
解此正规方程组即得参数的MM估计量。
易知MM估计量与OLS、ML估计量等价。
矩方法是工具变量方法(Instrumental Variables,IV)和广义矩估计方法(Generalized Moment Method, GMM)的基础
在矩方法中利用了关键是
E(X’)=0
如果某个解释变量与随机项相关,只要能找到1个工具变量,仍然可以构成一组矩条件。这就是IV。
如果存在>k+1个变量与随机项不相关,可以构成一组包含>k+1方程的矩条件。这就是GMM。
四、参数估计量的性质
在满足基本假设的情况下,其结构参数的普通最小二乘估计、最大或然估计及矩估计仍具有:
线性性、无偏性、有效性。
同时,随着样本容量增加,参数估计量具有:
渐近无偏性、渐近有效性、一致性。
1、线性性
其中,C=(X’X)-1 X’ 为一仅与固定的X有关的行向量
2、无偏性
3、有效性(最小方差性)
这里利用了假设: E(X’)=0
其中利用了
和
五、样本容量问题
所谓“最小样本容量”,即从最小二乘原理和最大或然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。
⒈ 最小样本容量
样本最小容量必须不少于模型中解释变量的数目(包括常数项),即
n ≥ k+1
因为,无多重共线性要求:秩(X)=k+1
2、满足基本要求的样本容量
从统计检验的角度:
n30 时,Z检验才能应用;
n-k≥8时, t分布较为稳定
一般经验认为:
当n≥30或者至少n≥3(k+1)时,才能说满足模型估计的基本要求。
模型的良好性质只有在大样本下才能得到理论上的证明
六、多元线性回归模型的参数估计实例
例 在例中,已建立了中国居民人均消费一元线性模型。这里我们再考虑建立多元线性模型。
解释变量:人均GDP:GDPP
前期消费:CONSP(-1)
估计区间:1979~2000年
Eviews软件估计结果
§ 多元线性回归模型的统计检验
一、拟合优度检验
二、方程的显著性检验(F检验)
三、变量的显著性检验(t检验)
四、参数的置信区间
一、拟合优度检验
1、可决系数与调整的可决系数
则
总离差平方和的分解
由于:
=0
所以有:
注意:一个有趣的现象
可决系数
该统计量越接近于1,模型的拟合优度越高。
问题:在应用过程中发现,如果在模型中增加一个解释变量, R2往往增大(Why?)
这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。—— 但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。
调整的可决系数(adjusted coefficient of determination)
在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:
其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。
*2、赤池信息准则和施瓦茨准则
为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准还有:
赤池信息准则(Akaike information criterion, AIC)
施瓦茨准则(Schwarz criterion,SC)
这两准则均要求仅当所增加的解释变量能够减少AIC值或AC值时才在原模型中增加该解释变量。
Eviews的估计结果显示:
中国居民消费一元例中:
AIC= AC=
中国居民消费二元例中:
AIC= AC=
从这点看,可以说前期人均居民消费CONSP(-1)应包括在模型中。
二、方程的显著性检验(F检验)
方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。
1、方程显著性的F检验
即检验模型
Yi=0+1X1i+2X2i+ +kXki+i i=1,2, ,n
中的参数j是否显著不为0。
可提出如下原假设与备择假设:
H0: 0=1=2= =k=0
H1: j不全为0
F检验的思想来自于总离差平方和的分解式:
TSS=ESS+RSS
如果这个比值较大,则X的联合体对Y的解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。
因此,可通过该比值的大小对总体线性关系进行推断。
根据数理统计学中的知识,在原假设H0成立的条件下,统计量
服从自由度为(k , n-k-1)的F分布。
给定显著性水平,可得到临界值F(k,n-k-1),由样本求出统计量F的数值,通过
F F(k,n-k-1) 或 F≤F(k,n-k-1)
来拒绝或接受原假设H0,以判定原方程总体上的线性关系是否显著成立。
对于中国居民人均消费支出的例子:
一元模型:F=
二元模型:F=
给定显著性水平 =,查分布表,得到临界值:
一元例:F(1,21)=
二元例: F(2,19)=
显然有 F F(k,n-k-1) ,即二个模型的线性关系在95%的水平下显著成立。
2、关于拟合优度检验与方程显著性检验关系的讨论
由
可推出:
与
或
在中国居民人均收入—消费一元模型中,
在中国居民人均收入—消费二元模型中,
三、变量的显著性检验(t检验)
方程的总体线性关系显著每个解释变量对被解释变量的影响都是显著的。
因此,必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。
这一检验是由对变量的 t 检验完成的。
1、t统计量
由于
以cii表示矩阵(X’X)-1 主对角线上的第i个元素,于是参数估计量的方差为:
其中2为随机误差项的方差,在实际计算时,用它的估计量代替:
因此,可构造如下t统计量
2、t检验
设计原假设与备择假设:
H1:i0
给定显著性水平,可得到临界值t/2(n-k-1),由样本求出统计量t的数值,通过
|t| t/2(n-k-1) 或 |t|≤t/2(n-k-1)
来拒绝或接受原假设H0,从而判定对应的解释变量是否应包括在模型中。
H0:i=0 (i=1,2…k)
注意:一元线性回归中,t检验与F检验一致
一方面,t检验与F检验都是对相同的原假设H0:1=0 进行检验;
另一方面,两个统计量之间有如下关系:
在中国居民人均收入-消费支出二元模型例中,由应用软件计算出参数的t值:
给定显著性水平=,查得相应临界值: (19) =。
可见,计算的所有t值都大于该临界值,所以拒绝原假设。即:
包括常数项在内的3个解释变量都在95%的水平下显著,都通过了变量显著性检验。
四、参数的置信区间
参数的置信区间用来考察:在一次抽样中所估计的参数值离参数的真实值有多“近”。
在变量的显著性检验中已经知道:
容易推出:在(1-)的置信水平下i的置信区间是
其中,t/2为显著性水平为 、自由度为n-k-1的临界值。
在中国居民人均收入-消费支出二元模型例中,
给定=,查表得临界值:(19)=
计算得参数的置信区间:
0 :(, )
1 : (, )
2 :(, )
从回归计算中已得到:
如何才能缩小置信区间?
增大样本容量n,因为在同样的样本容量下,n越大,t分布表中的临界值越小,同时,增大样本容量,还可使样本参数估计量的标准差减小;
提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型优度越高,残差平方和应越小。
提高样本观测值的分散度,一般情况下,样本观测值越分散,(X’X)-1的分母的|X’X|的值越大,致使区间缩小。
§ 多元线性回归模型的预测
一、E(Y0)的置信区间
二、Y0的置信区间
对于模型
给定样本以外的解释变量的观测值X0=(1,X10,X20,…,Xk0),可以得到被解释变量的预测值:
它可以是总体均值E(Y0)或个值Y0的预测。
但严格地说,这只是被解释变量的预测值的估计值,而不是预测值。
为了进行科学预测,还需求出预测值的置信区间,包括E(Y0)和Y0的置信区间。
一、E(Y0)的置信区间
易知
容易证明
于是,得到(1-)的置信水平下E(Y0)的置信区间:
其中,t/2为(1-)的置信水平下的临界值。
二、Y0的置信区间
如果已经知道实际的预测值Y0,那么预测误差为:
容易证明
e0服从正态分布,即
构造t统计量
可得给定(1-)的置信水平下Y0的置信区间:
中国居民人均收入-消费支出二元模型例中:2001年人均GDP:元,
于是人均居民消费的预测值为
Ŷ2001=+×+×=(元)
实测值(90年价)=元,相对误差:%
预测的置信区间 :
于是E(Ŷ2001)的95%的置信区间为:
或 (,)
或 (, )
同样,易得Ŷ2001的95%的置信区间为
§ 回归模型的其他函数形式
一、模型的类型与变换
二、非线性回归实例
说 明
在实际经济活动中,经济变量的关系是复杂的,直接表现为线性关系的情况并不多见。
如著名的恩格尔曲线(Engle curves)表现为幂函数曲线形式、宏观经济学中的菲利普斯曲线(Pillips cuves)表现为双曲线形式等。
但是,大部分非线性关系又可以通过一些简单的数学处理,使之化为数学上的线性关系,从而可以运用线性回归模型的理论方法。
一、模型的类型与变换
1、倒数模型、多项式模型与变量的直接置换法
例如,描述税收与税率关系的拉弗曲线:抛物线
s = a + b r + c r2 c<0
s:税收; r:税率
设X1 = r,X2 = r2, 则原方程变换为
s = a + b X1 + c X2 c<0
2、幂函数模型、指数函数模型与对数变换法
例如,Cobb-Dauglas生产函数:幂函数
Q = AKL
Q:产出量,K:投入的资本;L:投入的劳动
方程两边取对数:
ln Q = ln A + ln K + ln L
3、复杂函数模型与级数展开法
方程两边取对数后,得到:
(1+2=1)
Q:产出量,K:资本投入,L:劳动投入
:替代参数, 1、2:分配参数
例如,常替代弹性CES生产函数
将式中ln(1K- + 2L-)在=0处展开台劳级数,取关于的线性项,即得到一个线性近似式。
如取0阶、1阶、2阶项,可得:
二、非线性回归实例
例 建立中国城镇居民食品消费需求函数模型。
根据需求理论,居民对食品的消费需求函数大致为:
Q:居民对食品的需求量,X:消费者的消费支出总额
P1:食品价格指数,P0:居民消费价格总指数。
(*)
零阶齐次性,当所有商品和消费者货币支出总额按同一比例变动时,需求量保持不变
(**)
为了进行比较,将同时估计(*)式与(**)式。
根据恩格尔定律,居民对食品的消费支出与居民的总支出间呈幂函数的变化关系:
首先,确定具体的函数形式
对数变换:
(***)
考虑到零阶齐次性时
(****)式也可看成是对(***)式施加如下约束而得:
因此,对(****)式进行回归,就意味着原需求函数满足零阶齐次性条件。
(****)
X:人均消费
X1:人均食品消费
GP:居民消费价格指数
FP:居民食品消费价格指数
XC:人均消费(90年价)
Q:人均食品消费(90年价)
P0:居民消费价格缩减指数(1990=100)
P:居民食品消费价格缩减指数(1990=100
中国城镇居民人均食品消费
特征:
消费行为在1981~1995年间表现出较强的一致性;
1995年之后呈现出另外一种变动特征。
建立1981~1994年中国城镇居民对食品的消费需求模型:
() () () ()
按零阶齐次性表达式回归:
()() ()
为了比较,改写该式为:
与
接近。
意味着:所建立的食品需求函数满足零阶齐次性特征。
§ 受约束回归
一、模型参数的线性约束
二、对回归模型增加或减少解释变量
三、参数的稳定性
*四、非线性约束
说 明
在建立回归模型时,有时根据经济理论需要对模型中的参数施加一定的约束条件。例如:
——需求函数的0阶齐次性条件
——生产函数的1阶齐次性条件
模型施加约束条件后进行回归,称为受约束回归(restricted regression);
未加任何约束的回归称为无约束回归(unrestricted regression)。
一、模型参数的线性约束
例如对模型:
施加约束:
得:
或:
(*)
(**)
如果对(**)式回归得出:
则由约束条件可得:
然而,对所考查的具体问题能否施加约束?需进一步进行相应的检验。常用的检验有:F检验、x2检验与t检验。
F检验
在同一样本下,记无约束样本回归模型为:
受约束样本回归模型为:
于是:
受约束样本回归模型的残差平方和RSSR
于是
e’e为无约束样本回归模型的残差平方和RSSU
(*)
受约束与无约束模型都有相同的TSS
这意味着,通常情况下,对模型施加约束条件会降低模型的解释能力。
但是,如果约束条件为真,则受约束回归模型与无约束回归模型具有相同的解释能力,RSSR 与 RSSU的差异变小。
由(*)式 RSSR ≥ RSSU
从而 ESSR ≤ ESSU
可用RSSR - RSSU的大小来检验约束的真实性
根据数理统计学的知识:
于是:
讨论:
如果约束条件无效, RSSR 与 RSSU的差异较大,计算的F值也较大。
于是,可用计算的F统计量的值与所给定的显著性水平下的临界值作比较,对约束条件的真实性进行检验。
注意,kU - kR恰为约束条件的个数。
例 中国城镇居民对食品的人均消费需求实例中,对零阶齐次性检验:
无约束回归:RSSU=, kU=3
受约束回归:RSSR=, KR=2
样本容量n=14, 约束条件个数kU - kR=3-2=1
取=5%,查得临界值(1,10)=
结论:不能拒绝中国城镇居民对食品的人均消费需求函数具有零阶齐次特性这一假设。
这里的F检验适合所有关于参数线性约束的检验
如:多元回归中对方程总体线性性的F检验:
H0: j=0 j=1,2,…,k
这里:受约束回归模型为
这里,运用了ESSR =0。
二、对回归模型增加或减少解释变量
考虑如下两个回归模型
(*)
(**)
(*)式可看成是(**)式的受约束回归:
H0:
相应的F统计量为:
F统计量的另一个等价式
如果约束条件为真,即额外的变量Xk+1, …, Xk+q对Y没有解释能力,则F统计量较小;
否则,约束条件为假,意味着额外的变量对Y有较强的解释能力,则F统计量较大。
因此,可通过F的计算值与临界值的比较,来判断额外变量是否应包括在模型中。
讨论:
三、参数的稳定性
1、邹氏参数稳定性检验
建立模型时往往希望模型的参数是稳定的,即所谓的结构不变,这将提高模型的预测与分析功能。如何检验?
假设需要建立的模型为
在两个连续的时间序列(1,2,…,n1)与(n1+1,…,n1+n2)中,相应的模型分别为:
合并两个时间序列为( 1,2,…,n1 ,n1+1,…,n1+n2 ),则可写出如下无约束回归模型
如果=,表示没有发生结构变化,因此可针对如下假设进行检验:
H0: =
(*)式施加上述约束后变换为受约束回归模型
(*)
(**)
因此,检验的F统计量为:
记RSS1与RSS2为在两时间段上分别回归后所得的残差平方和,容易验证,
于是
参数稳定性的检验步骤:
(1)分别以两连续时间序列作为两个样本进行回归,得到相应的残差平方: RSS1与RSS2
(2)将两序列并为一个大样本后进行回归,得到大样本下的残差平方和RSSR
(3)计算F统计量的值,与临界值比较:
若F值大于临界值,则拒绝原假设,认为发生了结构变化,参数是非稳定的。
该检验也被称为邹氏参数稳定性检验(Chow test for parameter stability)。
2、邹氏预测检验
上述参数稳定性检验要求n2>k。
如果出现n2<k ,则往往进行如下的邹氏预测检验(Chow test for predictive failure)。
邹氏预测检验的基本思想:
先用前一时间段n1个样本估计原模型,再用估计出的参数进行后一时间段n2个样本的预测。
如果预测误差较大,则说明参数发生了变化,否则说明参数是稳定的。
分别以、 表示第一与第二时间段的参数,则:
其中,
(*)
如果 =0,则 = ,表明参数在估计期与预测期相同
(*)的矩阵式:
可见,用前n1个样本估计可得前k个参数的估计,而是用后n2个样本测算的预测误差X2( - )
(**)
如果参数没有发生变化,则=0,矩阵式简化为
(***)
(***)式与(**)式
这里:KU - KR=n2
RSSU=RSS1
分别可看成受约束与无约束回归模型,于是有如下F检验:
第一步,在两时间段的合成大样本下做OLS回归,得受约束模型的残差平方和RSSR ;
第二步,对前一时间段的n1个子样做OLS回归,得残差平方和RSS1 ;
第三步,计算检验的F统计量,做出判断:
邹氏预测检验步骤:
给定显著性水平,查F分布表,得临界值F(n2, n1-k-1),如果 F>F(n2, n1-k-1) ,则拒绝原假设,认为预测期发生了结构变化。
例 中国城镇居民食品人均消费需求的邹氏检验。
1、参数稳定性检验
1981~1994:
RSS1=
1995~2001:
() () () ()
1981~2001:
() () () ()
给定=5%,查表得临界值(4, 13)=
结论:F值>临界值,拒绝参数稳定的原假设,表明中国城镇居民食品人均消费需求在1994年前后发生了显著变化。
2、邹氏预测检验
给定=5%,查表得临界值(7, 10)=
结论: F值>临界值,拒绝参数稳定的原假设
*四、非线性约束
也可对模型参数施加非线性约束,如对模型
施加非线性约束12=1,得到受约束回归模型:
该模型必须采用非线性最小二乘法(nonlinear least squares)进行估计。
非线性约束检验是建立在最大似然原理基础上的,有最大似然比检验、沃尔德检验与拉格朗日乘数检验.
1、最大似然比检验 (likelihood ratio test, LR)
估计:无约束回归模型与受约束回归模型,
方法:最大似然法,
检验:两个似然函数的值的差异是否“足够”大。
记L(,2)为一似然函数:
无约束回归 : Max:
受约束回归 : Max:
约束:g()=0
或求极值:
g():以各约束条件为元素的列向量,
’:以相应拉格朗日乘数为元素的行向量
受约束的函数值不会超过无约束的函数值,但如果约束条件为真,则两个函数值就非常“接近”。
由此,定义似然比(likelihood ratio):
如果比值很小,说明两似然函数值差距较大,则应拒绝约束条件为真的假设;
如果比值接近于1,说明两似然函数值很接近,应接受约束条件为真的假设。
具体检验时,由于大样本下:
h是约束条件的个数。因此:通过LR统计量的2分布特性来进行判断。
在中国城镇居民人均食品消费需求例中,对零阶齐次性的检验:
LR= -2()=
给出=5%、查得临界值(1)=,
LR< (1),不拒绝原约束的假设,
结论:中国城镇居民对食品的人均消费需求函数满足零阶齐次性条件。
2、沃尔德检验(Wald test, W)
沃尔德检验中,只须估计无约束模型。如对
在所有古典假设都成立的条件下,容易证明
因此,在1+2=1的约束条件下:
记
可建立沃尔德统计量:
如果有h个约束条件,可得到h个统计量z1,z2,…,zh
约束条件为真时,可建立大样本下的服从自由度为h的渐近2 分布统计量:
其中,Z为以zi为元素的列向量,C是Z的方差-协方差矩阵。因此,W从总体上测量了无约束回归不满足约束条件的程度。对非线性约束,沃尔德统计量W的算法描述要复杂得多。
3、拉格朗日乘数检验
拉格朗日乘数检验则只需估计受约束模型.
受约束回归是求最大似然法的极值问题:
’是拉格朗日乘数行向量,衡量各约束条件对最大似然函数值的影响程度。
如果某一约束为真,则该约束条件对最大似然函数值的影响很小,于是,相应的拉格朗日乘数的值应接近于零。
因此,拉格朗日乘数检验就是检验某些拉格朗日乘数的值是否“足够大”,如果“足够大”,则拒绝约束条件为真的假设。
拉格朗日统计量LM本身是一个关于拉格朗日乘数的复杂的函数,在各约束条件为真的情况下,服从一自由度恰为约束条件个数的渐近2分布。
同样地,如果为线性约束,LM服从一精确的2分布:
(*)
n为样本容量,R2为如下被称为辅助回归(auxiliary regression)的可决系数:
如果约束是非线性的,辅助回归方程的估计比较复杂,但仍可按(*)式计算LM统计量的值。
最后,一般地有:LM≤LR≤W
第四章
经典单方程计量经济学模型:放宽基本假定的模型
§ 异方差性
§ 序列相关性
§ 多重共线性
§ 随机解释变量问题
基本假定违背主要 包括:
(1)随机误差项序列存在异方差性;
(2)随机误差项序列存在序列相关性;
(3)解释变量之间存在多重共线性;
(4)解释变量是随机变量且与随机误差项相关的随机解释变量问题;
(5)模型设定有偏误;
(6)解释变量的方差不随样本容量的增而收敛。
计量经济检验:对模型基本假定的检验
本章主要学习:前4类
§ 异方差性
一、异方差的概念
二、异方差的类型
三、实际经济问题中的异方差性
四、异方差性的后果
五、异方差性的检验
六、异方差的修正
七、案例
对于模型
如果出现
即对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性(Heteroskedasticity)。
一、异方差的概念
二、异方差的类型
同方差:i2 = 常数 f(Xi)
异方差: i2 = f(Xi)
异方差一般可归结为三种类型:
(1)单调递增型: i2随X的增大而增大
(2)单调递减型: i2随X的增大而减小
(3)复 杂 型: i2与X的变化呈复杂形式
三、实际经济问题中的异方差性
例:截面资料下研究居民家庭的储蓄行为:
Yi=0+1Xi+i
Yi:第i个家庭的储蓄额 Xi:第i个家庭的可支配收入。
高收入家庭:储蓄的差异较大
低收入家庭:储蓄则更有规律性,差异较小
i的方差呈现单调递增型变化
例,以绝对收入假设为理论假设、以截面数据为样本建立居民消费函数:
Ci=0+1Yi+I
将居民按照收入等距离分成n组,取组平均数为样本观测值。
一般情况下,居民收入服从正态分布:中等收入组人数多,两端收入组人数少。而人数多的组平均数的误差小,人数少的组平均数的误差大。
所以样本观测值的观测误差随着解释变量观测值的不同而不同,往往引起异方差性。
例,以某一行业的企业为样本建立企业生产函数模型:
Yi=Ai1 Ki2 Li3ei
被解释变量:产出量Y
解释变量:资本K、劳动L、技术A,
那么:每个企业所处的外部环境对产出量的影响被包含在随机误差项中。
每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。
这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。
四、异方差性的后果
计量经济学模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:
1. 参数估计量非有效
OLS估计量仍然具有无偏性,但不具有有效性
因为在有效性证明中利用了 E(’)=2I
而且,在大样本情况下,尽管参数估计量具有一致性,但仍然不具有渐近有效性。
2. 变量的显著性检验失去意义
变量的显著性检验中,构造了t统计量
其他检验也是如此。
3. 模型的预测失效
一方面,由于上述后果,使得模型不具有良好的统计性质;
所以,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。
五、异方差性的检验
检验思路:
由于异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:
检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。
问题在于用什么来表示随机误差项的方差
一般的处理方法:
几种异方差的检验方法:
1. 图示法
(1)用X-Y的散点图进行判断
看是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中)
看是否形成一斜率为零的直线
2. 帕克(Park)检验与戈里瑟(Gleiser)检验
基本思想:
偿试建立方程:
或
选择关于变量X的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。
如: 帕克检验常用的函数形式:
或
若在统计上是显著的,表明存在异方差性。
3. 戈德菲尔德-匡特(Goldfeld-Quandt)检验
G-Q检验以F检验为基础,适用于样本容量较大、异方差递增或递减的情况。
G-Q检验的思想:
先将样本一分为二,对子样①和子样②分别作回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。
由于该统计量服从F分布,因此假如存在递增的异方差,则F远大于1;反之就会等于1(同方差)、或小于1(递减方差)。
G-Q检验的步骤:
①将n对样本观察值(Xi,Yi)按观察值Xi的大小排队;
②将序列中间的c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为(n-c)/2;
③对每个子样分别进行OLS回归,并计算各自的残差平方和;
④在同方差性假定下,构造如下满足F分布的统计量
⑤给定显著性水平,确定临界值F(v1,v2),
若F> F(v1,v2), 则拒绝同方差性假设,表明存在异方差。
当然,还可根据两个残差平方和对应的子样的顺序判断是递增型异方差还是递减异型方差。
4. 怀特(White)检验
怀特检验不需要排序,且适合任何形式的异方差。
怀特检验的基本思想与步骤(以二元为例):
然后做如下辅助回归
可以证明,在同方差假设下:
(*)
R2为(*)的可决系数,h为(*)式解释变量的个数,
表示渐近服从某分布。
注意:
辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。
如果存在异方差性,则表明确与解释变量的某种组合有显著的相关性,这时往往显示出有较高的可决系数以及某一参数的t检验值较大。
当然,在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉交叉项。
六、异方差的修正
模型检验出存在异方差性,可用加权最小二乘法(Weighted Least Squares, WLS)进行估计。
加权最小二乘法的基本思想:
加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用OLS估计其参数。
例如,如果对一多元模型,经检验知:
在采用OLS方法时:
对较小的残差平方ei2赋予较大的权数;
对较大的残差平方ei2赋予较小的权数。
新模型中,存在
即满足同方差性,可用OLS法估计。
一般情况下:
对于模型Y=X+
存在:
即存在异方差性。
W是一对称正定矩阵,存在一可逆矩阵D使得
W=DD’
用D-1左乘 Y=X+
两边,得到一个新的模型:
该模型具有同方差性。因为
这就是原模型Y=X+的加权最小二乘估计量,是无偏、有效的估计量。
这里权矩阵为D-1,它来自于原模型残差项的方差-协方差矩阵2W 。
如何得到2W ?
从前面的推导过程看,它来自于原模型残差项的方差—协方差矩阵。因此仍对原模型进行OLS估计,得到随机误差项的近似估计量ěi,以此构成权矩阵的估计量,即
这时可直接以
作为权矩阵。
注意:
在实际操作中人们通常采用如下的经验方法:
不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。
如果确实存在异方差,则被有效地消除了;
如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法。
七、案例——中国农村居民人均消费函数
例 中国农村居民人均消费支出主要由人均纯收入来决定。
农村人均纯收入包括:(1)从事农业经营的收入;(2)包括从事其他产业的经营性收入(3)工资性收入;(4)财产收入;(4)转移支付收入。
考察从事农业经营的收入(X1)和其他收入(X2)对中国农村居民消费支出(Y)增长的影响:
普通最小二乘法的估计结果:
异方差检验
进一步的统计检验
(1)G-Q检验
将原始数据按X2排成升序,去掉中间的7个数据,得两个容量为12的子样本。
对两个子样本分别作OLS回归,求各自的残差平方和RSS1和RSS2:
子样本1:
() () ()
R2=, RSS1=
子样本2:
() () ()
R2=, RSS2=
计算F统计量:
F= RSS2/RSS1=
查表
给定=5%,查得临界值 (9,9)=
判断
F> (9,9)
否定两组子样方差相同的假设,从而该总体随机项存在递增异方差性。
(2)怀特检验
作辅助回归:
( () () () ()
()
R2 =
似乎没有哪个参数的t检验是显著的 。但
n R2 =31*=
=5%下,临界值 (5)=,拒绝同方差性。
去掉交叉项后的辅助回归结果
() () (064) () ()
R2 =
X2项与X2的平方项的参数的t检验是显著的,且
n R2 =31 =
=5%下,临界值 (4)=,拒绝同方差的原假设。
原模型的加权最小二乘回归
对原模型进行OLS估计,得到随机误差项的近似估计量ěi,以此构成权矩阵2W的估计量;
再以1/| ěi|为权重进行WLS估计,得
各项统计检验指标全面改善
一、序列相关性概念
二、实际经济问题中的序列相关性
三、序列相关性的后果
四、序列相关性的检验
五、案例
§ 序列相关性
一、序列相关性概念
如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了序列相关性(Serial Correlation)。
对于模型
Yi=0+1X1i+2X2i+…+kXki+i i=1,2, …,n
随机项互不相关的基本假设表现为
Cov(i , j)=0 ij, i,j=1,2, …,n
或
称为一阶列相关,或自相关(autocorrelation)
其中:被称为自协方差系数(coefficient of autocovariance)或一阶自相关系数(first-order coefficient of autocorrelation)
如果仅存在
E(i i+1)0 i=1,2, …,n
自相关往往可写成如下形式:
i=i-1+i -1<<1
由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标t代表i。
i是满足以下标准OLS假定的随机干扰项:
二、实际经济问题中的序列相关性
1.经济变量固有的惯性
大多数经济时间数据都有一个明显的特点:惯性,表现在时间序列不同时间的前后关联上。
由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关 )。
例如,绝对收入假设下居民总消费函数模型:
Ct=0+1Yt+t t=1,2,…,n
2.模型设定的偏误
所谓模型设定偏误(Specification error)是指所设定的模型“不正确”。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。
例如,本来应该估计的模型为
Yt=0+1X1t+ 2X2t + 3X3t + t
但在模型设定中做了下述回归:
Yt=0+1X1t+ 1X2t + vt
因此, vt=3X3t + t,如果X3确实影响Y,则出现序列相关。
又如:如果真实的边际成本回归模型应为:
Yt= 0+1Xt+2Xt2+t
其中:Y=边际成本,X=产出。
但建模时设立了如下模型:
Yt= 0+1Xt+vt
因此,由于vt= 2Xt2+t, ,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。
3. 数据的“编造”
例如:季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动性,从而使随机干扰项出现序列相关。
在实际经济问题中,有些数据是通过已知数据生成的。
因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。
还有就是两个时间点之间的“内插”技术往往导致随机项的序列相关性。
计量经济学模型一旦出现序列相关性,如果仍采用OLS法估计模型参数,会产生下列不良后果:
二、序列相关性的后果
1. 参数估计量非有效
因为,在有效性证明中利用了
E(NN’)=2I
即同方差性和互相独立性条件。
而且,在大样本情况下,参数估计量虽然具有一致性,但仍然不具有渐近有效性。
2. 变量的显著性检验失去意义
在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。
其他检验也是如此。
3. 模型的预测失效
区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。
所以,当模型出现序列相关性时,它的预测功能失效。
三、序列相关性的检验
然后,通过分析这些“近似估计量”之间的相关性,以判断随机误差项是否具有序列相关性。
序列相关性检验方法有多种,但基本思路相同:
基本思路:
1. 图示法
2. 回归检验法
……
如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。
回归检验法的优点是:(1)能够确定序列相关的形式,(2)适用于任何类型序列相关性问题的检验。
3. 杜宾—瓦森(Durbin-Watson)检验法
D-W检验是杜宾()和瓦森(. Watson)于1951年提出的一种检验序列自相关的方法。该方法的假定条件是:
(1)解释变量X非随机;
(2)随机误差项i为一阶自回归形式:
i=i-1+i
(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式:
Yi=0+1X1i+kXki+Yi-1+i
(4)回归含有截距项
针对原假设:H0: =0, 构如下造统计量:
. 统计量:
该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精确的分布很难得到。
但是,他们成功地导出了临界值的下限dL和上限dU ,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。
检验步骤:
(1)计算DW值
(2)给定,由n和k的大小查DW分布表,得临界值dL和dU
(3)比较、判断
若 0<.<dL 存在正自相关
dL<.<dU 不能确定
dU <.<4-dU 无自相关
当.值在2左右时,模型不存在一阶自相关。
正相关
不能确定
无自相关
不能确定
负相关
0 dL dU 2 4-dU 4-dL
4-dU <.<4- dL 不能确定
4-dL <.<4 存在负自相关
证明:
展开.统计量:
(*)
如果存在完全一阶正相关,即=1,则 . 0
完全一阶负相关,即= -1, 则 . 4
完全不相关, 即=0,则 .2
这里,
为一阶自回归模型 i=i-1+i 的参数估计。
4. 拉格朗日乘数(Lagrange multiplier)检验
拉格朗日乘数检验克服了DW检验的缺陷,适合于高阶序列相关以及模型中存在滞后被解释变量的情形。
它是由布劳殊(Breusch)与戈弗雷(Godfrey)于1978年提出的,也被称为GB检验。
对于模型:
如果怀疑随机扰动项存在p阶序列相关:
GB检验可用来检验如下受约束回归方程:
约束条件为:
H0: 1=2=…=p =0
约束条件H0为真时,大样本下:
其中,n为样本容量,R2为如下辅助回归的可决系数:
给定,查临界值2(p),与LM值比较,做出判断,实际检验中,可从1阶、2阶、…逐次向更高阶检验。
如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型。
最常用的方法是广义最小二乘法(GLS: Generalized least squares)和广义差分法(Generalized Difference)。
四、序列相关的补救
1. 广义最小二乘法
对于模型
Y=X+
如果存在序列相关,同时存在异方差,即有
是一对称正定矩阵,存在一可逆矩阵D,使得
=DD’
变换原模型:
D-1Y=D-1X +D-1
即 Y*=X* + * (*)
(*)式的OLS估计:
该模型具有同方差性和随机误差项互相独立性:
如何得到矩阵?
这就是原模型的广义最小二乘估计量(GLS estimators),是无偏的、有效的估计量。
对的形式进行特殊设定后,才可得到其估计值。
如设定随机扰动项为一阶序列相关形式
i=i-1+i
则
2. 广义差分法
广义差分法是将原模型变换为满足OLS法的差分模型,再进行OLS估计。
如果原模型
存在
注意:
广义差分法就是上述广义最小二乘法,但是却损失了部分样本观测值。
如:一阶序列相关的情况下,广义差分是估计
可以将原模型变换为:
该模型为广义差分模型,不存在序列相关问题。可进行OLS估计。
这相当于:
去掉第一行后左乘原模型Y=X+ 。即运用了GLS法,但第一次观测值被排除了。
3. 随机误差项相关系数的估计
应用广义最小二乘法或广义差分法,必须已知随机误差项的相关系数1, 2, … , L 。
实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。
常用的估计方法有:
科克伦-奥科特(Cochrane-Orcutt)迭代法
杜宾(durbin)两步法
(1)科克伦-奥科特迭代法
以一元线性模型为例:
首先,采用OLS法估计原模型
Yi=0+1Xi+i
得到的的“近似估计值”,并以之作为观测值使用OLS法估计下式
i=1i-1+2i-2+Li-L+i
求出i新的“近拟估计值”, 并以之作为样本观测值,再次估计:
i=1i-1+2i-2+Li-L+i
类似地,可进行第三次、第四次迭代。
关于迭代的次数,可根据具体的问题来定。
一般是事先给出一个精度,当相邻两次1,2, ,L的估计值之差小于这一精度时,迭代终止。
实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代过程也被称为科克伦—奥科特两步法。
(2)杜宾(durbin)两步法
该方法仍是先估计1,2,,l,再对差分模型进行估计。
第一步,变换差分模型为下列形式:
进行OLS估计,得各Yj(j=i-1, i-2, …,i-l)前的系数1,2, , l的估计值
应用软件中的广义差分法
在Eview/TSP软件包下,广义差分采用了科克伦-奥科特(Cochrane-Orcutt)迭代法估计。
在解释变量中引入AR(1)、AR(2)、…,即可得到参数和ρ1、ρ2、…的估计值。
其中AR(m)表示随机误差项的m阶自回归。在估计过程中自动完成了ρ1、ρ2、…的迭代。
如果能够找到一种方法,求得Ω或各序列相关系数j的估计量,使得GLS能够实现,则称为可行的广义最小二乘法(FGLS, Feasible Generalized Least Squares)。
FGLS估计量,也称为可行的广义最小二乘估计量(feasible general least squares estimators)
注意:
可行的广义最小二乘估计量不再是无偏的,但却是一致的,而且在科克伦-奥科特迭代法下,估计量也具有渐近有效性。
前面提出的方法,就是FGLS。
4. 虚假序列相关问题
由于随机项的序列相关往往是在模型设定中遗漏了重要的解释变量或对模型的函数形式设定有误,这种情形可称为虚假序列相关(false autocorrelation) ,应在模型设定中排除。
避免产生虚假序列相关性的措施是在开始时建立一个“一般”的模型,然后逐渐剔除确实不显著的变量。
五、案例:中国商品进口模型
经济理论指出,商品进口主要由进口国的经济发展水平,以及商品进口价格指数与国内价格指数对比因素决定的。
由于无法取得中国商品进口价格指数,我们主要研究中国商品进口与国内生产总值的关系。(下表)。
1.通过OLS法建立如下中国商品进口方程
2. 进行序列相关性检验
() ()
DW检验
取=5%,由于n=24,k=2(包含常数项),查表得:
dl=, du=
由于 DW=< dl ,故: 存在正自相关。
拉格朗日乘数检验
() () () ()
R2=
2阶滞后:
于是,LM=22=
取=5%,2分布的临界值(2)=
LM > (2) 故: 存在正自相关
3.阶滞后:
() () () () ()
R2=
于是,LM=21=
取=5%,2分布的临界值(3)=
LM > (3)
表明: 存在正自相关;但ět-3的参数不显著,说明不存在3阶序列相关性。
3. 运用广义差分法进行自相关的处理
(1)采用杜宾两步法估计
第一步,估计模型
() () () () () ()
则M*关于GDP*的OLS估计结果为:
第二步,作差分变换:
() ()
取=5%,DW>du= (样本容量24-2=22)
表明:已不存在自相关
于是原模型为:
与OLS估计结果的差别只在截距项:
(2)采用科克伦-奥科特迭代法估计
在Eviews软包下,2阶广义差分的结果为:
取=5% ,DW>du=(样本容量:22)
表明:广义差分模型已不存在序列相关性。
() () () ()
可以验证: 仅采用1阶广义差分,变换后的模型仍存在1阶自相关性;
采用3阶广义差分,变换后的模型不再有自相关性,但AR[3]的系数的t值不显著。
一、多重共线性的概念
二、实际经济问题中的多重共线性
三、多重共线性的后果
四、多重共线性的检验
五、克服多重共线性的方法
六、案例
*七、分部回归与多重共线性
§ 多重共线性
一、多重共线性的概念
对于模型
Yi=0+1X1i+2X2i++kXki+i
i=1,2,…,n
其基本假设之一是解释变量是互相独立的。
如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multicollinearity)。
如果存在
c1X1i+c2X2i+…+ckXki=0 i=1,2,…,n
其中: ci不全为0,则称为解释变量间存在完全共线性(perfect multicollinearity)。
如果存在
c1X1i+c2X2i+…+ckXki+vi=0 i=1,2,…,n
其中ci不全为0,vi为随机误差项,则称为 近似共线性(approximate multicollinearity)或交互相关(intercorrelated)。
在矩阵表示的线性回归模型
Y=X+
中,完全共线性指:秩(X)<k+1,即
中,至少有一列向量可由其他列向量(不包括第一列)线性表出。
如:X2= X1,则X2对Y的作用可由X1代替。
二、实际经济问题中的多重共线性
一般地,产生多重共线性的主要原因有以下三个方面:
(1)经济变量相关的共同趋势
时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。
(2)滞后变量的引入
在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。
例如,消费=f(当期收入, 前期收入)
显然,两期收入间有较强的线性相关性。
横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。
(3)样本资料的限制
由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。
一般经验:
时间序列数据样本:简单线性模型,往往存在多重共线性。
截面数据样本:问题不那么严重,但多重共线性仍然是存在的。
三、多重共线性的后果
1. 完全共线性下参数估计量不存在
如果存在完全共线性,则(X’X)-1不存在,无法得到参数的估计量。
的OLS估计量为:
例:对离差形式的二元回归模型
如果两个解释变量完全相关,如x2= x1,则
这时,只能确定综合参数1+2的估计值:
2. 近似共线性下OLS估计量非有效
近似共线性下,可以得到OLS参数估计量,
但参数估计量方差的表达式为
由于|X’X|0,引起(X’X) -1主对角线元素较大,使参数估计值的方差增大,OLS参数估计量非有效。
仍以二元线性模型 y=1x1+2x2+ 为例:
恰为X1与X2的线性相关系数的平方r2
由于 r2 1,故 1/(1- r2 )1
多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(Variance Inflation Factor, VIF)
当完全不共线时, r2 =0
当近似共线时, 0< r2 <1
当完全共线时, r2=1,
3. 参数估计量经济含义不合理
如果模型中两个解释变量具有线性相关性,例如 X2= X1 ,
这时,X1和X2前的参数1、2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。
1、 2已经失去了应有的经济含义,于是经常表现出似乎反常的现象:例如1本来应该是正的,结果恰是负的。
4. 变量的显著性检验失去意义
存在多重共线性时
参数估计值的方差与标准差变大
容易使通过样本计算的t值小于临界值,
误导作出参数为0的推断
可能将重要的解释变量排除在模型之外
5. 模型的预测功能失效
变大的方差容易使区间预测的“区间”变大,使预测失去意义。
注意:
除非是完全共线性,多重共线性并不意味着任何基本假设的违背;
因此,即使出现较高程度的多重共线性,OLS估计量仍具有线性性等良好的统计性质。
问题在于,即使OLS法仍是最好的估计方法,它却不是“完美的”,尤其是在统计推断上无法给出真正有用的信息。
四、多重共线性的检验
多重共线性检验的任务是:
(1)检验多重共线性是否存在;
(2)估计多重共线性的范围,即判断哪些变量之间存在共线性。
多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法主要是统计方法:如判定系数检验法、逐步回归检验法等。
1. 检验多重共线性是否存在
(1)对两个解释变量的模型,采用简单相关系数法
求出X1与X2的简单相关系数r,若|r|接近1,则说明两变量存在较强的多重共线性。
(2)对多个解释变量的模型,采用综合统计检验法
若 在OLS法下:R2与F值较大,但t检验值较小,说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著。
2. 判明存在多重共线性的范围
如果存在多重共线性,需进一步确定究竟由哪些变量引起。
(1) 判定系数检验法
使模型中每一个解释变量分别以其余解释变量为解释变量进行回归,并计算相应的拟合优度。
如果某一种回归: Xji=1X1i+2X2i+LXLi
的判定系数较大,说明Xj与其他X间存在共线性。
具体可进一步对上述回归方程作F检验:
式中:Rj•2为第j个解释变量对其他解释变量的回归方程的决定系数,
构造如下F统计量
在模型中排除某一个解释变量Xj,估计模型;
如果拟合优度与包含Xj时十分接近,则说明Xj与其它解释变量之间存在共线性。
另一等价的检验是:
若存在较强的共线性,则Rj•2较大且接近于1,这时(1- Rj•2 )较小,从而Fj的值较大。
因此,给定显著性水平,计算F值,并与相应的临界值比较,来判定是否存在相关性。
(2)逐步回归法
以Y为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。
根据拟合优度的变化决定新引入的变量是否独立。
如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量;
如果拟合优度变化很不显著,则说明新引入的变量与其它变量之间存在共线性关系。
五、克服多重共线性的方法
找出引起多重共线性的解释变量,将它排除。
以逐步回归法得到最广泛的应用。
注意:这时,剩余解释变量参数的经济含义和数值都发生了变化。
如果模型被检验证明存在多重共线性,则需要发展新的方法估计模型,最常用的方法有三类。
1. 第一类方法:排除引起共线性的变量
2. 第二类方法:差分法
时间序列数据、线性模型:将原模型变换为差分模型:
Yi=1 X1i+2 X2i++k Xki+ i
可以有效地消除原模型中的多重共线性。
一般讲,增量之间的线性关系远比总量之间的线性关系弱得多。
例
如
由表中的比值可以直观地看到,增量的线性关系弱于总量之间的线性关系。
进一步分析:
Y与C(-1)之间的判定系数为,
△Y与△C(-1)之间的判定系数为
3. 第三类方法:减小参数估计量的方差
多重共线性的主要后果是参数估计量具有较大的方差,所以采取适当方法减小参数估计量的方差,虽然没有消除模型中的多重共线性,但确能消除多重共线性造成的后果。
例如:
①增加样本容量,可使参数估计量的方差减小。
*②岭回归法(Ridge Regression)
70年代发展的岭回归法,以引入偏误为代价减小参数估计量的方差,受到人们的重视。
具体方法是:引入矩阵D,使参数估计量为
其中矩阵D一般选择为主对角阵,即
D=aI
a为大于0的常数。
(*)
显然,与未含D的参数B的估计量相比,(*)式的估计量有较小的方差。
六、案例——中国粮食生产函数
根据理论和经验分析,影响粮食生产(Y)的主要因素有:
农业化肥施用量(X1) 粮食播种面积(X2)
成灾面积(X3) 农业机械总动力(X4)
农业劳动力(X5)
已知中国粮食生产的相关数据,建立中国粮食生产函数:
Y=0+1 X1 +2 X2 +3 X3 +4 X4 +4 X5 +
1. 用OLS法估计上述模型:
R2接近于1; 给定=5%,得F临界值 (5,12)=
F= > ,故认上述粮食生产的总体线性关系显著成立。但X4 、X5 的参数未通过t检验,且符号不正确,故解释变量间可能存在多重共线性。
() () () () () ()
2. 检验简单相关系数
发现: X1与X4间存在高度相关性。
列出X1,X2,X3,X4,X5的相关系数矩阵:
3. 找出最简单的回归形式
可见,应选第一个式子为初始的回归模型。
分别作Y与X1,X2,X4,X5间的回归:
() ()
R2= F= DW=
() ()
R2= F= DW=
() ()
R2= F= DW=
() ()
R2= F= DW=
4. 逐步回归
将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。
回归方程以Y=f(X1,X2,X3)为最优:
5. 结论
1. 分部回归法(Partitioned Regression)
对于模型:
在满足解释变量与随机误差项不相关的情况下,可以写出关于参数估计量的方程组:
将解释变量分为两部分,对应的参数也分为两部分:
*七、分部回归与多重共线性
如果存在
则有
同样有
这就是仅以X2作为解释变量时的参数估计量。
这就是仅以X1作为解释变量时的参数估计量
2. 由分部回归法导出
如果一个多元线性模型的解释变量之间完全正交,可以将该多元模型分为多个一元模型、二元模型、…进行估计,参数估计结果不变;
实际模型由于存在或轻或重的共线性,如果将它们分为多个一元模型、二元模型、…进行估计,参数估计结果将发生变化;
当模型存在共线性,将某个共线性变量去掉,剩余变量的参数估计结果将发生变化,而且经济含义有发生变化;
严格地说,实际模型由于总存在一定程度的共线性,所以每个参数估计量并不 真正反映对应变量与被解释变量之间的结构关系。
§ 随机解释变量问题
一、随机解释变量问题
二、实际经济问题中的随机解释变量问题
三、随机解释变量的后果
四、工具变量法
五、案例
基本假设:解释变量X1,X2,…,Xk是确定性变量。
如果存在一个或多个随机变量作为解释变量,则称原模型出现随机解释变量问题。
假设X2为随机解释变量。对于随机解释变量问题,分三种不同情况:
一、随机解释变量问题
对于模型:
2. 随机解释变量与随机误差项同期无关(contemporaneously uncorrelated),但异期相关。
3. 随机解释变量与随机误差项同期相关(contemporaneously correlated)。
1. 随机解释变量与随机误差项独立(Independence)
二、实际经济问题中的随机解释变量问题
在实际经济问题中,经济变量往往都具有随机性。
但是在单方程计量经济学模型中,凡是外生变量都被认为是确定性的。
于是随机解释变量问题主要表现于:用滞后被解释变量作为模型的解释变量的情况。
例如:
(1)耐用品存量调整模型:
耐用品的存量Qt由前一个时期的存量Qt-1和当期收入It共同决定:
Qt=0+1It+2Qt-1+t t=1,T
这是一个滞后被解释变量作为解释变量的模型。
但是,如果模型不存在随机误差项的序列相关性,那么随机解释变量Qt-1只与t-1相关,与t不相关,属于上述的第2种情况。
(2)合理预期的消费函数模型
合理预期理论认为消费Ct是由对收入的预期Yte所决定的:
预期收入Yte与实际收入Y间存如下关系的假设:
容易推出:
Ct-1是一随机解释变量,且与 (t-t-1)高度相关(Why?)。属于上述第3种情况。
计量经济学模型一旦出现随机解释变量,且与随机扰动项相关的话,如果仍采用OLS法估计模型参数,不同性质的随机解释变量会产生不同的后果。
下面以一元线性回归模型为例进行说明
三、随机解释变量的后果
随机解释变量与随机误差项相关图
(a)正相关
(b)负相关
拟合的样本回归线可能低估截距项,而高估斜率项。
拟合的样本回归线高估截距项,而低估斜率项。
对一元线性回归模型:
OLS估计量为:
1. 如果X与相互独立,得到的参数估计量仍然是无偏、一致估计量。
已经得到证明
随机解释变量X与随机项的关系不同,参数OLS估计量的统计性质也会不同。
2. 如果X与同期不相关,异期相关,得到的参数估计量有偏、但却是一致的。
kt的分母中包含不同期的X;由异期相关性知:kt与t相关,因此,
3. 如果X与同期相关,得到的参数估计量有偏、且非一致。
但是
前面证明中已得到
注意:
如果模型中带有滞后被解释变量作为解释变量,则当该滞后被解释变量与随机误差项同期相关时,OLS估计量是有偏的、且是非一致的。
即使同期无关,其OLS估计量也是有偏的,因为此时肯定出现异期相关。
模型中出现随机解释变量且与随机误差项相关时,OLS估计量是有偏的。
如果随机解释变量与随机误差项异期相关,则可以通过增大样本容量的办法来得到一致的估计量;
但如果是同期相关,即使增大样本容量也无济于事。这时,最常用的估计方法是工具变量法(Instrument variables)。
四、工具变量法
1. 工具变量的选取
工具变量:在模型估计过程中被作为工具使用,以替代模型中与随机误差项相关的随机解释变量。选择为工具变量的变量必须满足以下条件:
(1)与所替代的随机解释变量高度相关;
(2)与随机误差项不相关;
(3)与模型中其它解释变量不相关,以避免出现多重共线性。
2. 工具变量的应用
以一元回归模型的离差形式为例说明如下:
用OLS估计模型,相当于用xi去乘模型两边、对i求和、再略去xii项后得到正规方程:
(*)
解得:
由于Cov(Xi,i)=E(Xii)=0,意味着大样本下:
(xii)/n0
表明大样本下:
成立,即OLS估计量具有一致性。
然而,如果Xi与i相关,即使在大样本下,也不存在 (xii)/n0 ,则
在大样本下也不成立,OLS估计量不具有一致性。
如果选择Z为X的工具变量,那么在上述估计过程可改为:
利用E(zii)=0,在大样本下可得到:
这种求模型参数估计量的方法称为工具变量法(instrumental variable method),相应的估计量称为工具变量法估计量(instrumental variable (IV) estimator)。
对于矩阵形式: Y=X+
采用工具变量法(假设X2与随机项相关,用工具变量Z替代)得到的正规方程组为:
参数估计量为:
其中:
称为工具变量矩阵
3. 工具变量法估计量是一致估计量
一元回归中,工具变量法估计量为:
两边取概率极限得:
1. 在小样本下,工具变量法估计量仍是有偏的。
如果工具变量Z选取恰当,即有
因此:
注意:
2. 工具变量并没有替代模型中的解释变量,只是在估计过程中作为“工具”被使用。
上述工具变量法估计过程可等价地分解成下面的两步OLS回归:
第一步,用OLS法进行X关于工具变量Z的回归:
容易验证仍有:
因此,工具变量法仍是Y对X的回归,而不是对Z的回归。
3. 如果模型中有两个以上的随机解释变量与随机误差项相关,就必须找到两个以上的工具变量。但是,一旦工具变量选定,它们在估计过程被使用的次序不影响估计结果(Why?)。
4. OLS可以看作工具变量法的一种特殊情况。
5. 如果1个随机解释变量可以找到多个互相独立的工具变量,人们希望充分利用这些工具变量的信息,就形成了广义矩方法(Generalized Method of Moments, GMM)
在GMM中,矩条件大于待估参数的数量,于是如何求解成为它的核心问题。
工具变量法是GMM的一个特例。
6. 要找到与随机扰动项不相关而又与随机解释变量相关的工具变量并不是一件很容易的事
可以用Xt-1作为原解释变量Xt的工具变量。
五、 案例——中国居民人均消费函数
例 在例的中国居民人均消费函数的估计中,采用OLS估计了下面的模型:
由于:居民人均消费支出(CONSP)与人均国内生产总值(GDPP)相互影响,因此,
容易判断GDPP与同期相关(往往是正相关),OLS估计量有偏并且是非一致的(低估截距项而高估计斜率项 )。
() ()
R2= F= DW= SSR=
OLS估计结果:
如果用GDPPt-1为工具变量,可得如下工具变量法估计结果:
() ()
R2 = F= DW= SSR=
GMM是近20年计量经济学理论方法发展的重要方向之一。
IV是GMM的一个特例。
如果1个随机解释变量可以找到多个互相独立的工具变量,人们希望充分利用这些工具变量的信息,就形成了广义矩方法(GMM)。在GMM中,矩条件大于待估参数的数量,于是如何求解成为它的核心问题。
第五章 经典单方程计量经济学模型:专门问题
虚拟变量
滞后变量
设定误差
建模理论
§ 虚拟变量模型
一、虚拟变量的基本含义
二、虚拟变量的引入
三、虚拟变量的设置原则
一、虚拟变量的基本含义
许多经济变量是可以定量度量的,如:商品需求量、价格、收入、产量等。
但也有一些影响经济变量的因素无法定量度量,如:职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等。
为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”。
这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量(dummy variables),记为D。
例如,反映文程度的虚拟变量可取为:
1, 本科学历
D=
0, 非本科学历
一般地,在虚拟变量的设置中:
基础类型、肯定类型取值为1;
比较类型,否定类型取值为0。
概念:
同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析(analysis-of variance: ANOVA)模型。
一个以性别为虚拟变量考察企业职工薪金的模型:
其中:Yi为企业职工的薪金,Xi为工龄,
Di=1,若是男性,Di=0,若是女性。
二、虚拟变量的引入
虚拟变量做为解释变量引入模型有两种基本方式:加法方式和乘法方式。
上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式。
在该模型中,如果仍假定E(i)=0,则
企业女职工的平均薪金为:
1. 加法方式
几何意义:
企业男职工的平均薪金为:
假定2>0,则两个函数有相同的斜率,但有不同的截距。意即,男女职工平均薪金对教龄的变化率是一样的,但两者的平均薪金水平相差2。
可以通过传统的回归检验,对2的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。
0
2
又例:在横截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。
教育水平考虑三个层次:高中以下,
高中,
大学及其以上。
这时需要引入两个虚拟变量:
在E(i)=0 的初始假定下,高中以下、高中、大学及其以上教育水平下个人保健支出的函数:
高中以下:
模型可设定如下:
高中:
大学及其以上:
假定3>2,其几何意义:
还可将多个虚拟变量引入模型中以考察多种“定性”因素的影响。
如在上述职工薪金的例中,再引入代表学历的虚拟变量D2:
本科及以上学历
本科以下学历
职工薪金的回归模型可设计为:
女职工本科以下学历的平均薪金:
女职工本科以上学历的平均薪金:
于是,不同性别、不同学历职工的平均薪金分别为:
男职工本科以下学历的平均薪金:
男职工本科以上学历的平均薪金:
2. 乘法方式
加法方式引入虚拟变量,考察:截距的不同。
许多情况下:往往是斜率就有变化,或斜率、截距同时发生变化。
斜率的变化可通过以乘法的方式引入虚拟变量来测度。
例:根据消费理论,消费水平C主要取决于收入水平Y,但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。
如,设
消费模型可建立如下:
这里,虚拟变量D以与X相乘的方式引入了模型中,从而可用来考察消费倾向的变化。
假定E(i)= 0,上述模型所表示的函数可化为:
正常年份:
反常年份:
当截距与斜率发生变化时,则需要同时引入加法与乘法形式的虚拟变量。
例,考察1990年前后的中国居民的总储蓄-收入关系是否已发生变化。
表中给出了中国1979~2001年以城乡储蓄存款余额代表的居民储蓄以及以GNP代表的居民收入的数据。
以Y为储蓄,X为收入,可令:
1990年前: Yi=1+2Xi+1i i=1,2…,n1
1990年后: Yi=1+2Xi+2i i=1,2…,n2
则有可能出现下述四种情况中的一种:
(1) 1=1 ,且2=2 ,即两个回归相同,称为重合回归(Coincident Regressions);
(2) 11 ,但2=2 ,即两个回归的差异仅在其截距,称为平行回归(Parallel Regressions);
(3) 1=1 ,但22 ,即两个回归的差异仅在其斜率,称为汇合回归(Concurrent Regressions);
(4) 11,且22 ,即两个回归完全不同,称为相异回归(Dissimilar Regressions)。
可以运用邹氏结构变化的检验。这一问题也可通过引入乘法形式的虚拟变量来解决。
将n1与n2次观察值合并,并用以估计以下回归:
Di为引入的虚拟变量:
在统计检验中,如果4=0的假设被拒绝,则说明两个时期中储蓄函数的斜率不同。
于是有:
可分别表示1990年后期与前期的储蓄函数。
具体的回归结果为:
() () () ()
由3与4的t检验可知:参数显著地不等于0,强烈示出两个时期的回归是相异的,储蓄函数分别为:
1990年前:
1990年后:
=
3. 临界指标的虚拟变量的引入
在经济发生转折时期,可通过建立临界指标的虚拟变量模型来反映。
例如,进口消费品数量Y主要取决于国民收入X的多少,中国在改革开放前后,Y对X的回归关系明显不同。
则进口消费品的回归模型可建立如下:
这时,可以t*=1979年为转折期,以1979年的国民收入Xt*为临界值,设如下虚拟变量:
OLS法得到该模型的回归方程为:
则两时期进口消费品函数分别为:
当t<t*=1979年,
当tt*=1979年,
三、虚拟变量的设置原则
虚拟变量的个数须按以下原则确定:
每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1,即如果有m个定性变量,只在模型中引入m-1个虚拟变量。
例。已知冷饮的销售量Y除受k种定量变量Xk的影响外,还受春、夏、秋、冬四季变化的影响,要考察该四季的影响,只需引入三个虚拟变量即可:
则冷饮销售量的模型为:
在上述模型中,若再引入第四个虚拟变量:
如果只取六个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则式中的:
则冷饮销售模型变量为:
其矩阵形式为:
显然,(X,D)中的第1列可表示成后4列的线性组合,从而(X,D)不满秩,参数无法唯一求出。
这就是所谓的“虚拟变量陷阱”,应避免。
§ 滞后变量模型
一、滞后变量模型
二、分布滞后模型的参数估计
三、自回归模型的参数估计
四、格兰杰因果关系检验
在经济运行过程中,广泛存在时间滞后效应。某些经济变量不仅受到同期各种因素的影响,而且也受到过去某些时期的各种因素甚至自身的过去值的影响。
一、滞后变量模型
通常把这种过去时期的,具有滞后作用的变量叫做滞后变量(Lagged Variable),含有滞后变量的模型称为滞后变量模型。
滞后变量模型考虑了时间因素的作用,使静态分析的问题有可能成为动态分析。含有滞后解释变量的模型,又称动态模型(Dynamical Model)。
1. 滞后效应与与产生滞后效应的原因
因变量受到自身或另一解释变量的前几期值影响的现象称为滞后效应。
表示前几期值的变量称为滞后变量。
如:消费函数
通常认为,本期的消费除了受本期的收入影响之外,还受前1期,或前2期收入的影响:
Ct=0+1Yt+2Yt-1+3Yt-2+t
Yt-1,Yt-2为滞后变量。
产生滞后效应的原因
1. 心理因素:人们的心理定势,行为方式滞后于经济形势的变化,如中彩票的人不可能很快改变其生活方式。
2. 技术原因:如当年的产出在某种程度上依赖于过去若干期内投资形成的固定资产。
3. 制度原因:如定期存款到期才能提取,造成了它对社会购买力的影响具有滞后性。
2. 滞后变量模型
以滞后变量作为解释变量,就得到滞后变量模型。它的一般形式为:
q,s:滞后时间间隔
自回归分布滞后模型(autoregressive distributed lag model, ADL):既含有Y对自身滞后变量的回归,还包括着X分布在不同时期的滞后变量。
有限自回归分布滞后模型:滞后期长度有限
无限自回归分布滞后模型:滞后期无限
(1)分布滞后模型(distributed-lag model)
分布滞后模型:模型中没有滞后被解释变量,仅有解释变量X的当期值及其若干期的滞后值:
0:短期(short-run)或即期乘数(impact multiplier),表示本期X变化一单位对Y平均值的影响程度。
i (i=1,2…,s):动态乘数或延迟系数,表示各滞后期X的变动对Y平均值影响的大小。
如果各期的X值保持不变,则X与Y间的长期或均衡关系即为:
称为长期(long-run)或均衡乘数(total distributed-lag multiplier),表示X变动一个单位,由于滞后效应而形成的对Y平均值总影响的大小。
2. 自回归模型(autoregressive model)
而,
称为一阶自回归模型(first-order autoregressive model)。
自回归模型:模型中的解释变量仅包含X的当期值与被解释变量Y的一个或多个滞后值
二、分布滞后模型的参数估计
无限期的分布滞后模型,由于样本观测值的有限性,使得无法直接对其进行估计。
有限期的分布滞后模型,OLS会遇到如下问题:
1. 没有先验准则确定滞后期长度;
1. 分布滞后模型估计的困难
2. 分布滞后模型的修正估计方法
2. 如果滞后期较长,将缺乏足够的自由度进行估计和检验;
3. 同名变量滞后值之间可能存在高度线性相关,即模型存在高度的多重共线性。
人们提出了一系列的修正估计方法,但并不很完善。
各种方法的基本思想大致相同:都是通过对各滞后变量加权,组成线性合成变量而有目的地减少滞后变量的数目,以缓解多重共线性,保证自由度。
(1)经验加权法
根据实际问题的特点、实际经验给各滞后变量指定权数,滞后变量按权数线性组合,构成新的变量。权数据的类型有:
递减型:
即认为权数是递减的,X的近期值对Y的影响较远期值大。
如消费函数中,收入的近期值对消费的影响作用显然大于远期值的影响。
例如:滞后期为 3的一组权数可取值如下:
1/2, 1/4, 1/6, 1/8
即认为权数是相等的,X的逐期滞后值对值Y的影响相同。
如滞后期为3,指定相等权数为1/4,则新的线性组合变量为:
矩型:
则新的线性组合变量为:
权数先递增后递减呈倒“V”型。
例如:在一个较长建设周期的投资中,历年投资X为产出Y的影响,往往在周期期中投资对本期产出贡献最大。
如滞后期为4,权数可取为
1/6, 1/4, 1/2, 1/3, 1/5
则新变量为
倒V型
例 对一个分布滞后模型:
给定递减权数:1/2, 1/4, 1/6, 1/8
令
原模型变为:
该模型可用OLS法估计。假如参数估计结果为:
=
=
则原模型的估计结果为:
经验权数法的优点是:简单易行;缺点是:设置权数的随意性较大
通常的做法是:
多选几组权数,分别估计出几个模型,然后根据常用的统计检验(R方检验,F检验,t检验,D-W检验),从中选择最佳估计式。
(2)阿尔蒙(Almon)多项式法
主要思想:针对有限滞后期模型,通过阿尔蒙变换,定义新变量,以减少解释变量个数,然后用OLS法估计参数。
主要步骤为:
第一步,阿尔蒙变换
对于分布滞后模型:
假定其回归系数i可用一个关于滞后期i的适当阶数的多项式来表示,即:
i=0,1,…,s
其中,m<s-1。阿尔蒙变换要求先验地确定适当阶数k,例如取k=2,得:
(*)
将(*)代入分布滞后模型:
得:
定义新变量
将原模型转换为:
第二步,模型的OLS估计
对变换后的模型进行OLS估计,得:
再计算出:
求出滞后分布模型参数的估计值:
由于m+1<s,可以认为原模型存在的自由度不足和多重共线性问题已得到改善。
需注意的是,在实际估计中,阿尔蒙多项式的阶数m一般取2或3,不超过4,否则达不到减少变量个数的目的。
例 表给出了中国电力基本建设投资X与发电量Y的相关资料,拟建立一多项式分布滞后模型来考察两者的关系。
由于无法预见知电力行业基本建设投资对发电量影响的时滞期,需取不同的滞后期试算。
()() () ()
经过试算发现,在2阶阿尔蒙多项式变换下,滞后期数取到第6期,估计结果的经济意义比较合理。2阶阿尔蒙多项式估计结果如下:
求得的分布滞后模型参数估计值为:
最后得到分布滞后模型估计式为:
为了比较,下面给出直接对滞后6期的模型进行OLS估计的结果:
(3)科伊克(Koyck)方法
科伊克方法是将无限分布滞后模型转换为自回归模型,然后进行估计。
对于无限分布滞后模型:
科伊克变换假设i随滞后期i按几何级数衰减:
其中,0<<1,称为分布滞后衰减率,1-称为调整速率(Speed of adjustment)。
科伊克变换的具体做法:
将科伊克假定i=0i代入无限分布滞后模型,得:
滞后一期并乘以 ,得 :
(*)
(**)
将(*)减去(**)得科伊克变换模型:
整理得科伊克模型的一般形式:
科伊克模型的特点:
(1)以一个滞后因变量Yt-1代替了大量的滞后解释变量Xt-i,最大限度地节省了自由度,解决了滞后期长度s难以确定的问题;
(2)由于滞后一期的因变量Yt-1与Xt的线性相关程度可以肯定小于X的各期滞后值之间的相关程度,从而缓解了多重共线性。
但科伊克变换也同时产生了两个新问题:
(1)模型存在随机项和vt的一阶自相关性;
(2)滞后被解释变量Yt-1与随机项vt不独立。
这些新问题需要进一步解决。
三、自回归模型的参数估计
一个无限期分布滞后模型可以通过科伊克变换转化为自回归模型。
事实上,许多滞后变量模型都可以转化为自回归模型,自回归模型是经济生活中更常见的模型。
以适应预期模型以及局部调整模型为例进行说明。
1. 自回归模型的构造
(1)自适应预期(Adaptive expectation)模型
在某些实际问题中,因变量Yt并不取决于解释变量的当前实际值Xt,而取决于Xt的“预期水平”或“长期均衡水平”Xte。
例如,家庭本期消费水平,取决于本期收入的预期值;
市场上某种商品供求量,决定于本期该商品价格的均衡值。
因此,自适应预期模型最初表现形式是:
由于预期变量是不可实际观测的,往往作如下自适应预期假定:
其中:r为预期系数(coefficient of expectation), 0r 1。
该式的经济含义为:“经济行为者将根据过去的经验修改他们的预期”,即本期预期值的形成是一个逐步调整过程,本期预期值的增量是本期实际值与前一期预期值之差的一部分,其比例为r 。
这个假定还可写成:
将
得:
代入
将(*)式滞后一期并乘以(1-r),得:
(**)
以(*)减去(**),整理得:
其中
可见自适应预期模型转化为自回归模型。
(*)
(2)局部调整(Partial Adjustment)模型
局部调整模型主要是用来研究物资储备问题的。
例如,企业为了保证生产和销售,必须保持一定的原材料储备。对应于一定的产量或销售量Xt,存在着预期的最佳库存Yte。
局部调整模型的最初形式为:
Yte不可观测。由于生产条件的波动,生产管理方面的原因,库存储备Yt的实际变化量只是预期变化的一部分。
或:
(*)
储备按预定水平逐步进行调整,故有如下局部调整假设:
其中,为调整系数,0 1
将(*)式代入
可见,局部调整模型转化为自回归模型
2. 自回归模型的参数估计
考伊克模型:
对于自回归模型:
估计时的主要问题:滞后被解释变量的存在可能导致它与随机扰动项相关,以及随机扰动项出现序列相关性。
自适应预期模型:
局部调整模型:
存在:滞后被解释变量Yt-1与随机扰动项t的异期相关性。
因此,对自回归模型的估计主要需视滞后被解释变量与随机扰动项的不同关系进行估计。
以一阶自回归模型为例说明:
显然存在:
(1) 工具变量法
若Yt-1与t同期相关,则OLS估计是有偏的,并且不是一致估计。
因此,对上述模型,通常采用工具变量法,即寻找一个新的经济变量Zt,用来代替Yt-1。
参数估计量具有一致性。
对于一阶自回归模型:
在实际估计中,一般用X的若干滞后的线性组合作为Yt-1的工具变量:
由于原模型已假设随机扰动项t与解释变量X及其滞后项不存在相关性,因此上述工具变量与t不再线性相关。
一个更简单的情形是直接用Xt-1作为Yt-1的工具变量。
(2)普通最小二乘法
若滞后被解释变量Yt-1与随机扰动项t同期无关(如局部调整模型),可直接使用OLS法进行估计,得到一致估计量。
上述工具变量法只解决了解释变量与t相关对参数估计所造成的影响,但没有解决t的自相关问题。
注意:
例 建立中国长期货币流通量需求模型
事实上,对于自回归模型, t项的自相关问题始终存在,对于此问题,至今没有完全有效的解决方法。唯一可做的,就是尽可能地建立“正确”的模型,以使序列相关性的程度减轻。
经验表明:中国改革开放以来,对货币需求量(Y)的影响因素,主要有资金运用中的贷款额(X)以及反映价格变化的居民消费者价格指数(P)。
长期货币流通量模型可设定为:
由于长期货币流通需求量不可观测,作局部调整:
(*)
(**)
将(*)式代入(**)得短期货币流通量需求模型:
对局部调整模型:
运用OLS法估计结果如下:
()() () ()
注意:
尽管.=,但不能据此判断自回归模型不存在自相关(Why?)。
但LM=,=5%下,临界值2(1)=,
判断:模型已不存在一阶自相关。
最后得到长期货币流通需求模型的估计式:
如果直接对下式作OLS回归
() () ()
得,
可见该模型随机扰动项具有序列相关性,
四、格兰杰因果关系检验
自回归分布滞后模型旨在揭示:某变量的变化受其自身及其他变量过去行为的影响。
然而,许多经济变量有着相互的影响关系
GDP
消费
问题:当两个变量在时间上有先导——滞后关系时,能否从统计上考察这种关系是单向的还是双向的?
即:主要是一个变量过去的行为在影响另一个变量的当前行为呢?还是双方的过去行为在相互影响着对方的当前行为?
格兰杰因果关系检验(Granger test of causality)
对两变量Y与X,格兰杰因果关系检验要求估计:
(*)
(**)
可能存在有四种检验结果:
(1)X对Y有单向影响,表现为(*)式X各滞后项前的参数整体为零,而Y各滞后项前的参数整体不为零;
(2)Y对X有单向影响,表现为(**)式Y各滞后项前的参数整体为零,而X各滞后项前的参数整体不为零;
(3)Y与X间存在双向影响,表现为Y与X各滞后项前的参数整体不为零;
(4)Y与X间不存在影响,表现为Y与X各滞后项前的参数整体为零。
格兰杰检验是通过受约束的F检验完成的。如:
针对
中X滞后项前的参数整体为零的假设(X不是Y的格兰杰原因)。
分别做包含与不包含X滞后项的回归,记前者与后者的残差平方和分别为RSSU、RSSR;再计算F统计量:
k为无约束回归模型的待估参数的个数。
如果: F>F(m,n-k) ,则拒绝原假设,认为X是Y的格兰杰原因。
注意:
格兰杰因果关系检验对于滞后期长度的选择有时很敏感。不同的滞后期可能会得到完全不同的检验结果。
因此,一般而言,常进行不同滞后期长度的检验,以检验模型中随机误差项不存在序列相关的滞后期长度来选取滞后期。
例 检验1978~2000年间中国当年价GDP与居民消费CONS的因果关系。
取两阶滞后,Eviews给出的估计结果为:
判断:=5%,临界值(2,17)=
拒绝“GDP不是CONS的格兰杰原因”的假设,不拒绝“CONS不是GDP的格兰杰原因”的假设。
因此,从2阶滞后的情况看,GDP的增长是居民消费增长的原因,而不是相反。
但在2阶滞后时,检验的模型存在1阶自相关性。
随着滞后阶数的增加,拒绝“GDP是居民消费CONS的原因”的概率变大,而拒绝“居民消费CONS是GDP的原因”的概率变小。
如果同时考虑检验模型的序列相关性以及赤池信息准则,发现:滞后4阶或5阶的检验模型不具有1阶自相关性,而且也拥有较小的AIC值,这时判断结果是:GDP与CONS有双向的格兰杰因果关系,即相互影响。
分析:
§ 模型设定偏误问题
一、模型设定偏误的类型
二、模型设定偏误的后果
三、模型设定偏误的检验
一、模型设定偏误的类型
模型设定偏误主要有两大类:
(1)关于解释变量选取的偏误,主要包括漏选相关变量和多选无关变量,
(2)关于模型函数形式选取的偏误。
1. 相关变量的遗漏(omitting relevant variables)
例如,如果“正确”的模型为:
而我们将模型设定为:
即设定模型时漏掉了一个相关的解释变量。
这类错误称为遗漏相关变量。
2. 无关变量的误选 (including irrevelant variables)
例如,如果
Y=0+1X1+2X2+
仍为“真”,但我们将模型设定为:
Y=0+ 1X1+ 2X2+ 3X3 +
即设定模型时,多选了一个无关解释变量。
3. 错误的函数形式 (wrong functional form)
例如,如果“真实”的回归函数为:
但却将模型设定为:
二、模型设定偏误的后果
当模型设定出现偏误时,模型估计结果也会与“实际”有偏差。这种偏差的性质及程度与模型设定偏误的类型密切相关。
1. 遗漏相关变量偏误
采用遗漏相关变量的模型进行估计而带来的偏误称为遗漏相关变量偏误(omitting relevant variable bias)。
设正确的模型为:
Y=0+1X1+2X2+
却对
Y=0+ 1X1+v
进行回归,得:
将正确模型 Y=0+1X1+2X2+ 的离差形式:
代入
得:
(1)如果漏掉的X2与X1相关,则上式中的第二项在小样本下求期望与大样本下求概率极限都不会为零,从而使得OLS估计量在小样本下有偏,在大样本下非一致。
(2)如果X2与X1不相关,则1的估计满足无偏性与一致性;但这时0的估计却是有偏的。
由 Y=0+ 1X1+v 得:
由 Y=0+1X1+2X2+ 得:
如果X2与X1相关,显然有
如果X2与X1不相关,也有
Why?
2. 包含无关变量偏误
采用包含无关解释变量的模型进行估计带来的偏误,称为包含无关变量偏误(including irrelevant variable bias)。
设 Y=0+ 1X1+v (*)
为正确模型,但却估计了
Y=0+1X1+2X2+ (**)
如果2=0,则(**)与(*)相同,因此,可将(**)式视为以2=0为约束的(*)式的特殊形式。
由于所有的经典假设都满足,因此对
Y=0+1X1+2X2+ (**)
式进行OLS估计,可得到无偏且一致的估计量。
但是,OLS估计量却不具有最小方差性。
Y=0+ 1X1+v 中X1的方差:
Y=0+1X1+2X2+ 中X1的方差:
当X1与X2完全线性无关时:
否则:
注意:
3. 错误函数形式的偏误
当选取了错误函数形式并对其进行估计时,带来的偏误称错误函数形式偏误(wrong functional form bias)。容易判断,这种偏误是全方位的。
例如,如果“真实”的回归函数为:
却估计线性式
显然,两者的参数具有完全不同的经济含义,且估计结果一般也是不相同的。
三、模型设定偏误的检验
1. 检验是否含有无关变量
可用t 检验与F检验完成。
检验的基本思想:如果模型中误选了无关变量,则其系数的真值应为零。因此,只须对无关变量系数的显著性进行检验。
t检验:检验某1个变量是否应包括在模型中;
2. 检验是否有相关变量的遗漏或函数形式设定偏误
(1)残差图示法
F检验:检验若干个变量是否应同时包括在模型中。
残差序列变化图
(a)趋势变化 :模型设定时可能遗漏了一随着时间的推移而持续上升的变量
(b)循环变化:模型设定时可能遗漏了一随着时间的推移而呈现循环变化的变量
模型函数形式设定偏误时残差序列呈现正负交替变化
图示:一元回归模型中,真实模型呈幂函数形式,但却选取了线性函数进行回归。
(2)一般性设定偏误检验
但更准确更常用的判定方法是拉姆齐(Ramsey)于1969年提出的所谓RESET 检验(regression error specification test)。
基本思想:
如果事先知道遗漏了哪个变量,只需将此变量引入模型,估计并检验其参数是否显著不为零即可;
问题是不知道遗漏了哪个变量,需寻找一个替代变量Z,来进行上述检验。
RESET检验中,采用所设定模型中被解释变量Y的估计值Ŷ的若干次幂来充当该“替代”变量。
例如,先估计 Y=0+ 1X1+v 得:
再根据第三章第五节介绍的增加解释变量的F检验来判断是否增加这些“替代”变量。
若仅增加一个“替代”变量,也可通过t检验来判断。
例如,在一元回归中,假设真实的函数形式是非线性的,用泰勒定理将其近似地表示为多项式:
RESET检验也可用来检验函数形式设定偏误的问题。
因此,如果设定了线性模型,就意味着遗漏了相关变量X12、 X13 ,等等。
(*)
因此,在一元回归中,可通过检验(*)式中的各高次幂参数的显著性来判断是否将非线性模型误设成了线性模型。
对多元回归,非线性函数可能是关于若干个或全部解释变量的非线性,这时可按遗漏变量的程序进行检验。
例如,估计 Y=0+1X1+2X2+
但却怀疑真实的函数形式是非线性的。
这时,只需以估计出的Ŷ的若干次幂为“替代”变量,进行类似于如下模型的估计:
再判断各“替代”变量的参数是否显著地不为零即可。
例:在§商品进口的例中,估计了中国商品进口M与GDP的关系,并发现具有强烈的一阶自相关性。
然而,由于仅用GDP来解释商品进口的变化,明显地遗漏了诸如商品进口价格、汇率等其他影响因素。因此,序列相关性的主要原因可能就是建模时遗漏了重要的相关变量造成的。
下面进行RESET检验。
用原回归模型估计出商品进口序列:
R2=
() () () ()
R2=
在=5%下,查得临界值(2, 20)=
判断:拒绝原模型与引入新变量的模型可决系数无显著差异的假设,表明原模型确实存在遗漏相关变量的设定偏误。
*(3)同期相关性的豪斯蔓(Hausman)检验
由于在遗漏相关变量的情况下,往往导致解释变量与随机扰动项出现同期相关性,从而使得OLS估计量有偏且非一致。
因此,对模型遗漏相关变量的检验可以用模型是否出现解释变量与随机扰动项同期相关性的检验来替代。这就是豪斯蔓检验(1978)的主要思想。
当解释变量与随机扰动项同期相关时,通过工具变量法可得到参数的一致估计量。
而当解释变量与随机扰动项同期无关时, OLS估计量就可得到参数的一致估计量。
因此,只须检验IV估计量与OLS估计量是否有显著差异来检验解释变量与随机扰动项是否同期无关。
对一元线性回归模型
Y=0+1X+
所检验的假设是 H0:X与无同期相关。
设一元样本回归模型为:
以Z为工具变量,则IV估计量为:
(*)
(*)式表明,IV估计量与OLS估计量无差异当且仅当ziei=0,即工具变量与OLS估计的残差项无关。
检验时,求Y关于X与Z的OLS回归式:
在实际检验中,豪斯蔓检验主要针对多元回归进行,而且也不是直接对工具变量回归,而是对以各工具变量为自变量、分别以各解释变量为因变量进行回归。
如对二元回归模型:
(*)
通过增加解释变量的F检验,检验联合假设: H0:1=2=0 。
拒绝原假设,就意味着(*)式中的解释变量与随机扰动项相关。
(4)线性模型与双对数线性模型的选择
无法通过判定系数的大小来辅助决策,因为在两类模型中被解释变量是不同的。
为了在两类模型中比较,可用Box-Cox变换:
第一步,计算Y的样本几何均值。
第二步,用得到的样本几何均值去除原被解释变量Y,得到被解释变量的新序列Y*。
第三步,用Y*替代Y,分别估计双对数线性模型与线性模型。并通过比较它们的残差平方和是否有显著差异来进行判断。
Zarembka(1968)提出的检验统计量为:
其中,RSS1与RSS2分别为对应的较大的残差平方和与较小的残差平方和,n为样本容量。
可以证明:该统计量在两个回归的残差平方和无差异的假设下服从自由度为1 的2分布。
因此,拒绝原假设时,就应选择RSS2的模型。
例 在§中国商品进口的例中,
采用线性模型: R2=;
采用双对数线性模型: R2=,
但不能就此简单地判断双对数线性模型优于线性模型。下面进行Box-Cox变换。
计算原商品进口样本的几何平均值为:
计算出新的商品进口序列:
以Mt*替代Mt,分别进行双对数线性模型与线性模型的回归,得:
RSS1=
RSS2=
于是,
在=5%下,查得临界值(1)=
判断:拒绝原假设,表明双对数线性模型确实“优于”线性模型。
§从传统建模理论到约化建模理论
一、传统建模理论与数据开采问题
二、“从一般到简单”——约化建模型理论
三、非嵌套假设检验
四、约化模型的准则
一、传统建模理论与数据开采问题
传统计量经济学的主导建模理论是“结构模型方法论”
以先验给定的经济理论为建立模型的出发点,
以模型参数的估计为重心,
以参数估计值与其理论预期值相一致为判断标准,
是一个“从简单到复杂”的建模过程(simple-to-general approach):对不同变量及其数据的偿试与筛选过程。
传统建模方法主要的缺陷:建模过程的所谓“数据开采”(Data minimg)问题。
数据开采:对不同变量及其数据的偿试与筛选。
这一过程对最终选择的变量的t检验产生较大影响
当在众多备选变量中选择变量进入模型时,其中t检验的真实的显著性水平已不再是事先给出的名义显著性水平。
显著性水平意味着将一个无关变量作为相关变量选入模型而犯错误的概率。
罗维尔(Lovell)给出了一个从c个备选变量中选取k个变量进入模型时,真实显著性水平*与名义显著性水平的关系:
*=1-(1- )c/k
例如: 给定=5%,如果有2个相互独立且与被解释变量无关的备选变量,误选一个进入模型的概率就成了 1-()2=
传统建模方法的另一问题是它的“随意性”。
其结果是:对同一研究对象,使用同一数据,但不同的建模者往往得出不同的最终模型。
二、“从一般到简单”——约化建模型理论
该理论认为:在模型的最初设定上,就设立一个“一般”的模型,它包括了所有先验经济理论与假设中所应包括的全部变量,各种可能的“简单”模型都被“嵌套”(nested)在这个“一般”的模型之中。然后在模型的估计过程中逐渐剔除不显著的变量,最后得到一个较“简单”的最终模型。
这就是所谓的“从一般到简单”(general-to-specific)的建模理论。
(1)约化建模理论提出了一个对不同先验假设的更为系统的检验程序;
(2)初始模型就是一个包括所有可能变量的“一般”模型,也就避免了过度的“数据开采”问题;
(3)由于初始模型的“一般”性,所有研究者的“起点”都有是相同的,因此,在相同的约化程序下,最后得到的最终模型也应该是相同的。
特点:
例题:
例曾建立了一个中国城镇居民食品消费模型:
Q=f(X,P1,P0)
然而,有理由认为X、P1、P0的变化可能会经过一段时期才会对Q起作用,因为消费者固有的消费习惯是不易改变的。于是,可建立如下更“一般”的模型:
在估计该模型之前,并不知道食品消费需求是怎样决定的,但可以考察几种可能的情况:
例如认为,对食品的消费需求是一个“静态”行为,只有当期的因素发生作用:
(*)
也可以认为,由于食品是必需品,P1的变化并不对Q产生影响,但仍受P0与X变动的影响,然而后者的影响却有着一期的滞后:
可以看出,(*)、(**)都是原一般模型的特例,即都可通过对原一般模型施加约束得到。
(**)
如果一个模型可通过对“一般”模型施加约束得到,则称该模型“嵌套”在一般模型之中。
约束:1=1=2=0
约束:1=2=2= 2=0
约束:1+1+1=0
一个“一般模型”具有如下两个重要特性:
第一,与所考察问题相关的不同的先验理论与假设都“嵌套”在该一般模型中;
第二,能较好地拟合数据,并能满足模型设定偏误的各种检验。
该两条性质是相互关联的。例如,如果某一重要理论被忽略,则相关的变量也就被排除在该“一般”模型之外,从而使得该模型不能通过模型设定偏误的多种检验。
一个“一般”的模型是能够进行诸如遗漏相关变量、多选无关变量以及误设函数形式的多种设定偏误检验的。
从一般到简单的约化建模过程
一旦建立了一个“一般”模型,就可对其进行约化(simplification research),寻找可能的简单模型。
这往往是通过检验“嵌套”于其中的各种简单模型进行的。主要包括(1)各种“约束”检验与(2)设定偏误检验,等。
一般模型的约化过程,是一个自上而下(top-down)逐级化简的建模过程。只有当观测数据不支持约束条件时,才退回到上一级,检验其他可能的约束,或者得到最终模型。
“从一般到简单”的建模程序面临的主要问题在于无法在两个没有嵌套关系的模型间进行选择。
这时,可能通过通常的拟合优度检验、池赤信息准则来帮助决策,更主要的检验是非嵌套假设检验。
三、非嵌套假设检验
假设要检验下面两个非嵌套模型:
H0: Y=0+ 1X+ 2Z+
H1: Y=0+ 1X+2W+
该两模型之间没有嵌套关系,无法进行约束检验。
同时,H0与H1不是对立假设,拒绝假设H0未必意味着接受假设H1。因此,通常的假设检验程序无法直接使用。
于是,可针对一般模型(*)分别检验H0与H1 。
(*)
为此,一种称为包容性F检验(encompassing F tests)被提了出来。这种检验是人为地构造一个“一般”模型:
包容性F检验主要存在以下问题:
(1)人为构造的一般模型没有实际的经济意义,尤其在H0与H1分别反映两种对立的经济理论的情况下更是如此;
(2)有可能出现同时接受或拒绝H0与H1的现象;
(3)当Z与W高度相关时,往往导致既不能拒绝H0 ,也不能拒绝H1 ,因为在一般模型中去掉任何一个变量,都不会使拟合优度下降很多。
另一个解决办法是建立如下的一般模型:
如果=0,则为模型H0,
如果=1,则为模型H1。
因此,可通过检验施加的约束=0是否为真来判断H0是否为正选模型。
问题:由该模型无法直接估计出的值。戴维森(Davidson)和麦金农(Mackinnon)建议通过下面步骤估计:
第一步,对模型H1进行OLS估计,得到Ŷ:
第二步,用估计的代替“一般模型”中的
0+ 1X+2W,并进行OLS估计:
戴维森和麦金农证明:在大样本下,H0为真时,的OLS估计量的t统计量服从标准正态分布:
t~N(0,1)。
因此,如果的t统计量的绝对值大于给定显著性水平下的临界值,就拒绝模型H0。
如果要检验模型H1是否为真,仍可通过上面两个步骤进行,但需先对H0进行OLS估计,得到Ŷ,以它为另一解释变量估计如下模型:
如果显著地异于0,则拒绝模型H1为真的假设。
该非嵌套假设检验也被称为J检验 (J test),因为需将两非嵌套模型联合起来进行参数的联合估计(joint estimation)。
注意:(1)拒绝H0(或H1)不意味着接受H1(或H0);(2)J检验仍然存在同时接受或拒绝H0与H1的现象。
四、约化模型的准则
从一般到简单的建模过程,同样存在着数据开采问题。
一个“一般”模型经过k步约化后得到最终的简化模型,可以证明,每一步中的名义显著性水平与最终模型中各种检验的实际显著性水平*间有如下关系:
*=1-(1- )k
然而,与“从简单到复杂”这一传统建模方法相比,“从一般到简单”的建模过程能够展现模型建立的全过程;
同时建模过程的程式化(systematic manner)也避免了过度的“数据开采”问题。
由于一定程度的数据开采不可避免, “从一般到简单”建模理论倡导更加关注模型的样本外预测(out-of-sample forecast)。
“从一般到简单”的建模方法,初始模型就可能包括了所有的相关变量,没有必要再进行遗漏相关变量的设定偏误检验。
“从一般到简单”的建模过程本身就是一项 十分艰巨复杂的工作。各约化步骤往往是需要反复进行的,约化步骤的顺序也需要灵活按排。
从实践上看,由于各种因素的影响,所建立的最终的简化模型不一定就是最“理想”的模型。
亨德瑞给出了一个约化模型的基本准则:
第一,模型必须具有数据一致(data-coherent)性,即模型能够正确地解释已有的数据。约化过程中需不断进行设定偏误检验。
第二,模型必须与经济理论相一致(consistent with economic theory)。
第三,解释变量必须是弱外生的(exogenous),即解释变量应与随机扰动项不同期相关。
第四,模型具有恒定的参数(constant parameters)。
第五,模型具有包容性,即模型应包容相竞争的对手模型。
第六,模型具有简洁性(parsimonious),即在具有相同解释能力的情况下,一个拥有较少解释变量的模型优于拥有较多解释变量的模型。
例 在§的例中,曾以传统的建模方法建立了1981—1994年间的中国城镇居民食品消费需求模型。
用小写字母代表变量的自然对数,则该一般模型的估计结果为:
这里再以“从一般到简单”这一建模理论来做进一步的考察。
初始的一般模型设定为:
() () () ()
() () () ()
给定5%的显著性水平,可以判断,尽管若干个变量的t检验不显著,但总体上看,不存在模型的相关变量遗漏与函数形式的设定偏误问题,而且参数也具有稳定性。因此,以它作为初始的一般模型是合适的。
进一步考察模型的约化问题:
首先,检验模型
() () () ()
该模型是由“一般模型”去掉滞后变量得到,相当于对滞后变量施加了零约束,由受约束的F检验得检验值F=,相伴概率p=,可见:在5%的显著性水平下,可接受该约束。
但是,存在着结构变化,而且RSS有明显增大。
如果忽略存在结构变化这一特征,则上面模型能够作为一个可接受的模型,并可进一步检验:
()() ()
取=5%,RESET检验表明可能存在遗漏相关变量的设定偏误,这时RSS的值也有所增大,而且CHOW检验也表明存在明显的结构变化。
第六章 联立方程计量经济模型理论方法
Theory and Methodology of Simultaneous-Equations Econometrics Model
§ 联立方程计量经济学模型的提出
§ 联立方程计量经济学模型的基本概念
§ 联立方程计量经济学模型的识别
§ 联立方程计量经济学模型的估计
§ 联立方程计量经济学模型的讨论
§ 问题的提出
一、经济研究中的联立方程计量经济学问题
二、计量经济学方法中的联立方程问题
一、经济研究中的联立方程计量经济学问题
⒈ 研究对象
经济系统,而不是单个经济活动;
“系统”的相对性
相互依存、互为因果,而不是单向因果关系;
必须用一组方程才能描述清楚.
⒉一个简单的宏观经济系统
由国内生产总值Y、居民消费总额C、投资总额I和政府消费额G等变量构成简单的宏观经济系统。
将政府消费额G由系统外部给定,其他内生。
在消费方程和投资方程中,国内生产总值决定居民消费总额和投资总额;
在国内生产总值方程中,它又由居民消费总额和投资总额所决定。
二、计量经济学方法中的联立方程问题
⒈随机解释变量问题
解释变量中出现随机变量,而且与误差项相关。
为什么?
⒉损失变量信息问题
如果用单方程模型的方法估计某一个方程,将损失变量信息。
为什么?
⒊损失方程之间的相关性信息问题
联立方程模型系统中每个随机方程之间往往存在某种相关性。
表现于不同方程随机误差项之间。
如果用单方程模型的方法估计某一个方程,将损失不同方程之间相关性信息。
⒋结论
必须发展新的估计方法估计联立方程计量经济学模型,以尽可能避免出现这些问题。
这就从计量经济学理论方法上提出了联立方程问题。
§联立方程计量经济学模型的若干基本概念
一、变量
二、结构式模型
三、简化式模型
四、参数关系体系
一、变量
⒈内生变量 (Endogenous Variables)
对联立方程模型系统而言,已经不能用被解释变量与解释变量来划分变量,而将变量分为内生变量和外生变量两大类。
内生变量是具有某种概率分布的随机变量,它的参数是联立方程系统估计的元素。
内生变量是由模型系统决定的,同时也对模型系统产生影响。
内生变量一般都是经济变量。
一般情况下,内生变量与随机项相关,即
在联立方程模型中,内生变量既作为被解释变量,又可以在不同的方程中作为解释变量。
⒉外生变量 (Exogenous Variables)
外生变量一般是确定性变量,或者是具有临界概率分布的随机变量,其参数不是模型系统研究的元素。
外生变量影响系统,但本身不受系统的影响。
外生变量一般是经济变量、条件变量、政策变量、虚变量。
一般情况下,外生变量与随机项不相关。
⒊ 先决变量(Predetermined Variables)
外生变量与滞后内生变量(Lagged Endogenous Variables)统称为先决变量。
滞后内生变量是联立方程计量经济学模型中重要的不可缺少的一部分变量,用以反映经济系统的动态性与连续性。
先决变量只能作为解释变量。
二、结构式模型
Structural Model
⒈定义
根据经济理论和行为规律建立的描述经济变量之间直接结构关系的计量经济学方程系统称为结构式模型。
结构式模型中的每一个方程都是结构方程( Structural Equations )。
各个结构方程的参数被称为结构参数( Structural Parameters or Coefficients ) 。
⒉结构方程的方程类型
将一个内生变量表示为其它内生变量、先决变量和随机误差项的函数形式,被称为结构方程的正规形式。
⒊完备的结构式模型
具有g个内生变量、k个先决变量、g个结构方程的模型被称为完备的结构式模型。
在完备的结构式模型中,独立的结构方程的数目等于内生变量的数目,每个内生变量都分别由一个方程来描述。
⒋完备的结构式模型的矩阵表示
习惯上用Y表示内生变量,X表示先决变量,μ表示随机项,β表示内生变量的结构参数,γ表示先决变量的结构参数,如果模型中有常数项,可以看成为一个外生的虚变量,它的观测值始终取1。
⒌简单宏观经济模型的矩阵表示
三、简化式模型
Reduced-Form Model
⒈定义
用所有先决变量作为每个内生变量的解释变量,所形成的模型称为简化式模型。
简化式模型并不反映经济系统中变量之间的直接关系,并不是经济系统的客观描述。
由于简化式模型中作为解释变量的变量中没有内生变量,可以采用普通最小二乘法估计每个方程的参数,所以它在联立方程模型研究中具有重要的作用。
简化式模型中每个方程称为简化式方程(Reduced-Form Equations),方程的参数称为简化式参数(Reduced-Form Coefficients) 。
⒉简化式模型的矩阵形式
⒊简单宏观经济模型的简化式模型
四、参数关系体系
⒈定义
该式描述了简化式参数与结构式参数之间的关系,称为参数关系体系。
⒉作用
利用参数关系体系,首先估计简化式参数,然后可以计算得到结构式参数。
从参数关系体系还可以看出,简化式参数反映了先决变量对内生变量的直接与间接影响之和,这是简化式模型的另一个重要作用。
例如,在上述模型中存在如下关系:
Π21反映Yt-1对It的直接与间接影响之和; 而其中的β2正是结构方程中Yt-1对It的结构参数,显然,它只反映Yt-1对It的直接影响。
在这里,β2是Yt-1对It的部分乘数,Π21反映Yt-1对It的完全乘数。
注意:简化式参数与结构式参数之间的区别与联系。
§联立方程计量经济学模型的识别
The Identification Problem
一、识别的概念
二、从定义出发识别模型
三、结构式识别条件
四、简化式识别条件
五、实际应用中的经验方法
一、识别的概念
⒈为什么要对模型进行识别?
从一个例子看:
消费方程是包含C、Y和常数项的直接线性方程。
投资方程和国内生产总值方程的某种线性组合(消去I)所构成的新方程也是包含C、Y和常数项的直接线性方程。
如果利用C、Y的样本观测值并进行参数估计后,很难判断得到的是消费方程的参数估计量还是新组合方程的参数估计量。
只能认为原模型中的消费方程是不可估计的。
这种情况被称为不可识别。
只有可以识别的方程才是可以估计的。
⒉识别的定义
3种定义:
“如果联立方程模型中某个结构方程不具有确定的统计形式,则称该方程为不可识别。”
“如果联立方程模型中某些方程的线性组合可以构成与某一个方程相同的统计形式,则称该方程为不可识别。”
以是否具有确定的统计形式作为识别的基本定义。
什么是“统计形式”?
什么是“具有确定的统计形式”?
“根据参数关系体系,在已知简化式参数估计值时,如果不能得到联立方程模型中某个结构方程的确定的结构参数估计值,则称该方程为不可识别。”
⒊模型的识别
上述识别的定义是针对结构方程而言的。
模型中每个需要估计其参数的随机方程都存在识别问题。
如果一个模型中的所有随机方程都是可以识别的,则认为该联立方程模型系统是可以识别的。反过来,如果一个模型系统中存在一个不可识别的随机方程,则认为该联立方程模型系统是不可以识别的。
⒋恰好识别(Just Identification)与过度识别 (Overidentification)
如果某一个随机方程具有一组参数估计量,称其为恰好识别;
如果某一个随机方程具有多组参数估计量,称其为过度识别。
恒等方程由于不存在参数估计问题,所以也不存在识别问题。但是,在判断随机方程的识别性问题时,应该将恒等方程考虑在内。
二、从定义出发识别模型
⒈例题1
第2与第3个方程的线性组合得到的新方程具有与消费方程相同的统计形式,所以消费方程也是不可识别的。
第1与第3个方程的线性组合得到的新方程具有与投资方程相同的统计形式,所以投资方程也是不可识别的。
于是,该模型系统不可识别。
参数关系体系由3个方程组成,剔除一个矛盾方程,2个方程不能求得4个结构参数的确定值。也证明消费方程与投资方程都是不可识别的。
⒉例题2
消费方程是可以识别的,因为任何方程的线性组合都不能构成与它相同的统计形式。
投资方程仍然是不可识别的,因为第1、第2与第3个方程的线性组合(消去C)构成与它相同的统计形式。
于是,该模型系统仍然不可识别。
参数关系体系由6个方程组成,剔除2个矛盾方程,由4个方程是不能求得所有5个结构参数的确定估计值。
可以得到消费方程参数的确定值,证明消费方程可以识别;因为只能得到它的一组确定值,所以消费方程是恰好识别的方程。
投资方程都是不可识别的。
注意:与例题1相比,在投资方程中增加了1个变量,消费方程变成可以识别。
⒊例题3
消费方程仍然是可以识别的,因为任何方程的线性组合都不能构成与它相同的统计形式。
投资方程也是可以识别的,因为任何方程的线性组合都不能构成与它相同的统计形式。
于是,该模型系统是可以识别的。
参数关系体系由9个方程组成,剔除3个矛盾方程,在已知简化式参数估计值时,由6个方程能够求得所有6个结构参数的确定估计值。
所以也证明消费方程和投资方程都是可以识别的。
而且,只能得到所有6个结构参数的一组确定值,所以消费方程和投资方程都是恰好识别的方程。
注意:与例题2相比,在消费方程中增加了1个变量,投资方程变成可以识别。
⒋例题4
消费方程和投资方程仍然是可以识别的,因为任何方程的线性组合都不能构成与它们相同的统计形式。
于是,该模型系统是可以识别的。
参数关系体系由12个方程组成,剔除4个矛盾方程,在已知简化式参数估计值时,由8个方程能够求得所有7个结构参数的确定估计值。
所以也证明消费方程和投资方程都是可以识别的。
但是,求解结果表明,对于消费方程的参数,只能得到一组确定值,所以消费方程是恰好识别的方程;
而对于投资方程的参数,能够得到多组确定值,所以投资方程是过度识别的方程。
注意:
在求解线性代数方程组时,如果方程数目大于未知数数目,被认为无解;如果方程数目小于未知数数目,被认为有无穷多解。
但是在这里,无穷多解意味着没有确定值,所以,如果参数关系体系中有效方程数目小于未知结构参数估计量数目,被认为不可识别。
如果参数关系体系中有效方程数目大于未知结构参数估计量数目,那么每次从中选择与未知结构参数估计量数目相等的方程数,可以解得一组结构参数估计值,换一组方程,又可以解得一组结构参数估计值,这样就可以得到多组结构参数估计值,被认为可以识别,但不是恰好识别,而是过度识别。
⒌如何修改模型使不可识别的方程变成可以识别
或者在其它方程中增加变量;
或者在该不可识别方程中减少变量;
必须保持经济意义的合理性。
三、结构式识别条件
⒈结构式识别条件
直接从结构模型出发
一种规范的判断方法
每次用于1个随机方程
具体描述为:
一般将该条件的前一部分称为秩条件(Rank Condition),用以判断结构方程是否识别;
将后一部分称为阶条件(Order Conditon),用以判断结构方程恰好识别或者过度识别。
⒉例题
判断第1个结构方程的识别状态
所以,该方程可以识别。因为
所以,第1个结构方程为恰好识别的结构方程。
判断第2个结构方程的识别状态
所以,该方程可以识别。因为
所以,第2个结构方程为过度识别的结构方程。
第3个方程是平衡方程,不存在识别问题。
综合以上结果,该联立方程模型是可以识别的。
与从定义出发识别的结论一致。
四、简化式识别条件
⒈简化式识别条件
如果已经知道联立方程模型的简化式模型参数,那么可以通过对简化式模型的研究达到判断结构式模型是否识别的目的。
由于需要首先估计简化式模型参数,所以很少实际应用。
⒉例题
需要识别的结构式模型:
已知其简化式模型参数矩阵为:
判断第1个结构方程的识别状态
所以该方程是可以识别的。又因为:
所以该方程是恰好识别的。
判断第2个结构方程的识别状态
所以该方程是可以识别的。又因为:
所以该方程是过度识别的。
判断第3个结构方程的识别状态
所以该方程是不可识别的。
所以该模型是不可识别的。
可以从数学上严格证明,简化式识别条件和结构式识别条件是等价的。
《计量经济学—方法与应用》(李子奈编著,清华大学出版社,1992年3月)第104—107页。
讨论:阶条件是确定过度识别的充分必要条件吗?(李子奈,《数量经济技术经济研究》,1988年第10期)
五、实际应用中的经验方法
当一个联立方程计量经济学模型系统中的方程数目比较多时,无论是从识别的概念出发,还是利用规范的结构式或简化式识别条件,对模型进行识别,困难都是很大的,或者说是不可能的。
理论上很严格的方法在实际中往往是无法应用的,在实际中应用的往往是一些经验方法。
关于联立方程计量经济学模型的识别问题,实际上不是等到理论模型已经建立了之后再进行识别,而是在建立模型的过程中设法保证模型的可识别性。
“在建立某个结构方程时,要使该方程包含前面每一个方程中都不包含的至少1个变量(内生或先决变量);同时使前面每一个方程中都包含至少1个该方程所未包含的变量,并且互不相同。”
该原则的前一句话是保证该方程的引入不破坏前面已有方程的可识别性。只要新引入方程包含前面每一个方程中都不包含的至少1个变量,那么它与前面方程的任意线性组合都不能构成与前面方程相同的统计形式,原来可以识别的方程仍然是可以识别的。
该原则的后一句话是保证该新引入方程本身是可以识别的。只要前面每个方程都包含至少1个该方程所未包含的变量,并且互不相同。那么所有方程的任意线性组合都不能构成与该方程相同的统计形式。
在实际建模时,将每个方程所包含的变量记录在如下表所示的表式中,将是有帮助的。
§联立方程模型的估计
一、概述
二、狭义的工具变量法(IV)
三、间接最小二乘法(ILS)
四、二阶段最小二乘法(2SLS)
五、三种方法的等价性证明
六、简单宏观经济模型实例演示
*七、主分量法的应用
*八、k级估计式
一、概述
联立方程计量经济学模型的估计方法分为两大类:单方程估计方法与系统估计方法。
所谓单方程估计方法,指每次只估计模型系统中的一个方程,依次逐个估计。也将单方程估计方法称为有限信息估计方法。
所谓系统估计方法,指同时对全部方程进行估计,同时得到所有方程的参数估计量。也将系统估计方法称为完全信息估计方法。
联立方程模型的单方程估计方法不同于单方程模型的估计方法 。
单方程估计方法按其方法原理又分为两类。
一类以最小二乘为原理,例如间接最小二乘法(ILS, Indirect Least Square)、两阶段最小二乘法(2SLS, Two Stage Least Squares)、工具变量法(IV, Instrumental Variables)等,称其为经典方法;
一类不以最小二乘为原理,或者不直接从最小二乘原理出发,例如以最大或然为原理的有限信息最大或然法(LIML, Limited Information Maximum Likelihood),以及仍然应用最小二乘原理、但并不以残差平方和最小为判断标准的最小方差比方法(LVR, Least Variable Ration)等。
系统估计方法主要包括三阶段最小二乘法(3SLS, Three Stage Least Squares)和完全信息最大或然法(FIML, Full Information Maximum Likelihood)。
本书只介绍几种简单的、常用的单方程估计方法。
在大量的联立方程模型的应用研究中,仍然广泛应用普遍最小二乘法进行模型的估计。
二、狭义的工具变量法
(IV,Instrumental Variables)
⒈方法思路
“狭义的工具变量法” 与“广义的工具变量法”
解决结构方程中与随机误差项相关的内生解释变量问题。
方法原理与单方程模型的IV方法相同。
模型系统中提供了可供选择的工具变量,使得IV方法的应用成为可能。
⒉工具变量的选取
对于联立方程模型的每一个结构方程,例如第1个方程,可以写成如下形式:
内生解释变量(g1-1)个,先决解释变量k1个。
如果方程是恰好识别的,有(g1-1)=(k- k1)。
可以选择(k- k1)个方程没有包含的先决变量作为(g1-1)个内生解释变量的工具变量。
⒊ IV参数估计量
方程的矩阵表示为:
选择方程中没有包含的先决变量X0*作为包含的内生解释变量Y0的工具变量,得到参数估计量为:
⒋讨论
该估计量与OLS估计量的区别是什么?
该估计量具有什么统计特性?
(k- k1)工具变量与(g1-1)个内生解释变量的对应关系是否影响参数估计结果?为什么?
IV是否利用了模型系统中方程之间相关性信息?
对于过度识别的方程,可否应用IV ?为什么?
对于过度识别的方程,可否应用GMM ?为什么?
三、间接最小二乘法
(ILS, Indirect Least Squares)
⒈方法思路
联立方程模型的结构方程中包含有内生解释变量,不能直接采用OLS估计其参数。但是对于简化式方程,可以采用OLS直接估计其参数。
间接最小二乘法:先对关于内生解释变量的简化式方程采用OLS估计简化式参数,得到简化式参数估计量,然后通过参数关系体系,计算得到结构式参数的估计量。
间接最小二乘法只适用于恰好识别的结构方程的参数估计,因为只有恰好识别的结构方程,才能从参数关系体系中得到唯一一组结构参数的估计量。
⒉一般间接最小二乘法的估计过程
用OLS估计简化式模型,得到简化式参数估计量,代入该参数关系体系,先由第2组方程计算得到内生解释变量的参数,然后再代入第1组方程计算得到先决解释变量的参数。于是得到了结构方程的所有结构参数估计量。
⒊间接最小二乘法也是一种工具变量方法
ILS等价于一种工具变量方法:依次选择X作为(Y0,X0)的工具变量。
数学证明见《计量经济学—方法与应用》(李子奈编著,清华大学出版社,1992年3月)第126—128页。
估计结果为:
四、二阶段最小二乘法
(2SLS, Two Stage Least Squares)
⒈2SLS是应用最多的单方程估计方法
IV和ILS一般只适用于联立方程模型中恰好识别的结构方程的估计。
在实际的联立方程模型中,恰好识别的结构方程很少出现,一般情况下结构方程都是过度识别的。为什么?
2SLS是一种既适用于恰好识别的结构方程,又适用于过度识别的结构方程的单方程估计方法。
⒉2SLS的方法步骤
第一阶段:对内生解释变量的简化式方程使用OLS。得到:
用估计量代替结构方程中的内生解释变量,得到新的模型:
第二阶段:对该模型应用OLS估计,得到的参数估计量即为原结构方程参数的二阶段最小二乘估计量。
⒊二阶段最小二乘法也是一种工具变量方法
如果用Y0的估计量作为工具变量,按照工具变量方法的估计过程,应该得到如下的结构参数估计量:
可以严格证明两组参数估计量是完全等价的,所以可以把2SLS也看成为一种工具变量方法。
证明过程见《计量经济学—方法与应用》(李子奈编著,清华大学出版社,1992年3月)第130—131页。
五、三种方法的等价性证明
⒈三种单方程估计方法得到的参数估计量
⒉IV与ILS估计量的等价性
在恰好识别情况下。
工具变量集合相同,只是次序不同。
次序不同不影响正规方程组的解。
⒉2SLS与ILS估计量的等价性
在恰好识别情况下。
ILS的工具变量是全体先决变量。
2SLS的每个工具变量都是全体先决变量的线性组合。
2SLS的正规方程组相当于ILS的正规方程组经过一系列的初等变换的结果。
线性代数方程组经过初等变换不影响方程组的解。
六、简单宏观经济模型实例演示
⒈模型
消费方程是恰好识别的;
投资方程是过度识别的;
模型是可以识别的。
下列演示中采用了1978-1996年的数据,与教科书不同。
⒉
数
据
⒊用狭义的工具变量法估计消费方程
用Gt作为Yt的工具变量
估计结果显示
⒋用间接最小二乘法估计消费方程
C简化式模型估计结果
Y简化式模型估计结果
⒌用两阶段最小二乘法估计消费方程
比较上述消费方程的3种估计结果,证明这3种方法对于恰好识别的结构方程是等价的。估计量的差别只是很小的计算误差。
代替原消费方程中的Yt,应用OLS估计
第2阶段估计结果
⒍用两阶段最小二乘法估计投资方程
投资方程是过度识别的结构方程,只能用2SLS估计。估计过程与上述2SLS估计消费方程的过程相同。得到投资方程的参数估计量为:
至此,完成了该模型系统的估计。
2SLS第2阶段估计结果
⒎用GMM估计投资方程
投资方程是过度识别的结构方程,也可以用GMM估计。选择的工具变量为c、G、CC1,得到投资方程的参数估计量为:
与2SLS结果比较,结构参数估计量变化不大。残差平方和由24223582变为3832486,显著减少。为什么?利用了更多的信息。
GMM估计结果
*七、主分量法的应用
⒈方法的提出
主分量方法本身并不是联立方程模型的估计方法,而是配合其它方法,例如2SLS使用于模型的估计过程之中。
数学上的主分量方法早就成熟,Kloek和Mennes于1960年提出将它用于计量经济学模型的估计。
2SLS是一种普遍适用的联立方程模型的单方程估计方法,但是当它在实际模型估计中被应用时,立刻就会遇到不可逾越的困难。其第一阶段—用OLS估计简化式方程,是难以实现的。为什么?
⒉方法的原理
所谓主分量方法,就是用较少数目的新变量重新表示原模型中较多数目的先决变量的方法。
例如,如果能够找到5个左右的新变量表示宏观经济模型中的30个先决变量,那么只需要15组以上的样本,就可以进行2SLS第一阶段的估计。
对充当主分量的变量是有严格要求:一是它必须是先决变量的线性组合,二是它们之间必须是正交的。前一条是保证主分量对先决变量的代表性;后一条是保证主分量之间不出现共线性。
⒊主分量的选取
用两个主分量表示两个原变量:
可以证明,a1、a2分别是X’X的2个特征值对应的特征向量。
用k个主分量表示k个原变量:
同样可以证明,a1、a2、…、ak分别是X’X的k个特征值对应的特征向量。
用f个主分量表示k个原变量:
选择a1、a2、…、af分别是X’X的f个最大特征值对应的特征向量。
在2SLS中主分量的选取
对于简化式方程:
⒋主分量法在ILS中的应用
对于2SLS,直接利用主分量完成第一阶段的估计,得到内生解释变量的估计量。
对于ILS,必须求得到简化式参数,进而计算结构式参数。
首先估计Y=ZΔ+Ε,然后将Z=XA代入,得到Y=XΠ 中Π的估计量。
*八、k级估计式
⒈k级估计式
本身不是一种估计方法,而是对上述几种方法得到的估计式的概括。
对于联立方程模型中的第1个结构方程:
k级估计式 为:
显然,当:
k=0时,即为OLS估计式;
k=1时,即为2SLS估计式;
k等于有限信息估计方法中的时,即为有限信息估计式。
⒉k级估计式的性质
假设工具变量与随机误差项不相关,即:
且先决变量与随机误差项不相关,即:
那么,容易证明k级估计式是一致性估计式。
工具变量与随机误差项不相关,对k是有限制的,必须有(证明见教科书):
这就是说,只有在2SLS或有限信息估计方法中,k级估计式是一致性估计式,而在OLS方法中,不具有一致性。
§联立方程计量经济学模型若干问题的讨论
一、模型估计方法的比较
二、为什么普通最小二乘法被普遍采用
三、联立方程模型的检验
一、模型估计方法的比较
⒈大样本估计特性的比较
在大样本的情况下,各种参数估计方法的统计特性可以从数学上进行严格的证明,因而也可以将各种方法按照各个性质比较优劣。
按渐近无偏性比较优劣。
除了OLS方法外,所有方法的参数估计量都具有大样本下渐近无偏性。因而,除了OLS方法最差外,其它方法无法比较优劣。
按渐近有效性比较优劣
OLS 非一致性估计,未利用任何单方程外的信息;
IV 利用了模型系统部分先决变量的数据信息;
2SLS、LIML 利用了模型系统全部先决变量的数据信息;
3SLS、FIML 利用了模型系统全部先决变量的数据信息和结构方程相关性信息。
⒉小样本估计特性的Monte Carlo试验
参数估计量的大样本特性只是理论上的,实际上并没有“大样本”,所以,对小样本估计特性进行比较更有实际意义。
而在小样本的情况下,各种参数估计方法的统计特性无法从数学上进行严格的证明,因而提出了一种Monte Carlo试验方法。
Monte Carlo试验方法在经济实验中被广泛采用。
小样本估计特性的Monte Carlo试验过程
第一步:利用随机数发生器产生随机项分布的一组样本;
第二步:代入已经知道结构参数和先决变量观测值的结构模型中;
第三步:计算内生变量的样本观测值;
第四步:选用各种估计方法估计模型的结构参数。
上述步骤反复进行数百次,得到每一种估计方法的参数估计值的序列。
第五步:对每种估计方法的参数估计值序列进行统计分析;
第六步:与真实参数(即试验前已经知道的结构参数)进行比较,以判断各种估计方法的优劣。
小样本估计特性实验结果比较
⑴无偏性
OLS 2SLS 3SLS(LIML,FIML)
⑵最小方差性
LIML 2SLS FIML OLS
⑶最小均方差性
OLS LIML 2SLS 3SLS(FIML)
为什么OLS具有最好的最小方差性?
方差的计算公式:
均方差的计算公式:
前者反映估计量偏离实验均值的程度;后者反映估计量偏离真实值的程度。所以尽管OLS具有最小方差性,但是由于它是有偏的,偏离真实值最为严重,所以它的最小均方差性仍然是最差的。
二、为什么普通最小二乘法被普遍采用
⒈ 小样本特性
从理论上讲,在小样本情况下,各种估计方法的估计量都是有偏的。
⒉ 充分利用样本数据信息
除OLS之外的其它估计方法可以部分地或者全部地利用某个结构方程中未包含的先决变量的数据信息,从而提高参数估计量的统计性质。但是其前提是所有变量具有相同的样本容量。
在实际上变量经常不具有相同的样本容量。
采用先进估计方法所付出的代价经常是牺牲了该方程所包含的变量的样本数据信息。
⒊ 确定性误差传递
确定性误差:结构方程的关系误差和外生变量的观测误差。
采用OLS方法,当估计某一个结构方程时,方程中没有包含的外生变量的观测误差和其它结构方程的关系误差对该方程的估计结果没有影响。
如果采用2SLS方法 …
如果采用3SLS方法…
⒋ 样本容量不支持
实际的联立方程模型中每个结构方程往往是过度识别的,适宜采用2SLS或3SLS方法,但是在其第一阶段要以所有先决变量作为解释变量,这就需要很大容量的样本。实际上是难以实现的。
采用主分量方法等可以克服这个矛盾,但又带来方法的复杂性和新的误差。
⒌ 实际模型的递推(Recurred)结构
应用中的联立方程模型主要是宏观经济计量模型。
宏观经济计量模型一般具有递推结构。
具有递推结构的模型可以采用OLS。
补充:递推模型(Recursive Model )
可以采用OLS依次估计每个结构方程;
在估计后面的结构方程时,认为其中的内生解释变量是“先决”的。
三、联立方程模型的检验
包括单方程检验和方程系统的检验。
凡是在单方程模型中必须进行的各项检验,对于联立方程模型中的结构方程,以及应用2SLS或3SLS方法过程中的简化式方程,都是适用的和需要的。
模型系统的检验主要包括:
⒈拟合效果检验
将样本期的先决变量观测值代入估计后的模型,求解该模型系统,得到内生变量的估计值。将估计值与实际观测值进行比较,据此判断模型系统的拟合效果。
模型的求解方法:迭代法。为什么不直接求解?
常用的判断模型系统拟合效果的检验统计量是“均方百分比误差”,用RMS表示。
当RMSi=0,表示第i个内生变量估计值与观测值完全拟合。
一般地,在g个内生变量中,RMS<5%的变量数目占70%以上,并且每个变量的RMS不大于10%,则认为模型系统总体拟合效果较好。
⒉预测性能检验
如果样本期之外的某个时间截面上的内生变量实际观测值已经知道,这就有条件对模型系统进行预测检验。
将该时间截面上的先决变量实际观测值代入模型,计算所有内生变量预测值,并计算其相对误差。
一般认为,RE<5%的变量数目占70%以上,并且每个变量的相对误差不大于10%,则认为模型系统总体预测性能较好。
⒊方程间误差传递检验
寻找模型中描述主要经济行为主体的经济活动过程的、方程之间存在明显的递推关系的关键路径。
在关键路径上进行误差传递分析,可以检验总体模型的模拟优度和预测精度。
例如,计算:
称为冯诺曼比,如果误差在方程之间没有传递,该比值为0。
⒋样本点间误差传递检验
在联立方程模型系统中,由于经济系统的动态性,决定了有一定数量的滞后内生变量。
由于滞后内生变量的存在,使得模型预测误差不仅在方程之间传递,而且在不同的时间截面之间,即样本点之间传递。
必须对模型进行滚动预测检验。
给定t=1时的所有先决变量的观测值,包括滞后内生变量,求解方程组,得到内生变量Y1的预测值;
对于t=2,只外生给定外生变量的观测值,滞后内生变量则以前一时期的预测值代替,求解方程组,得到内生变量Y2的预测值;
逐年滚动预测,直至得到t=n时的内生变量Yn的预测值;
求出该滚动预测值与实际观测值的相对误差。
将t=n时的所有先决变量的观测值,包括滞后内生变量的实际观测值,代入模型,求解方程组,得到内生变量Yn的非滚动预测值;
求出该非滚动预测值与实际观测值的相对误差。
比较两种结果,二者的差异表明模型预测误差在不同的时间截面之间的传递。
第七章 经典计量经济学应用模型
§ 生产函数模型
§ 需求函数模型
§ 消费函数模型
§ 宏观计量经济模型
§ 生产函数模型(Production Function Models,.)
一、几个重要概念
二、以要素之间替代性质的描述为线索的生产函数模型的发展
三、以技术要素的描述为线索的生产函数模型的发展
四、几个重要生产函数模型的参数估计方法
五、生产函数模型在技术进步分析中的应用
六、建立生产函数模型中的数据质量问题
一、几个重要概念
⒈ 生产函数
⑴ 定义
描述生产过程中投入的生产要素的某种组合同它可能的最大产出量之间的依存关系的数学表达式。
投入的生产要素
最大产出量
⑵ 生产函数模型的发展
从20年代末,美国数学家Charles Cobb和经济学家Paul Dauglas提出了生产函数这一名词,并用1899-1922年的数据资料,导出了著名的Cobb-Dauglas生产函数。
1928年 Cobb, Dauglas C-D生产函数
1937年 Dauglas,Durand C-D生产函数的改进型
1957年 Solow C-D生产函数的改进型
1960年 Solow 含体现型技术进步生产 函数
1967年 Arrow等 两要素CES生产函数
1967年 Sato 二级CES生产函数
1968年 Sato, Hoffman VES生产函数
1968年 Aigner, Chu 边界生产函数
1971年 Revanker VES生产函数
1973年 Christensen, Jorgenson 超越对数
生产函数
1980年 三级CES生产函数
⑶ 生产函数是经验的产物
生产函数是在西方国家发展起来的,作为西方经济学理论体系的一部分,与特定的生产理论与环境相联系。
西方国家发展的生产函数模型可以被我们所应用:
生产函数反应的是生产中投入要素与产出量之间的技术关系;
生产函数模型的形式是经验的产物;不能照搬。
⒉ 要素产出弹性(Elasticity of Output)
⑴ 要素的产出弹性
某投入要素的产出弹性被定义为,当其他投入要素不变时,该要素增加1%所引起的产出量的变化率。
要素产出弹性的数值区间?为什么?
⑵ 规模报酬
所有要素的产出弹性之和
规模报酬不变
规模报酬递增
规模报酬递减
为什么经常将规模报酬不变作为生产函数必须满足的条件?
⒊ 要素替代弹性(Elasticity of Substitution)
⑴ 要素的边际产量(Marginal Product)
其他条件不变时,某一种投入要素增加一个单位时导致的产出量的增加量。用于描述投入要素对产出量的影响程度。
边际产量不为负。
边际产量递减。
⑵ 要素的边际替代率
(Marginal Rate of Substitution)
当两种要素可以互相替代时,就可以采用不同的要素组合生产相同数量的产出量。要素的边际替代率指的是在产量一定的情况下,某一种要素的增加与另一种要素的减少之间的比例。
要素的边际替代率可以表示为要素的边际产量之比。
从生产函数可以求得要素的边际产量和要素的边际替代率。
⑶ 要素替代弹性
要素替代弹性定义为两种要素的比例的变化率与边际替代率的变化率之比。
要素替代弹性是描述生产行为的重要参数,求得要素替代弹性是生产函数的重要应用。
要素替代弹性不为负。
特殊情况:要素替代弹性为0、要素替代弹性为∞。
⒋ 技术进步
⑴ 广义技术进步与狭义技术进步
所谓狭义技术进步,仅指要素质量的提高。
狭义的技术进步是体现在要素上的,它可以通过要素的“等价数量”来表示。
求得“等价数量”,作为生产函数模型的样本观测值,以这样的方法来引入技术进步因素。
所谓广义技术进步,除了要素质量的提高外,还包括管理水平的提高等对产出量具有重要影响的因素,这些因素是独立于要素之外的。
在生产函数模型中需要特别处理广义技术进步。
⑵ 中性技术进步
假设在生产活动中除了技术以外,只有资本与劳动两种要素,定义两要素的产出弹性之比为相对资本密集度,用ω表示。即:
如果技术进步使得ω越来越大,即劳动的产出弹性比资本的产出弹性增长得快,则称之为节约劳动型技术进步;如果技术进步使得ω越来越小,即劳动的产出弹性比资本的产出弹性增长得慢,则称之为节约资本型技术进步;如果技术进步前后ω不变,即劳动的产出弹性与资本的产出弹性同步增长,则称之为中性技术进步。
在中性技术进步中,如果要素之比不随时间变化,则称为希克斯中性技术进步;如果劳动产出率不随时间变化,则称为索洛中性技术进步;如果资本产出率不随时间变化,则称为哈罗德中性技术进步。
二、以要素之间替代性质的描述为线索的生产函数模型的发展
⒈ 线性生产函数模型(Linear .)
为什么?
如果选择线性生产函数,就意味着承认什么假设?
⒉ 投入产出生产函数模型(Input-Output .)
为什么?
如果选择投入产出生产函数,就意味着承认什么假设?
⒊ C-D生产函数模型
在C-D生产函数中要素的替代弹性是否随研究对象变化?是否合理?为什么?
在C-D生产函数中要素的替代弹性是否随样本区间变化?是否合理?为什么?
在C-D生产函数中要素的替代弹性是否随样本点变化?是否合理?为什么?
C-D生产函数中每个参数的数值范围是什么?为什么?
⒋ CES生产函数模型(Constant Elasticity 0f Substitution)
替代弹性的推导过程?(独立推导一遍)
在CES生产函数中要素的替代弹性是否随研究对象变化?是否合理?为什么?
在CES生产函数中要素的替代弹性是否随样本区间变化?是否合理?为什么?
在CES生产函数中要素的替代弹性是否随样本点变化?是否合理?为什么?
CES生产函数中每个参数的数值范围是什么?为什么?
⒌ VES生产函数模型(Variable Elasticity 0f Substitution)
⑴ 1968年Sato和Hoffman
假定:
得到:
与CES有什么联系与区别?
⑵ 1971年 Revankar
假定
其中:
当b=0时 ,
令
退化为CES模型。为什么?
当b=0,a=1时 ,
退化为C-D生产函数。为什么?
当a=1时,
为什么是“变替代弹性”?
为实际应用的VES生产函数。
⒍ 超越对数生产函数模型 (Translog .)
如果 ,表现为何种时常函数?
如果 ,表现为何种时常函数?
⒎ 多要素生产函数模型
⑴ 多要素线性生产函数模型
⑵ 多要素投入产出生产函数模型
⑶ 多要素C-D生产函数模型
⑷ 多要素一级CES生产函数模型
要素之间的替代弹性是否相同?是多大?为什么?
⑸ 多要素二级CES生产函数模型
要素之间的替代弹性是否相同?是多大?为什么?
⑹多要素三级CES生产函数模型
三、以技术进步的描述为线索的生产函数模型的发展
⒈ 将技术要素作为一个不变参数的生产函数模型
⒉ 改进的C-D生产函数模型
参数的经济意义是什么?
关于技术进步的假设是什么?为什么?
⒊ 改进的CES生产函数模型
关于技术进步的假设是什么?为什么?
⒋ 含体现型技术进步的生产函数模型
⑴ 总量增长方程
⑵ 分离资本质量的含体现型技术进步的生产函数模型
⑶分离劳动质量的含体现型技术进步的生产函数模型
⒌ 引入人力资本的生产函数模型
Lucas(1988)为了解决技术内生问题,提出人力资本的概念,Romer等人(1992)提出包括人力资本的生产函数模型
⒍ 边界生产函数模型
⑴确定性边界生产函数
⑵随机边界生产函数
四、几个重要生产函数模型的参数估计方法
⒈ C-D生产函数模型及其改进型的估计
⑴线性估计方法
⑵非线性估计方法
能否线性化,与假设有关。哪个方法更合理?
⒉ CES生产函数模型及其改进型的估计
假设?
误差?
⒊ VES生产函数的估计
⒋ 二级CES生产函数模型的估计
二级CES生产函数为:
由第2级函数展开取近似,得到:
由第1级函数展开取近似,得到:
代入前式,得到:
代入后的式中有多个二次项,应该选择多少项?为什么?
是否造成估计结果的任意性?
⒌ 含体现型技术进步生产函数模型的估计
估计的生产函数为:
直接作为线性模型估计:
关键是如何得到X1t的样本观测值
⒍ 确定性统计边界生产函数模型的修正的普通最小二乘估计(Corrected OLS,COLS)
采用C-D生产函数形式:
为理论上的最大产出量。
其中实质上的边界生产函数为:
作为 的值,代入得到。于是所要求的边界生产函数为:
将:
边界生产函数即是平均生产函数向上平移了 。
五、生产函数模型应用一例:生产函数模型在技术进步分析中的应用
⒈ 从纵向研究技术进步:测算技术进步速度及其对经济增长的贡献
⑴ 技术进步速度的测定
从生产函数模型求得要素的产出弹性
计算产出和各种要素的平均增长速度
利用增长方程计算技术进步速度
⑵ 技术进步对增长贡献的测定
⑶实例
⒉ 从横向研究技术进步:部门之间、企业之间技术进步水平的比较分析
⑴ 建立并估计某行业的企业确定性统计边界生产函数模型
⑵ 确定技术效率为1的企业
⑶ 计算每个企业的技术效率
⑷ 实例
六、建立生产函数模型过程中的问题一例:数据质量问题
⒈ 样本数据的一致性问题
一致性问题在生产函数模型中的具体体现。
为什么建立某个行业的生产函数模型必须采用时间序列数据?
为什么建立某个行业的企业生产函数模型必须采用截面数据?
为什么建立某个特定企业的生产函数模型必须采用时间序列数据?
⒉ 样本数据的准确性问题
样本数据的准确性的两层含义。
什么样的要素投入量数据才是“准确”的?
用部分的数据代替全体的数据必须满足什么假设?
⒊ 样本数据的可比性问题
可比性的极端重要性。
如何才能保证产出量数据的可比性?
如何才能保证资本投入量数据的可比性?
§需求函数
一、几个重要概念
二、几个重要的单方程需求函数模型及其参数估计
三、线性支出系统需求函数模型及其参数估计
* 四、交叉估计
* 五、大类商品的数量与价格
(Demand Function,.)
一、几个重要概念
⒈ 需求函数
⑴ 定义
需求函数是描述商品的需求量与影响因素,例如收入、价格、其他商品的价格等之间关系的数学表达式。
特定情况下可以引入其他因素。
需求函数与消费函数是两个完全不同的概念。为什么?
单方程需求函数模型和需求函数模型系统
哪类更符合需求行为理论?
⑵ 单方程需求函数模型是经验的产物
与需求行为理论不符
经常引入其他因素
参数的经济意义不明确
⑶ 需求函数模型系统来源于效用函数
由效用函数在效用最大化下导出,符合需求行为理论
只包括收入和价格
参数有明确的经济意义
⒉ 从效用函数到需求函数
⑴ 从直接效用函数到需求函数
直接效用函数为:
预算约束为:
在预算约束下使效用最大,即得到需求函数模型。
构造如下的拉格朗日函数:
极值的一阶条件:
求解即得到需求函数模型。
⑵ 从间接效用函数到需求函数
间接效用函数为:
利用公式
可以得到所求的使效用达到最大的商品需求函数。
⒊ 需求函数的0阶齐次性
⑴ 需求的收入弹性
生活必须品的需求收入弹性?
高档消费品的需求收入弹性?
低质商品的的需求收入弹性?
⑵ 需求的自价格弹性
生活必须品的需求自价格弹性?
高档消费品的需求自价格弹性?
“吉芬品” 的的需求收入弹性?
⑶ 需求的互价格弹性
替代品的需求互价格弹性?
互补品的需求互价格弹性?
互相独立商品的需求互价格弹性?
⑷ 需求函数的0阶齐次性条件
当收入、价格、其他商品的价格等都增长倍时,对商品的需求量没有影响。即:
需求函数模型的重要特征
模型的检验
二、几种重要的单方程需求函数模型及其参数估计
⒈ 线性需求函数模型
经验中存在
缺少合理的经济解释
不满足0阶齐次性条件
OLS估计
⒉ 对数线性需求函数模型
经验中比较普遍存在
参数有明确的经济意义
每个参数的经济意义和数值范围?
可否用0阶齐次性条件检验?
OLS估计
⒊ 耐用品的存量调整模型
导出过程
直接估计。
参数估计量的经济意义不明确 。
必须反过来求得原模型中的每个参数估计量,才有明确的经济意义。
由4个参数估计量求原模型的5个参数估计量,必须外生给定δ。
常用于估计的模型形式
⒋ 非耐用品的状态调整模型
Houthakker和Taylor于1970年建议。
反映消费习惯等“心理存量”对需求的影响 。
用上一期的实际实现了的需求(即消费)量作为“心理存量”的样本观测值。
三、线性支出系统需求函数模型及其参数估计
(LES,Linear Expenditure System)
⒈ 线性支出系统需求函数模型
Klein、Rubin 1947年 直接效用函数
该效用函数的含义?
、1954年 在预算约束
导出需求函数
拉格朗日方程
极值条件
对于前n个方程,消去λ可得:
LES是一个联立方程模型系统
函数的经济意义
参数的经济意义
模型系统估计的困难是什么?
⒉ 扩展的线性支出系统需求函数模型 (ELES, Expend Linear Expenditure System)
⑴ 模型的扩展
1973年 Liuch
两点扩展
扩展后参数的经济意义发生了什么变化?
为什么扩展后的模型可以估计?
⑵ 扩展的线性支出系统的0阶齐次性证明
⒊ 扩展的线性支出系统需求函数模型的估计方法
⑴ 迭代法
首先改写成如下形式:
(1)
其中:
再改写成如下形式:
(2)
迭代过程
给定一组边际消费倾向b的初始值;
计算(1)中X的样本观测值;
采用OLS估计(1),得到基本需求量r的第一次估计值;
代入(2)中,计算Z和W的样本观测值;
采用OLS估计(1)时,应该首先将个方程相加,然后对相加得到的方程进行最小二乘估计。为什么?
首先给定b的初始值与首先给定r的初始值,不影响估计结果。为什么?
采用OLS估计(2),得到b的第一次估计值;
重复该过程,直至两次迭代得到的参数估计值满足收敛条件为止。即完成了模型的估计。
⑵ 截面数据作样本时的最小二乘法
利用截面上价格相同,写成:
对模型采用普通最小二乘法进行估计,得到:
然后利用参数之间的关系计算:
* 四、交叉估计
⒈问题的提出
收入和价格两类变量对商品需求量的影响是不同的。为什么?
商品需求量和收入之间存在长期关系;而价格水平一般只对商品需求量具有短期影响。为什么?
时间序列数据适合于短期弹性的估计,截面数据适合于长期弹性的估计。
于是就提出了合并时间序列数据和截面数据的估计方法,即交叉估计方法。
用截面数据为样本估计模型中的一部分反映长期影响的参数,然后再用时间序列数据为样本估计模型中的另一部分反映短期影响的参数,分两阶段完成模型的估计。
用同一组样本数据同时估计需求函数模型的所有参数,在理论上是存在问题的。
2、估计方法
以对数线性需求函数为例,假设只包括收入和自价格
利用第T年的截面数据
在截面上认为价格是常数
估计得到:
当以时间序列数据为样本时,将模型写成:
令
有
估计得到
* 五、大类商品的数量与价格
1、问题的提出
需求函数研究中的一个实际问题。
在采用例如线性支出系统这样的联立方程模型时,必须对商品和服务进行分类,因为不可能将成千上万种商品和服务单独建立模型。
那么一个实际问题就是如何计量“类商品”的数量与价格。
⒉大类商品的数量与价格
⑴ 以购买支出额度量数量、以价格指数度量价格
例如:
模型是否满足0阶齐次性条件?
⑵ 对于具有相同计量单位的类商品的处理
⑶ 对于具有不同计量单位的类商品的处理
一种经验处理方法,缺少理论支持
§ 消费函数
(Consumption Function)
一、几个重要的消费函数模型及其参数估计
二、消费函数模型的一般形式
三、中国居民消费行为实证分析
一、几个重要的消费函数模型及其
参数估计
⒈ 绝对收入假设消费函数模型
消费是由收入唯一决定的
参数的经济意义和数值范围?
是否反映消费的边际效用递减规律?
变参数模型可以较好地反映边际消费倾向递减规律。
⒉ 相对收入假设消费函数模型
⑴ “示范性”假设消费函数模型
Duesenberry认为,在一个群体收入分布中处于低收入的个体,往往有较高的消费倾向。
消费函数
参数的经济意义和数值范围?
⑵ “不可逆性”假设消费函数模型
Duesenberry认为当前收入低于曾经达到的最高收入时,往往有较高的消费倾向。
消费函数
⒊ 生命周期假设消费函数模型
Modigliani,Brumberg和Ando于1954年提出预算约束为
使得效用函数达到最大,消费是各个时期的收入和贴现率的函数 。即:
表示为当前收入和资产存量的函数
⒋ 持久收入假设消费函数模型
Friedman于1957年提出收入与消费都分为两部分
消费函数
对于时间序列数据,第t时刻的持久收入可表示为
如何估计?
⒌ 合理预期的消费函数模型
假设第t期的消费是收入预期值的函数,即:
收入预期值是现期实际收入与前一期预期收入的加权和:
理论假设的合理性?
代入得到:
⒍ 适应预期的消费函数模型
理论假设和最终模型与⒌的异同?
二、消费函数模型的一般形式
⒈ 消费函数模型的一般形式
形式
经济意义解释合理。
各种消费函数模型,除绝对收入假设消费函数外,都可以近似表达为这种形式。
估计中的问题有哪些?
共线性问题?
随机解释变量问题?
⒉ 各种消费函数模型向一般形式的推导
“示范性” 相对收入假设消费函数模型已具有相同的统计形式。
“不可逆性”相对收入假设消费函数模型推导过程中仅忽略收入的两期滞后量的影响。
生命周期假设消费函数模型推导过程中仅去掉明显共线性项,引入常数项。
持久收入假设消费函数模型推导过程中仅将瞬时消费归入随机项,引入常数项。
合理预期假设与适应预期假设消费函数模型已经是相同的统计形式。
结论:该一般形式与各种理论假设都相容,具有包容性。
三、中国居民消费行为实证分析
⒈ 中国的总消费构成
总消费=居民消费+政府消费=农业居民消费+非农业居民消费+政府消费
总消费构成数据(看统计年鉴)
各个消费群体具有不同的消费行为
拟按照各自的消费行为建立各自的消费函数模型
⒉ 农业居民的消费行为分析
(讨论)
关于两种假设的检验:绝对收入假设和生命周期假设。
两种假设导致不同的政策选择。
模型检验表明绝对收入假设可以用来描述我国农业居民的消费行为。说明目前我国农民的消费仍然由收入决定,所以欲启动农村消费市场以拉动经济增长,必须研究如何提高农民的收入。
*§ 宏观计量经济模型
Macro-Economy Econometrics Model
一、宏观计量经济模型的设定理论
二、建立宏观计量经济模型的工作程序
三、一个小型模型的例子—Klein战争之间模型
四、中国宏观计量经济模型的案例分析
一、宏观计量经济模型的设定理论
1、宏观经济模型的分类
(1)宏观经济模型与宏观计量经济模型
宏观经济模型是在宏观总量水平上把握和反映经济运动的全面特征,研究宏观经济主要指标间的相互依存关系,描述国民经济和社会再生产过程各环节之间的联系,并可以用以进行宏观经济的结构分析、政策评价、决策研究和发展预测。
将应用计量经济学方法建立的宏观经济模型称为宏观计量经济模型,它是宏观经济模型中的一类。
(2)宏观经济计量模型的类型
按建模目的分类
按建模范围分类
按时间长度分类
按照经济理论基础分类
2、传统宏观计量经济模型的设定
(1)基本理论要点
依据某种已经存在的经济理论或者已经提出的对经济行为规律的某种解释设定模型的总体结构和个体结构,即模型是建立在已有的经济理论和经济行为规律假设的基础之上的;
引进概率论思想作为模型研究的方法论基础,选择随机联立线性方程组作为模型的一般形式;
模型的识别、参数的估计、模型的检验是主要的技术问题;
以模型对样本数据的拟合优度作为检验模型的主要标准。
(2)模型设定方法
从简单到复杂
从一般到简单
(3)评价
传统宏观计量经济模型的设定理论是在宏观计量经济模型的发展过程中逐渐形成的,反过来又极大地推动了宏观计量经济模型的发展。
对于同样的研究对象,不同的研究者只要对理论假设理解不同,仍然可以建立不同的模型。
对传统宏观计量经济模型的设定理论的主要批判源于20世纪70年代初期。
3、影响宏观经济计量模型设定的几个因素
(1)宏观经济环境对模型设定的影响
需求不足和供给不足是两类不同的宏观经济环境。
在需求不足的环境下,需求成为经济增长的主要制约,刺激需求成为宏观经济政策的主要目标。
讨论:宏观计量经济模型的总体结构特征和个体结构特征。
在供给不足的环境下,供给成为经济增长的主要制约,刺激生产成为宏观经济政策的主要目标。
讨论:宏观计量经济模型的总体结构特征和个体结构特征。
(2)宏观经济决策方式对模型设定的影响
宏观经济决策方式主要分为以集中决策为主和以分散决策为主两类。
讨论:分散决策方式对宏观计量经济模型的总体结构和个体结构都将产生影响。
讨论:集中决策方式对宏观计量经济模型的总体结构和个体结构都将产生影响。
(3)经济核算体系对模型设定的影响
宏观计量经济模型是在一定的核算体系基础是建立起来的。由指标体系组成的核算体系反映宏观经济的运行过程和状态,是宏观计量经济模型的数据来源,是设定宏观计量经济模型的重要依据。
两类核算体系:国民核算体系,简称为SNA(System of National Accounting)体系;国民经济平衡表体系,简称为MPS(Material Product Balance System)体系。
核算体系对宏观计量经济模型的影响在于指标体系以及主要指标的核算方法。
4、模型外生性程度的决定
所谓外生性程度,简单说就是模型中外生变量与内生变量数目之间的比例。
影响外生性程度的因素:模型的功能 、决策方式 、可解释性 、样本容量 。
较高外生性程度的优点:控制模型规模 、减少方程设定误差 、方便于政策模拟和多方案计算 。
较高外生性程度的缺点:需要较大的样本容量 、预测外生变量值的困难 。
5、模型分解性程度的决定
指部门的分解。
影响模型分解性程度的因素 :宏观经济中的结构性变化 、建模目的的影响 、模型规模的限制。
较高分解性程度的优点:模型具有较好的结构功能 、方程能较好地描述经济行为 、模型的样本期模拟精度和样本期外的预测精度都较高、使偏差多样化和分散化。
较高分解性程度的缺点:数据收集和调整的工作量和难度增大、模型中包含了更多的方程带来更大的方程设定误差。
二、建立宏观经济计量模型的工作程序
三、一个著名的小型宏观经济计量模型
——Klein战争之间模型
⒈变量
内生变量
外生变量
⒉模型
⒊估计
以美国两次世界大战之间的1920~1941年年度数据为样本, 采用FIML估计。
⒋应用
直接应用结构参数估计结果。
例如分析消费方程, 工资收入是私人工资和政府工资之和, 其消费边际倾向是, 即工资增加1美元, 消费就增加美元; 现期利润的消费边际倾向, 而前期利润的边际消费倾向。由此可见, 现期工资收入是消费的一个决定性因素。
利用简化式参数估计结果。
表中政府控制变量列中数据表示这些变量对每一个内生变量的短期影响乘数。
例如, 当税收增加10000美元, 引起消费下降1880美元, 投资减少2960美元;
例如,当政府支出增加10000美元, 引起收入增加19300美元, 如果同时增加税收10000美元, 收入减少14840美元, 二者的平衡预算影响乘数(对收入)为二者之和, 即4460美元。
计算并利用长期均衡乘数。
可见, 各政策变量的投资均衡乘数为0, 因为在均衡情况下, 资本存量不变, 没有投资发生; 政府支出对收入的长期影响乘数是, 而短期乘数是, 即80%的影响是当期发生的。
四、中国宏观经济计量模型的案例分析
⒈总体特征
(1)总体上的供给导向
供给导向的模块结构关系;
主要方程的供给导向;
部分方程的需求导向或者供需双导向。
(2)集中决策与分散决策并存
例如:
关于投资模块的设计
关于价格模块的设计
(3)以SNA体系为主,兼顾少数MPS体系指标
总体上的SNA体系
少数MPS指标的方程
数据收集和整理方面的困难
(4)较高的分解性程度
经济中结构性问题突出
(5)虚变量的普遍应用
政策在经济活动中的作用;
“奇异点”的较多存在。
例如某个模型中的工业生产方程 :
2、中国宏观计量经济模型中主要模块的设计
(1)模块
宏观计量经济模型由若干模块组成。
每个模块描述某项经济活动或者某个经济主体的经济行为。
每个模块由若干结构方程组成。模块中方程的数目取决于分解性程度。
模块之间的关系描述了宏观计量经济模型的总体结构。
(2)一个模型示例
“中国宏观计量经济模型CEMT-1”总体结构框图。
共有12个模块:生产、投资、财政、信贷、企业、事业、居民、国际、消费、价格、就业和总供求。
模型共包含256个方程,其中随机方程102个,衡等方程154个;模型包括256个内生变量和41个外生变量。
3、中国宏观计量经济模型中主要方程的设定
具体略,参见教科书。
例如,
某类商品出口额=f(国内供给能力,国际市场需求,价格,汇率,政策,μ)
某类商品进口额=f(国际市场供给,国内需求,外汇支付能力,价格,汇率,政策,μ)
某种商品价格指数=f(相关商品的价格指数,需求因素,供给因素,政策虚变量,μ)
某部门劳动者人数=f(前一年劳动者人数,新增生产规模,μ)
某部门固定资产原值或净值=f(前一年固定资产原值或净值,当年投资额,μ)
城镇居民储蓄存款=f(前一年末城镇居民储蓄存款余额,城镇居民收入, 存款利率,μ)
各项财政支出=f(财政支出,该项目前一年实际支出,政策,μ)
第八章 扩展的单方程计量经济学模型
§ 变参数线性单方程计量经济学模型
§ 非线性单方程计量经济学模型
§ 二元离散选择模型
*§ 平行数据计量经济学模型
§ 变参数单方程计量经济学模型
一、确定性变参数模型
*二、随机变参数模型
说明
常参数模型与变参数模型。真正的常参数模型只存在于假设之中,变参数的情况是经常发生的。
模型参数是变量,但不是随机变量,而是确定性变量,称为确定性变参数模型。
模型参数不仅是变量,而且是随机变量,称为随机变参数模型。
内容广泛,本节仅讨论最简单的变参数模型。
一、确定性变参数模型
⒈参数随某一个变量呈规律性变化
实际经济问题中的实例:具有经济意义的参数受某一因素的影响。
模型的估计
p为确定性变量,与随机误差项不相关,可以用OLS方法估计,得到参数估计量。
可以通过检验α1、β1是否为0来检验变量p是否对α、β有影响。
⒉参数作间断性变化
在实际经济问题中,往往表示某项政策的实施在某一时点上发生了变化。
这类变参数模型的估计,分3种不同情况。
(1)n0已知
可以分段建立模型,分段估计模型(CHOW方法)
Chow 检验
例 数据
例 散点图
1964—1972 估计结果
1973—1980 估计结果
1964—1980 估计结果
Chow Test
(1%显著性水平)<<(5%显著性水平),在的显著性水平下拒绝H0。
也可以引入虚变量,建立一个统一的模型(Gujarati方法)
分段
n0未知,但
一般可以选择不同的n0 ,进行试估计,然后从多次试估计中选择最优者。选择的标准是使得两段方程的残差平方和之和最小。
n0未知,且
将n0看作待估参数,用最大或然法进行估计。
(2)n0未知
*二、随机变参数模型
⒈ 参数在一常数附近随机变化
将原模型转换为具有异方差性的模型,而且已经推导出随机误差项的方差与解释变量之间的函数关系。
可以采用经典线性计量经济学模型中介绍的估计方法,例如加权最小二乘法等方法很方便地估计参数。
一种普遍的形式是1968年提出的的变参数 Hildreth-Houck模型 。
⒉ 参数随某一变量作规律性变化,同时受随机因素影响
将原模型转换为具有异方差性的多元线性模型。
可以采用经典线性计量经济学模型中介绍的估计方法,例如加权最小二乘法等方法很方便地估计参数。
⒊ 自适应回归模型
由影响常数项的变量具有一阶自相关性所引起。
是实际经济活动中常见的现象。
采用广义最小二乘法(GLS)估计模型参数 。
§简单的非线性单方程计量经济学模型
一、非线性单方程计量经济学模型概述
二、非线性普通最小二乘法
三、例题及讨论
说明
非线性计量经济学模型在计量经济学模型中占据重要的位置 ;已经形成内容广泛的体系,包括变量非线性模型、参数非线性模型、随机误差项违背基本假设的非线性问题等;
非线性模型理论与方法已经形成了一个与线性模型相对应的体系,包括从最小二乘原理出发的一整套方法和从最大或然原理出发的一整套方法。
本节仅涉及最基础的、具有广泛应用价值的非线性单方程模型的最小二乘估计。
一、非线性单方程计量经济学模型概述
⒈ 解释变量非线性问题
现实经济现象中变量之间往往呈现非线性关系
需求量与价格之间的关系
成本与产量的关系
税收与税率的关系
基尼系数与经济发展水平的关系
通过变量置换就可以化为线性模型
⒉ 可以化为线性的包含参数非线性的问题
函数变换
级数展开
⒊不可以化为线性的包含参数非线性的问题
与上页的方程比较,哪种形式更合理?
直接作为非线性模型更合理。
二、非线性普通最小二乘法
⒈ 普通最小二乘原理
残差平方和
取极小值的一阶条件
如何求解非线性方程?
⒉ 高斯-牛顿(Gauss-Newton)迭代法
高斯-牛顿迭代法的原理
对原始模型展开台劳级数,取一阶近似值
构造并估计线性伪模型
构造线性模型
估计得到参数的第1次迭代值
迭代
高斯-牛顿迭代法的步骤
⒊ 牛顿-拉夫森(Newton-Raphson)迭代法
自学,掌握以下2个要点
牛顿-拉夫森迭代法的原理
对残差平方和展开台劳级数,取二阶近似值;
对残差平方和的近似值求极值;
迭代。
与高斯-牛顿迭代法的区别
直接对残差平方和展开台劳级数,而不是对其中的原模型展开;
取二阶近似值,而不是取一阶近似值。
⒋应用中的一个困难
如何保证迭代所逼近的是总体极小值(即最小值)而不是局部极小值?
需要选择不同的初值,进行多次迭代求解。
⒌非线性普通最小二乘法在软件中的实现
给定初值
写出模型
估计模型
改变初值
反复估计
三、例题与讨论
例 农民收入影响因素分析模型
分析与建模:经过反复模拟,剔除从直观上看可能对农民收入产生影响但实际上并不显著的变量后,得到如下结论:改革开放以来,影响我国农民收入总量水平的主要因素是从事非农产业的农村劳动者人数、农副产品收购价格和农业生产的发展规模。
用I表示农民纯收入总量水平、Q表示农业生产的发展规模、P表示农副产品收购价格、L表示从事非农产业的农村劳动者人数。收入采用当年价格;农业生产的发展规模以按可比价格计算的、包括种植业、林业、牧业、副业和渔业的农业总产值指数为样本数据;农副产品收购价格以价格指数为样本数据。
农民收入及相关变量数据
1997
1996
1995
1994
1993
1992
1991
1990
1989
1988
1987
1986
1985
1984
1983
1982
1981
1980
1979
1978
L(100万人)
P (1978=100)
Q (1978=100)
I(10亿元)
年份
线性化模型估计结果
非线性模型估计结果(1978-1997)
非线性模型估计结果(1980-1997)
拟合结果(PIFIS-线性、PIFNIS-非线性)
结构分析
LNPI = + *LNPQ + *LNPP + *LNNPL + [AR(1)=,AR(2)=]
PI=*PQ^*PP^*NPL^
结构参数(弹性)差异很大
从经济意义方面分析,哪个更合理?
§ 二元离散选择模型
Binary Discrete Choice Model
一、二元离散选择模型的经济背景
二、二元离散选择模型
三、二元Probit离散选择模型及其参数估计
*四、二元Logit离散选择模型及其参数估计
五、一个实例
说明
在经典计量经济学模型中,被解释变量通常被假定为连续变量。
离散被解释变量数据计量经济学模型(Models with Discrete Dependent Variables)和离散选择模型(DCM, Discrete Choice Model)。
二元选择模型(Binary Choice Model)和多元选择模型(Multiple Choice Model)。
本节只介绍二元选择模型。
一、二元离散选择模型的经济背景
研究选择结果与影响因素之间的关系。
影响因素包括两部分:决策者的属性和备选方案的属性。
对于两个方案的选择。例如,两种出行方式的选择,两种商品的选择。由决策者的属性和备选方案的属性共同决定。
对于单个方案的取舍。例如,购买者对某种商品的购买决策问题 ,求职者对某种职业的选择问题,投票人对某候选人的投票决策,银行对某客户的贷款决策。由决策者的属性决定。
二、二元离散选择模型
1、原始模型
其中Y为观测值为1和0的决策被解释变量,X为解释变量,包括选择对象所具有的属性和选择主体所具有的属性。
对于
问题在于:该式右端并没有处于[0,1]范围内的限制,实际上很可能超出[0,1]的范围;而该式左端,则要求处于[0,1]范围内。于是产生了矛盾。
对于随机误差项 ,具有异方差性 。因为:
所以原始模型不能作为实际研究二元选择问题的模型。
2、效用模型
作为研究对象的二元选择模型
第i个个体 选择1的效用
第i个个体 选择0的效用
3、最大似然估计
欲使得效用模型可以估计,就必须为随机误差项选择一种特定的概率分布。
两种最常用的分布是标准正态分布和逻辑(logistic)分布,于是形成了两种最常用的二元选择模型—Probit模型和Logit模型。
最大似然函数及其估计过程如下:
标准正态分布或逻辑分布的对称性
在样本数据的支持下,如果知道概率分布函数和概率密度函数,求解该方程组,可以得到模型参数估计量。
三、二元Probit离散选择模型及其参数估计
1、标准正态分布的概率分布函数
2、重复观测值不可以得到情况下二元Probit离散选择模型的参数估计
关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。
应用计量经济学软件。
这里所谓“重复观测值不可以得到”,是指对每个决策者只有一个观测值。即使有多个观测值,也将其看成为多个不同的决策者。
3、重复观测值可以得到情况下二元Probit离散选择模型的参数估计
对每个决策者有多个重复(例如10次左右)观测值。
对第i个决策者重复观测ni次,选择yi=1的次数比例为pi,那么可以将pi作为真实概率Pi的一个估计量。
建立 “概率单位模型” ,采用广义最小二乘法估计 。
实际中并不常用。
详见教科书。
*四、二元Logit离散选择模型及其参数估计
1、逻辑分布的概率分布函数
2、重复观测值不可以得到情况下二元logit离散选择模型的参数估计
关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。
应用计量经济学软件。
3、重复观测值可以得到情况下二元logit离散选择模型的参数估计
对每个决策者有多个重复(例如10次左右)观测值。
对第i个决策者重复观测ni次,选择yi=1的次数比例为pi,那么可以将pi作为真实概率Pi的一个估计量。
建立“对数成败比例模型” ,采用广义最小二乘法估计 。
实际中并不常用。
详见教科书。
五、例题
例 贷款决策模型
分析与建模:某商业银行从历史贷款客户中随机抽取78个样本,根据设计的指标体系分别计算它们的“商业信用支持度”(XY)和“市场竞争地位等级”(SC),对它们贷款的结果(JG)采用二元离散变量,1表示贷款成功,0表示贷款失败。目的是研究JG与XY、SC之间的关系,并为正确贷款决策提供支持。
样本观测值
模型估计输出结果
回归方程表示如下:
JGF = 1-@CNORM(-( - *XY + *SC))
模拟:该方程表示,当XY和SC已知时,代入方程,可以计算贷款成功的概率JGF。例如,将表中第19个样本观测值XY=15、SC=-1代入方程右边,计算括号内的值为;
查标准正态分布表,对应于的累积正态分布为;于是,JG的预测值JGF=1-=,即对应于该客户,贷款成功的概率为。
预测:如果有一个新客户,根据客户资料,计算的“商业信用支持度”(XY)和“市场竞争地位等级”(SC),代入模型,就可以得到贷款成功的概率,以此决定是否给予贷款。
*§固定影响平行数据模型
Panel Data Model with Fixed-Effects
一、平行数据模型概述
二、模型的设定——F检验
三、固定影响变截距模型
四、固定影响变系数模型
一、平行数据模型概述
1、平行数据(Panel Data,面板数据)
时间序列数据
截面数据
平行数据
平行数据模型(Panel Data Model)已经成为计量经济学的一个独立分支
2、经济分析中的平行数据问题
宏观经济分析中的平行数据问题
目前应用较多
数据较容易获得,例如多个地区的时间序列数据
微观经济分析中的平行数据问题
目前应用较少
很难获得微观个体(家庭、个人)的时间序列数据
3、平行数据模型的三种情形
情形1,在横截面上无个体影响、无结构变化,则普通最小二乘估计给出了和的一致有效估计。相当于将多个时期的截面数据放在一起作为样本数据。
情形2,变截距模型(Panel Data Models with Variable Intercepts) 。在横截面上个体影响不同,个体影响表现为模型中被忽略的反映个体差异的变量的影响,又分为固定影响和随机影响两种情况。
情形3,变系数模型(Panel Data Models with Variable Coefficient) 。除了存在个体影响外,在横截面上还存在变化的经济结构,因而结构参数在不同横截面单位上是不同的。
二、模型的设定——F检验
1、任务
确定所研究的对象属于三种模型中的哪一种,作为研究平行数据的第一步。
采用假设检验
一般采用F检验,也称为协变分析检验(Analysis of Covariance)
对于固定影响(Fixed-Effects)和随机影响(Random-Effects)两种情况 ,则要采用其它检验方法,本节不予介绍,只讨论固定影响模型。
⒉F检验
假设1:斜率在不同的横截面样本点上和时间上都相同,但截距不相同,即情形2。
假设2:截距和斜率在不同的横截面样本点和时间上都相同,即情形1。
如果接收了假设2,则没有必要进行进一步的检验。如果拒绝了假设2,就应该检验假设1,判断是否斜率都相等。如果假设1被拒绝,就应该采用情形3的模型。
F统计量的计算方法
采用OLS分别估计变系数模型、变截距模型和经典模型,得到残差平方和分别为S1、S2、S3;
检验假设2的F统计量:
从直观上看,如S3-S1很小,F2则很小,低于临界值,接受H2。 S3为截距、系数都不变的模型的残差平方和,S1为截距、系数都变化的模型的残差平方和。
检验假设1的F统计量:
从直观上看,如S2-S1很小,F1则很小,低于临界值,接受H1。 S2为截距变化、系数不变的模型的残差平方和,S1为截距、系数都变化的模型的残差平方和。
三、固定影响变截距模型
1.固定影响变截距模型
固定影响与随机影响
如果横截面的个体影响可以用常数项的差别来说明,该不同的常数项是一个待估未知参数,称为固定影响变截距模型。如果横截面的个体影响可以用不变的常数项和变化的随机项之和的差别来说明,称为随机影响变截距模型。
固定影响变截距模型形式:
2. LSDV模型
最小二乘虚拟变量模型(LSDV,Least-Squares Dummy-Variable)
3.参数估计
如果n充分小,此模型可以当作具有(n+K)个参数的多元回归模型,由普通最小二乘进行估计。
当n很大,可用下列分块回归的方法进行计算。
分块回归过程见教材。
4、通过F检验检验变截距假设
5、用Eviews估计固定影响变截距模型
北京、天津、河北、山西、内蒙5地区消费总额COM与GDP关系
数据表
讨论—固定影响的输出
讨论—固定影响的输出
COMBJ = + *GDPBJ
COMTJ = + *GDPTJ
COMHB = + *GDPHB
COMSX = + *GDPSX
COMNM = + *GDPNM
讨论—固定影响(考虑序列相关)的输出
讨论—固定影响(考虑序列相关)的输出
COMBJ = + *GDPBJ +[AR(1)=]
COMTJ = + *GDPTJ +[AR(1)=]
COMHB = + *GDPHB +[AR(1)=]
COMSX = + *GDPSX + [AR(1)=]
COMNM = + *GDPNM +[AR(1)=]
讨论—固定影响(考虑异方差)的输出
四、固定影响变系数模型
1、固定影响变系数模型的表达式
2、随机干扰项在不同横截面个体之间不相关——OLS估计
以每个截面个体的时间序列数据为样本,采用经典单方程模型的估计方法分别估计其参数。
3、随机干扰项在不同横截面个体之间相关——GLS估计
采用GLS估计同时得到所有β的GLS估计量。
如何得到协方差矩阵的估计量?
一种可行的方法是:首先采用采用经典单方程模型的估计方法分别估计每个横截面个体上βi,计算残差估计值,以此构造协方差矩阵的估计量,类似于经典单方程模型的GLS那样。
第九章
时间序列计量经济学模型
时间序列的平稳性及其检验
随机时间序列分析模型
协整分析与误差修正模型
§ 时间序列的平稳性及其检验
一、问题的引出:非平稳变量与经典回归模型
二、时间序列数据的平稳性
三、平稳性的图示判断
四、平稳性的单位根检验
五、单整、趋势平稳与差分平稳随机过程
一、问题的引出:非平稳变量与经典回归模型
⒈常见的数据类型
到目前为止,经典计量经济模型常用到的数据有:
时间序列数据(time-series data)
截面数据(cross-sectional data)
平行/面板数据(panel data/time-series cross-section data)
★时间序列数据是最常见,也是最常用到的数据
⒉经典回归模型与数据的平稳性
经典回归分析暗含着一个重要假设:数据是平稳的。
数据非平稳,大样本下的统计推断基础——“一致性”要求——被破怀。
经典回归分析的假设之一:解释变量X是非随机变量
第(2)条是为了满足统计推断中大样本下的“一致性”特性:
依概率收敛:
(2)
放宽该假设:X是随机变量,则需进一步要求:
(1)X与随机扰动项 不相关∶Cov(X,)=0
第(1)条是OLS估计的需要
▲如果X是非平稳数据(如表现出向上的趋势),则(2)不成立,回归估计量不满足“一致性”,基于大样本的统计推断也就遇到麻烦。
因此:
注意:在双变量模型中:
表现在:两个本来没有任何因果关系的变量,却有很高的相关性(有较高的R2)。例如:如果有两列时间序列数据表现出一致的变化趋势(非平稳的),即使它们没有任何有意义的关系,但进行回归也可表现出较高的可决系数。
⒊ 数据非平稳,往往导致出现“虚假回归”问题
在现实经济生活中,实际的时间序列数据往往是非平稳的,而且主要的经济变量如消费、收入、价格往往表现为一致的上升或下降。这样,仍然通过经典的因果关系模型进行分析,一般不会得到有意义的结果。
时间序列分析模型方法就是在这样的情况下,以通过揭示时间序列自身的变化规律为主线而发展起来的全新的计量经济学方法论。
时间序列分析已组成现代计量经济学的重要内容,并广泛应用于经济分析与预测当中。
二、时间序列数据的平稳性
定义:
假定某个时间序列是由某一随机过程(stochastic process)生成的,即假定时间序列{Xt}(t=1, 2, …)的每一个数值都是从一个概率分布中随机得到,如果满足下列条件:
1)均值E(Xt)=是与时间t 无关的常数;
2)方差Var(Xt)=2是与时间t 无关的常数;
3)协方差Cov(Xt,Xt+k)=k 是只与时期间隔k有关,与时间t 无关的常数;
则称该随机时间序列是平稳的(stationary),而该随机过程是一平稳随机过程(stationary stochastic process)。
例.一个最简单的随机时间序列是一具有零均值同方差的独立分布序列:
Xt=t , t~N(0,2)
该序列常被称为是一个白噪声(white noise)。
由于Xt具有相同的均值与方差,且协方差为零,由定义,一个白噪声序列是平稳的。
例.另一个简单的随机时间列序被称为随机游走(random walk),该序列由如下随机过程生成:
X t=Xt-1+t
这里, t是一个白噪声。
容易知道该序列有相同的均值:E(Xt)=E(Xt-1)
为了检验该序列是否具有相同的方差,可假设Xt的初值为X0,则易知:
X1=X0+1
X2=X1+2=X0+1+2
… …
Xt=X0+1+2+…+t
由于X0为常数,t是一个白噪声,因此: Var(Xt)=t2
即Xt的方差与时间t有关而非常数,它是一非平稳序列。
然而,对X取一阶差分(first difference):
Xt=Xt-Xt-1=t
由于t是一个白噪声,则序列{Xt}是平稳的。
后面将会看到:如果一个时间序列是非平稳的,它常常可通过取差分的方法而形成平稳序列。
事实上,随机游走过程是下面我们称之为1阶自回归AR(1)过程的特例:
Xt=Xt-1+t
不难验证:
1)||>1时,该随机过程生成的时间序列是发散的,表现为持续上升(>1)或持续下降(<-1),因此是非平稳的;
2)=1时,是一个随机游走过程,也是非平稳的。
§中将证明:只有当-1<<1时,该随机过程才是平稳的。
1阶自回归过程AR(1)又是如下k阶自回归AR(K)过程的特例:
Xt= 1Xt-1+2Xt-2…+kXt-k
该随机过程平稳性条件将在第二节中介绍。
三、平稳性检验的图示判断
给出一个随机时间序列,首先可通过该序列的时间路径图来粗略地判断它是否是平稳的。
一个平稳的时间序列在图形上往往表现出一种围绕其均值不断波动的过程。
而非平稳序列则往往表现出在不同的时间段具有不同的均值(如持续上升或持续下降)。
进一步的判断:检验样本自相关函数及其图形
定义随机时间序列的自相关函数(autocorrelation function, ACF)如下:
k=k/0
自相关函数是关于滞后期k的递减函数(Why?)。
实际上,对一个随机过程只有一个实现(样本),因此,只能计算样本自相关函数(Sample autocorrelation function)。
一个时间序列的样本自相关函数定义为:
易知,随着k的增加,样本自相关函数下降且趋于零。但从下降速度来看,平稳序列要比非平稳序列快得多。
注意:
确定样本自相关函数rk某一数值是否足够接近于0是非常有用的,因为它可检验对应的自相关函数k的真值是否为0的假设。
Bartlett曾证明:如果时间序列由白噪声过程生成,则对所有的k>0,样本自相关系数近似地服从以0为均值,1/n 为方差的正态分布,其中n为样本数。
也可检验对所有k>0,自相关系数都为0的联合假设,这可通过如下QLB统计量进行:
该统计量近似地服从自由度为m的2分布(m为滞后长度)。
因此:如果计算的Q值大于显著性水平为的临界值,则有1-的把握拒绝所有k(k>0)同时为0的假设。
例: 表序列Random1是通过一随机过程(随机函数)生成的有19个样本的随机时间序列。
容易验证:该样本序列的均值为0,方差为。
从图形看:它在其样本均值0附近上下波动,且样本自相关系数迅速下降到0,随后在0附近波动且逐渐收敛于0。
由于该序列由一随机过程生成,可以认为不存在序列相关性,因此该序列为一白噪声。
根据Bartlett的理论:k~N(0,1/19),因此任一rk(k>0)的95%的置信区间都将是:
可以看出:k>0时,rk的值确实落在了该区间内,因此可以接受 k(k>0)为0的假设。
同样地,从QLB统计量的计算值看,滞后17期的计算值为,未超过5%显著性水平的临界值,因此,可以接受所有的自相关系数k(k>0)都为0的假设。
因此,该随机过程是一个平稳过程。
序列Random2是由一随机游走过程
Xt=Xt-1+t
生成的一随机游走时间序列样本。其中,第0项取值为0, t是由Random1表示的白噪声。
图形表示出:该序列具有相同的均值,但从样本自相关图看,虽然自相关系数迅速下降到0,但随着时间的推移,则在0附近波动且呈发散趋势。
样本自相关系数显示:r1=,落在了区间[, ]之外,因此在5%的显著性水平上拒绝1的真值为0的假设。
该随机游走序列是非平稳的。
例 检验中国支出法GDP时间序列的平稳性。
表 1978~2000年中国支出法GDP(单位:亿元)
图形:表现出了一个持续上升的过程,可初步判断是非平稳的。
样本自相关系数:缓慢下降,再次表明它的非平稳性。
从滞后18期的QLB统计量看:
QLB(18)=>=
拒绝:该时间序列的自相关系数在滞后1期之后的值全部为0的假设。
结论:
1978—2000年间中国GDP时间序列是非平稳序列。
例 检验§中关于人均居民消费与人均国内生产总值这两时间序列的平稳性。
原图 样本自相关图
从图形上看:人均居民消费(CPC)与人均国内生产总值(GDPPC)是非平稳的。
从滞后14期的QLB统计量看:CPC与GDPPC序列的统计量计算值均为,超过了显著性水平为5%时的临界值。再次表明它们的非平稳性。
就此来说,运用传统的回归方法建立它们的回归方程是无实际意义的。
不过,§中将看到,如果两个非平稳时间序列是协整的,则传统的回归结果却是有意义的,而这两时间序列恰是协整的。
四、平稳性的单位根检验
(unit root test)
1、DF检验
随机游走序列:
Xt=Xt-1+t
是非平稳的,其中t是白噪声。而该序列可看成是随机模型:
Xt=Xt-1+t
中参数=1时的情形。
(*)式可变形式成差分形式:
Xt=(1-)Xt-1+ t
=Xt-1+ t (**)
检验(*)式是否存在单位根=1,也可通过(**)式判断是否有 =0。
对式: Xt=Xt-1+t (*) 进行回归,如果确实发现=1,就说随机变量Xt有一个单位根。
一般地:
检验一个时间序列Xt的平稳性,可通过检验带有截距项的一阶自回归模型:
Xt=+Xt-1+t (*)
中的参数是否小于1。
或者:检验其等价变形式:
Xt=+Xt-1+t (**)
中的参数是否小于0 。
在第二节中将证明,(*)式中的参数>1或=1时,时间序列是非平稳的;
对应于(**)式,则是>0或 =0。
因此,针对式: Xt=+Xt-1+t
我们关心的检验为:零假设 H0:=0。
备择假设 H1:<0
上述检验可通过OLS法下的t检验完成。
然而,在零假设(序列非平稳)下,即使在大样本下t统计量也是有偏误的(向下偏倚),通常的t 检验无法使用。
Dicky和Fuller于1976年提出了这一情形下t统计量服从的分布(这时的t统计量称为统计量),即DF分布(见表)。
由于t统计量的向下偏倚性,它呈现围绕小于零值的偏态分布。
因此,可通过OLS法估计:
Xt=+Xt-1+t
并计算t统计量的值,与DF分布表中给定显著性水平下的临界值比较:
如果:t<临界值,则拒绝零假设H0: =0,
认为时间序列不存在单位根,是平稳的。
注意:在不同的教科书上有不同的描述,但是结果是相同的。
例如:“如果计算得到的t统计量的绝对值大于临界值的绝对值,则拒绝ρ=0”的假设,原序列不存在单位根,为平稳序列。
问题的提出:
在利用Xt=+Xt-1+t对时间序列进行平稳性检验中,实际上假定了时间序列是由具有白噪声随机误差项的一阶自回归过程AR(1)生成的。
但在实际检验中,时间序列可能由更高阶的自回归过程生成的,或者随机误差项并非是白噪声,这样用OLS法进行估计均会表现出随机误差项出现自相关(autocorrelation),导致DF检验无效。
2、ADF检验
另外,如果时间序列包含有明显的随时间变化的某种趋势(如上升或下降),则也容易导致上述检验中的自相关随机误差项问题。
为了保证DF检验中随机误差项的白噪声特性,Dicky和Fuller对DF检验进行了扩充,形成了ADF(Augment Dickey-Fuller )检验。
ADF检验是通过下面三个模型完成的:
模型3 中的t是时间变量,代表了时间序列随时间变化的某种趋势(如果有的话)。模型1与另两模型的差别在于是否包含有常数项和趋势项。
检验的假设都是:针对H1: <0,检验 H0:=0,即存在一单位根。
实际检验时从模型3开始,然后模型2、模型1。
何时检验拒绝零假设,即原序列不存在单位根,为平稳序列,何时检验停止。否则,就要继续检验,直到检验完模型1为止。
检验原理与DF检验相同,只是对模型1、2、3进行检验时,有各自相应的临界值。
表给出了三个模型所使用的ADF分布临界值表。
25
50
100
250
500
〉500
25
50
100
250
500
〉500
2
25
50
100
250
500
〉500
1
样本容量
统计量
模型
表: 不同模型使用的ADF分布临界值表
s
t
s
t
a
t
25
50
100
250
500
〉500
25
50
100
250
500
〉500
25
50
100
250
500
〉500
3
样本容量
统计量
模型
续表: 不同模型使用的ADF分布临界值表
s
t
a
t
b
t
同时估计出上述三个模型的适当形式,然后通过ADF临界值表检验零假设H0:=0。
1)只要其中有一个模型的检验结果拒绝了零假设,就可以认为时间序列是平稳的;
一个简单的检验过程:
2)当三个模型的检验结果都不能拒绝零假设时,则认为时间序列是非平稳的。
这里所谓模型适当的形式就是在每个模型中选取适当的滞后差分项,以使模型的残差项是一个白噪声(主要保证不存在自相关)。
例 检验1978~2000年间中国支出法GDP序列的平稳性。
1)经过偿试,模型3取了2阶滞后:
通过拉格朗日乘数检验(Lagrange multiplier test)对随机误差项的自相关性进行检验:
LM(1)=, LM(2)=,
小于5%显著性水平下自由度分别为1与2的2分布的临界值,可见不存在自相关性,因此该模型的设定是正确的。
从的系数看,t>临界值,不能拒绝存在单位根的零假设。
时间T的t统计量小于ADF分布表中的临界值,因此不能拒绝不存在趋势项的零假设。需进一步检验模型2 。
2)经试验,模型2中滞后项取2阶:
LM检验表明模型残差不存在自相关性,因此该模型的设定是正确的。
从GDPt-1的参数值看,其t统计量为正值,大于临界值,不能拒绝存在单位根的零假设。
常数项的t统计量小于AFD分布表中的临界值,不能拒绝不存常数项的零假设。需进一步检验模型1。
3)经试验,模型1中滞后项取2阶:
LM检验表明模型残差项不存在自相关性,因此模型的设定是正确的。
从GDPt-1的参数值看,其t统计量为正值,大于临界值,不能拒绝存在单位根的零假设。
可断定中国支出法GDP时间序列是非平稳的。
例 检验§中关于人均居民消费与人均国内生产总值这两时间序列的平稳性。
1) 对中国人均国内生产总值GDPPC来说,经过偿试,三个模型的适当形式分别为:
三个模型中参数的估计值的t统计量均大于各自的临界值,因此不能拒绝存在单位根的零假设。
结论:人均国内生产总值(GDPPC)是非平稳的。
2)对于人均居民消费CPC时间序列来说,三个模型的适当形式为 :
三个模型中参数CPCt-1的t统计量的值均比ADF临界值表中各自的临界值大,不能拒绝该时间序列存在单位根的假设,
因此,可判断人均居民消费序列CPC是非平稳的。
五、单整、趋势平稳与差分平稳随机过程
随机游走序列Xt=Xt-1+t经差分后等价地变形为 Xt=t, 由于t是一个白噪声,因此差分后的序列{Xt}是平稳的。
如果一个时间序列经过一次差分变成平稳的,就称原序列是一阶单整(integrated of 1)序列,记为I(1)。
⒈单整
一般地,如果一个时间序列经过d次差分后变成平稳序列,则称原序列是d 阶单整(integrated of d)序列,记为I(d)。
显然,I(0)代表一平稳时间序列。
现实经济生活中:
1)只有少数经济指标的时间序列表现为平稳的,如利率等;
2)大多数指标的时间序列是非平稳的,如一些价格指数常常是2阶单整的,以不变价格表示的消费额、收入等常表现为1阶单整。
大多数非平稳的时间序列一般可通过一次或多次差分的形式变为平稳的。
但也有一些时间序列,无论经过多少次差分,都不能变为平稳的。这种序列被称为非单整的(non-integrated)。
例 中国支出法GDP的单整性。
经过试算,发现中国支出法GDP是1阶单整的,适当的检验模型为:
例 中国人均居民消费与人均国内生产总值的单整性。
经过试算,发现中国人均国内生产总值GDPPC是2阶单整的,适当的检验模型为:
同样地,CPC也是2阶单整的,适当的检验模型为:
⒉ 趋势平稳与差分平稳随机过程
前文已指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联关系,这时对这些数据进行回归,尽管有较高的R2,但其结果是没有任何实际意义的。这种现象我们称之为虚假回归或伪回归(spurious regression)。
如:用中国的劳动力时间序列数据与美国GDP时间序列作回归,会得到较高的R2 ,但不能认为两者有直接的关联关系,而只不过它们有共同的趋势罢了,这种回归结果我们认为是虚假的。
为了避免这种虚假回归的产生,通常的做法是引入作为趋势变量的时间,这样包含有时间趋势变量的回归,可以消除这种趋势性的影响。
然而这种做法,只有当趋势性变量是确定性的(deterministic)而非随机性的(stochastic),才会是有效的。
换言之,如果一个包含有某种确定性趋势的非平稳时间序列,可以通过引入表示这一确定性趋势的趋势变量,而将确定性趋势分离出来。
1)如果=1,=0,则(*)式成为一带位移的随机游走过程:
Xt=+Xt-1+t (**)
根据的正负,Xt表现出明显的上升或下降趋势。这种趋势称为随机性趋势(stochastic trend)。
考虑如下的含有一阶自回归的随机过程:
Xt=+t+Xt-1+t (*)
其中:t是一白噪声,t为一时间趋势。
2)如果=0,0,则(*)式成为一带时间趋势的随机变化过程:
Xt=+t+t (***)
根据的正负,Xt表现出明显的上升或下降趋势。这种趋势称为确定性趋势(deterministic trend)。
3) 如果=1,0,则Xt包含有确定性与随机性两种趋势。
判断一个非平稳的时间序列,它的趋势是随机性的还是确定性的,可通过ADF检验中所用的第3个模型进行。
该模型中已引入了表示确定性趋势的时间变量t,即分离出了确定性趋势的影响。
因此:
(1)如果检验结果表明所给时间序列有单位根,且时间变量前的参数显著为零,则该序列显示出随机性趋势;
(2)如果没有单位根,且时间变量前的参数显著地异于零,则该序列显示出确定性趋势。
随机性趋势可通过差分的方法消除
例如:对式:
Xt=+Xt-1+t
可通过差分变换为:
Xt= +t
该时间序列称为差分平稳过程(difference stationary process);
确定性趋势无法通过差分的方法消除,而只能通过除去趋势项消除
例如:对式:
Xt=+t+t
可通过除去t变换为:
Xt -t =+t
该时间序列是平稳的,因此称为趋势平稳过程(trend stationary process)。
最后需要说明的是,趋势平稳过程代表了一个时间序列长期稳定的变化过程,因而用于进行长期预测则是更为可靠的。
§ 随机时间序列分析模型
一、时间序列模型的基本概念及其适用性
二、随机时间序列模型的平稳性条件
三、随机时间序列模型的识别
四、随机时间序列模型的估计
五、随机时间序列模型的检验
说明
经典计量经济学模型与时间序列模型
确定性时间序列模型与随机性时间序列模型
一、时间序列模型的基本概念及其适用性
1、时间序列模型的基本概念
随机时间序列模型(time series modeling)是指仅用它的过去值及随机扰动项所建立起来的模型,其一般形式为:
Xt=F(Xt-1, Xt-2, …, t)
建立具体的时间序列模型,需解决如下三个问题:
(1)模型的具体形式
(2)时序变量的滞后期
(3)随机扰动项的结构
例如,取线性方程、一期滞后以及白噪声随机扰动项( t =t),模型将是一个1阶自回归过程AR(1): Xt=Xt-1+ t,这里, t特指一白噪声。
一般的p阶自回归过程AR(p)是
Xt=1Xt-1+ 2Xt-2 + … + pXt-p + t (*)
(1)如果随机扰动项是一个白噪声(t=t),则称(*)式为一纯AR(p)过程(pure AR(p) process),记为:
Xt=1Xt-1+ 2Xt-2 + … + pXt-p +t
(2)如果t不是一个白噪声,通常认为它是一个q阶的移动平均(moving average)过程MA(q):
t=t - 1t-1 - 2t-2 - - qt-q
该式给出了一个纯MA(q)过程(pure MA(p) process)。
将纯AR(p)与纯MA(q)结合,得到一个一般的自回归移动平均(autoregressive moving average)过程ARMA(p,q):
Xt=1Xt-1+ 2Xt-2 + … + pXt-p + t - 1t-1 - 2t-2 - - qt-q
该式表明:
(1)一个随机时间序列可以通过一个自回归移动平均过程生成,即该序列可以由其自身的过去或滞后值以及随机扰动项来解释。
(2)如果该序列是平稳的,即它的行为并不会随着时间的推移而变化,那么我们就可以通过该序列过去的行为来预测未来。
这也正是随机时间序列分析模型的优势所在。
经典回归模型的问题:
迄今为止,对一个时间序列Xt的变动进行解释或预测,是通过某个单方程回归模型或联立方程回归模型进行的,由于它们以因果关系为基础,且具有一定的模型结构,因此也常称为结构式模型(structural model)。
2、时间序列分析模型的适用性
然而,如果Xt波动的主要原因可能是我们无法解释的因素,如气候、消费者偏好的变化等,则利用结构式模型来解释Xt的变动就比较困难或不可能,因为要取得相应的量化数据,并建立令人满意的回归模型是很困难的。
有时,即使能估计出一个较为满意的因果关系回归方程,但由于对某些解释变量未来值的预测本身就非常困难,甚至比预测被解释变量的未来值更困难,这时因果关系的回归模型及其预测技术就不适用了。
例如,时间序列过去是否有明显的增长趋势,如果增长趋势在过去的行为中占主导地位,能否认为它也会在未来的行为里占主导地位呢?
或者时间序列显示出循环周期性行为,我们能否利用过去的这种行为来外推它的未来走向?
另一条预测途径:通过时间序列的历史数据,得出关于其过去行为的有关结论,进而对时间序列未来行为进行推断。
随机时间序列分析模型,就是要通过序列过去的变化特征来预测未来的变化趋势。
使用时间序列分析模型的另一个原因在于:如果经济理论正确地阐释了现实经济结构,则这一结构可以写成类似于ARMA(p,q)式的时间序列分析模型的形式。
例如,对于如下最简单的宏观经济模型:
这里,Ct、It、Yt分别表示消费、投资与国民收入。
Ct与Yt作为内生变量,它们的运动是由作为外生变量的投资It的运动及随机扰动项t的变化决定的。
上述模型可作变形如下:
两个方程等式右边除去第一项外的剩余部分可看成一个综合性的随机扰动项,其特征依赖于投资项It的行为。
如果It是一个白噪声,则消费序列Ct就成为一个1阶自回归过程AR(1),而收入序列Yt就成为一个(1,1)阶的自回归移动平均过程ARMA(1,1)。
二、随机时间序列模型的平稳性条件
自回归移动平均模型(ARMA)是随机时间序列分析模型的普遍形式,自回归模型(AR)和移动平均模型(MA)是它的特殊情况。
关于这几类模型的研究,是时间序列分析的重点内容:主要包括模型的平稳性分析、模型的识别和模型的估计。
1、AR(p)模型的平稳性条件
随机时间序列模型的平稳性,可通过它所生成的随机时间序列的平稳性来判断。如果一个p阶自回归模型AR(p)生成的时间序列是平稳的,就说该AR(p)模型是平稳的。
否则,就说该AR(p)模型是非平稳的。
考虑p阶自回归模型AR(p)
Xt=1Xt-1+ 2Xt-2 + … + pXt-p +t (*)
引入滞后算子(lag operator )L:
LXt=Xt-1, L2Xt=Xt-2, …, LpXt=Xt-p
(*)式变换为:
(1-1L- 2L2-…-pLp)Xt=t
记(L)= (1-1L- 2L2-…-pLp),则称多项式方程:
(z)= (1-1z- 2z2-…-pzp)=0
为AR(p)的特征方程(characteristic equation)。
可以证明,如果该特征方程的所有根在单位圆外(根的模大于1),则AR(p)模型是平稳的。
例 AR(1)模型的平稳性条件。
对1阶自回归模型AR(1)
方程两边平方再求数学期望,得到Xt的方差:
由于Xt仅与t相关,因此,E(Xt-1t)=0。如果该模型稳定,则有E(Xt2)=E(Xt-12),从而上式可变换为:
而AR(1)的特征方程:
在稳定条件下,该方差是一非负的常数,从而有 ||<1。
的根为: z=1/
AR(1)稳定,即 || <1,意味着特征根大于1。
又由于:
例 AR(2)模型的平稳性。
对AR(2)模型:
方程两边同乘以Xt,再取期望得:
于是:
同样地,由原式还可得到:
于是方差为 :
由平稳性的定义,该方差必须是一不变的正数,于是有 1+2<1, 2-1<1, |2|<1
这就是AR(2)的平稳性条件,或称为平稳域。它是一顶点分别为(-2,-1),(2,-1),(0,1)的三角形。
对应的特征方程1-1z-2z2=0 的两个根z1、z2满足:
z1z2=-1/2 , z1+z2 =-1/2
AR(2)模型:
解出1,2:
由AR(2)的平稳性,|2|=1/|z1||z2|<1 ,则至少有一个根的模大于1,不妨设|z1|>1,有:
于是| z2 |>1。由 2 - 1 <1可推出同样的结果。
对高阶自回模型AR(p)来说,多数情况下没有必要直接计算其特征方程的特征根,但有一些有用的规则可用来检验高阶自回归模型的稳定性:
(1)AR(p)模型稳定的必要条件是:
1+2++p<1
(2)由于i(i=1,2,p)可正可负,AR(p)模型稳定的充分条件是:
|1|+|2|++|p|<1
对于移动平均模型MR(q):
Xt=t - 1t-1 - 2t-2 - - qt-q
其中t是一个白噪声,于是:
2、MA(q)模型的平稳性
当滞后期大于q时,Xt的自协方差系数为0。
因此:有限阶移动平均模型总是平稳的。
由于ARMA (p,q)模型是AR(p)模型与MA(q)模型的组合:
Xt=1Xt-1+ 2Xt-2 + … + pXt-p + t - 1t-1 - 2t-2 - - qt-q
3、ARMA(p,q)模型的平稳性
而MA(q)模型总是平稳的,因此ARMA (p,q)模型的平稳性取决于AR(p)部分的平稳性。
当AR(p)部分平稳时,则该ARMA(p,q)模型是平稳的,否则,不是平稳的。
4、总结
(1)一个平稳的时间序列总可以找到生成它的平稳的随机过程或模型;
(2)一个非平稳的随机时间序列通常可以通过差分的方法将它变换为平稳的,对差分后平稳的时间序列也可找出对应的平稳随机过程或模型。
因此,如果我们将一个非平稳时间序列通过d次差分,将它变为平稳的,然后用一个平稳的ARMA(p,q)模型作为它的生成模型,则我们就说该原始时间序列是一个自回归单整移动平均(autoregressive integrated moving average)时间序列,记为ARIMA(p,d,q)。
例如,一个ARIMA(2,1,2)时间序列在它成为平稳序列之前先得差分一次,然后用一个ARMA(2,2)模型作为它的生成模型的。
当然,一个ARIMA(p,0,0)过程表示了一个纯AR(p)平稳过程;一个ARIMA(0,0,q)表示一个纯MA(q)平稳过程。
三、随机时间序列模型的识别
所谓随机时间序列模型的识别,就是对于一个平稳的随机时间序列,找出生成它的合适的随机过程或模型,即判断该时间序列是遵循一纯AR过程、还是遵循一纯MA过程或ARMA过程。
所使用的工具主要是时间序列的自相关函数(autocorrelation function,ACF)及偏自相关函数(partial autocorrelation function, PACF )。
1、AR(p)过程
(1)自相关函数ACF
1阶自回归模型AR(1):
Xt=Xt-1+ t
的k阶滞后自协方差为:
=1,2,…
因此,AR(1)模型的自相关函数为:
=1,2,…
由AR(1)的稳定性知||<1,因此,k时,呈指数形衰减,直到零。这种现象称为拖尾或称AR(1)有无穷记忆(infinite memory)。
注意, <0时,呈振荡衰减状。
Xt=1Xt-1+ 2Xt-2 + t
该模型的方差0以及滞后1期与2期的自协方差1, 2分别为:
2阶自回归模型AR(2)
类似地,可写出一般的k期滞后自协方差:
(K=2,3,…)
于是,AR(2)的k 阶自相关函数为:
(K=2,3,…)
其中 :1=1/(1-2), 0=1
如果AR(2)稳定,则由1+2<1知|k|衰减趋于零,呈拖尾状。
至于衰减的形式,要看AR(2)特征根的实虚性,若为实根,则呈单调或振荡型衰减,若为虚根,则呈正弦波型衰减。
一般地,p阶自回归模型AR(p):
Xt=1Xt-1+ 2Xt-2 +… pXt-p + t
k期滞后协方差为:
从而有自相关函数 :
可见,无论k有多大, k的计算均与其1到p阶滞后的自相关函数有关,因此呈拖尾状。
如果AR(p)是稳定的,则|k|递减且趋于零。
事实上,自相关函数:
是一p阶差分方程,其通解为:
其中:1/zi是AR(p)特征方程(z)=0的特征根,由AR(p)平稳的条件知,|zi|<1;
因此,
当1/zi均为实数根时,k呈几何型衰减(单调或振荡);
当存在虚数根时,则一对共扼复根构成通解中的一个阻尼正弦波项, k呈正弦波衰减。
(2)偏自相关函数
自相关函数ACF(k)给出了Xt与Xt-1的总体相关性,但总体相关性可能掩盖了变量间完全不同的隐含关系。
例如,在AR(1)随机过程中,Xt与Xt-2间有相关性可能主要是由于它们各自与Xt-1间的相关性带来的:
即自相关函数中包含了这种所有的“间接”相关。
与之相反,Xt与Xt-k间的偏自相关函数(partial autocorrelation,简记为PACF)则是消除了中间变量Xt-1,…,Xt-k+1 带来的间接相关后的直接相关性,它是在已知序列值Xt-1,…,Xt-k+1的条件下,Xt与Xt-k间关系的度量。
从Xt中去掉Xt-1的影响,则只剩下随机扰动项t,显然它与Xt-2无关,因此我们说Xt与Xt-2的偏自相关系数为零,记为:
在AR(1)中,
同样地,在AR(p)过程中,对所有的k>p,Xt与Xt-k间的偏自相关系数为零。
AR(p)的一个主要特征是:k>p时,k*=Corr(Xt,Xt-k)=0
即k*在p以后是截尾的。
一随机时间序列的识别原则:
若Xt的偏自相关函数在p以后截尾,即k>p时,k*=0,而它的自相关函数k是拖尾的,则此序列是自回归AR(p)序列。
在实际识别时,由于样本偏自相关函数rk*是总体偏自相关函数k*的一个估计,由于样本的随机性,当k>p时,rk*不会全为0,而是在0的上下波动。但可以证明,当k>p时,rk*服从如下渐近正态分布:
rk*~N(0,1/n)
式中n表示样本容量。
需指出的是,
我们就有%的把握判断原时间序列在p之后截尾。
因此,如果计算的rk*满足:
对MA(1)过程:
2、MA(q)过程
可容易地写出它的自协方差系数:
于是,MA(1)过程的自相关函数为:
可见,当k>1时,k>0,即Xt与Xt-k不相关,MA(1)自相关函数是截尾的。
MA(1)过程可以等价地写成t关于无穷序列Xt,Xt-1,…的线性组合的形式:
或:
(*)
(*)是一个AR()过程,它的偏自相关函数非截尾但却趋于零,因此MA(1)的偏自相关函数是非截尾但却趋于零的。
注意:
(*)式只有当||<1时才有意义,否则意味着距Xt越远的X值,对Xt的影响越大,显然不符合常理。
因此,我们把||<1称为MA(1)的可逆性条件(invertibility condition)或可逆域。
其自协方差系数为:
一般地,q阶移动平均过程MA(q)
相应的自相关函数为:
与MA(1)相仿,可以验证MA(q)过程的偏自相关函数是非截尾但趋于零的。
可见,当k>q时, Xt与Xt-k不相关,即存在截尾现象,因此,当k>q时, k=0是MA(q)的一个特征。
于是:可以根据自相关系数是否从某一点开始一直为0来判断MA(q)模型的阶。
MA(q)模型的识别规则:若随机序列的自相关函数截尾,即自q以后,k=0( k>q);而它的偏自相关函数是拖尾的,则此序列是滑动平均MA(q)序列。
同样需要注意的是:在实际识别时,由于样本自相关函数rk是总体自相关函数k的一个估计,由于样本的随机性,当k>q时,rk不会全为0,而是在0的上下波动。但可以证明,当k>q时,rk服从如下渐近正态分布:
rk~N(0,1/n)
式中n表示样本容量。
因此,如果计算的rk满足:
我们就有%的把握判断原时间序列在q之后截尾。
ARMA(p,q)的自相关函数,可以看作MA(q)的自相关函数和AR(p)的自相关函数的混合物。
当p=0时,它具有截尾性质;
当q=0时,它具有拖尾性质;
当p、q都不为0时,它具有拖尾性质
3、ARMA(p, q)过程
从识别上看,通常:
ARMA(p,q)过程的偏自相关函数(PACF)可能在p阶滞后前有几项明显的尖柱(spikes),但从p阶滞后项开始逐渐趋向于零;
而它的自相关函数(ACF)则是在q阶滞后前有几项明显的尖柱,从q阶滞后项开始逐渐趋向于零。
四、随机时间序列模型的估计
AR(p)、MA(q)、ARMA(p,q)模型的估计方法较多,大体上分为3类:
(1)最小二乘估计;
(2)矩估计;
(3)利用自相关函数的直接估计。
下面有选择地加以介绍。
结构
阶数
模型
识别
确定
估计
参数
⒈ AR(p)模型的Yule Walker方程估计
在AR(p)模型的识别中,曾得到:
利用k=-k,得到如下方程组:
利用实际时间序列提供的信息,首先求得自相关函数的估计值:
此方程组被称为Yule Walker方程组。该方程组建立了AR(p)模型的模型参数1,2,,p与自相关函数1,2,,p的关系,
然后利用Yule Walker方程组,求解模型参数的估计值:
由于:
于是,
从而可得2的估计值
在具体计算时,
可用样本自相关函数rk替代。
⒉ MA(q)模型的矩估计
将MA(q)模型的自协方差函数中的各个量用估计量代替,得到:
(*)
首先求得自协方差函数的估计值,(*)是一个包含(q+1)个待估参数
的非线性方程组,可以用直接法或迭代法求解。
常用的迭代方法有线性迭代法和Newton-Raphsan迭代法。
(1)MA(1)模型的直接算法
对于MA(1)模型,(*)式相应地写成:
于是:
或:
有:
于是有解:
由于参数估计有两组解,可根据可逆性条件|1|<1来判断选取一组。
(2)MA(q)模型的迭代算法
对于q>1的MA(q)模型,一般用迭代算法估计参数:
由(*)式得
(**)
第一步,给出
的一组初值,比如,
代入(**)式,计算出第一次迭代值 ,
第二步,将第一次迭代值代入(**)式,计算出第二次迭代值
按此反复迭代下去,直到第m步的迭代值与第m-1步的迭代值相差不大时(满足一定的精度),便停止迭代,并用第m步的迭代结果作为(**)的近似解。
⒊ ARMA(p,q)模型的矩估计
在ARMA(p,q)中共有(p+q+1)个待估参数1,2,,p与1,2,,q以及2,其估计量计算步骤及公式如下:
第一步,估计1,2,,p
是总体自相关函数的估计值,可用样本自相关函数rk代替。
第二步,改写模型,求1,2,,q以及2的估计值
将模型:
改写为:
令,
于是(*)可以写成:
(*)
构成一个MA模型。按照估计MA模型参数的方法,可以得到1,2,,q以及2的估计值。
⒋ AR(p)的最小二乘估计
假设模型AR(p)的参数估计值已经得到,即有,
残差的平方和为:
(*)
根据最小二乘原理,所要求的参数估计值是下列方程组的解:
即 ,
j=1,2,…,p (**)
解该方程组,就可得到待估参数的估计值。
为了与AR(p)模型的Yule Walker方程估计进行比较,将(**)改写成:
j=1,2,…,p
由自协方差函数的定义,并用自协方差函数的估计值 。
代入,上式表示的方程组即为:
或 ,
j=1,2,…,p
j=1,2,…,p
解该方程组,得到:
即为参数的最小二乘估计。
Yule Walker方程组的解:
需要说明的是,在上述模型的平稳性、识别与估计的讨论中,ARMA(p,q)模型中均未包含常数项。
如果包含常数项,该常数项并不影响模型的原有性质,因为通过适当的变形,可将包含常数项的模型转换为不含常数项的模型。
比较发现,当n足够大时,二者是相似的。 2的估计值为:
下面以一般的ARMA(p,q)模型为例说明。
对含有常数项的模型 :
方程两边同减/(1-1--p),则可得到:
其中,
五、模型的检验
由于ARMA(p,q)模型的识别与估计是在假设随机扰动项是一白噪声的基础上进行的,因此,如果估计的模型确认正确的话,残差应代表一白噪声序列。
如果通过所估计的模型计算的样本残差不代表一白噪声,则说明模型的识别与估计有误,需重新识别与估计。
在实际检验时,主要检验残差序列是否存在自相关。
1、残差项的白噪声检验
可用QLB的统计量进行2检验:在给定显著性水平下,可计算不同滞后期的QLB值,通过与2分布表中的相应临界值比较,来检验是否拒绝残差序列为白噪声的假设。
若大于相应临界值,则应拒绝所估计的模型,需重新识别与估计。
2、AIC与SBC模型选择标准
另外一个遇到的问题是,在实际识别ARMA(p,q)模型时,需多次反复偿试,有可能存在不止一组(p,q)值都能通过识别检验。
显然,增加p与q的阶数,可增加拟合优度,但却同时降低了自由度。
因此,对可能的适当的模型,存在着模型的“简洁性”与模型的拟合优度的权衡选择问题。
其中,n为待估参数个数(p+q+可能存在的常数项),T为可使用的观测值,RSS为残差平方和(Residual sum of squares)。
常用的模型选择的判别标准有:赤池信息法(Akaike information criterion,简记为AIC)与施瓦兹贝叶斯法(Schwartz Bayesian criterion,简记为SBC):
在选择可能的模型时,AIC与SBC越小越好
显然,如果添加的滞后项没有解释能力,则对RSS值的减小没有多大帮助,却增加待估参数的个数,因此使得AIC或SBC的值增加。
需注意的是:在不同模型间进行比较时,必须选取相同的时间段。
由第一节知:中国支出法GDP是非平稳的,但它的一阶差分是平稳的,即支出法GDP是I(1)时间序列。
可以对经过一阶差分后的GDP建立适当的ARMA(p,q)模型。
记GDP经一阶差分后的新序列为GDPD1,该新序列的样本自相关函数图与偏自相关函数图如下:
例 中国支出法GDP的ARMA(p,q)模型估计
图形:样本自相关函数图形呈正弦线型衰减波,而偏自相关函数图形则在滞后两期后迅速趋于0。因此可初步判断该序列满足2阶自回归过程AR(2)。
自相关函数与偏自相关函数的函数值:
相关函数具有明显的拖尾性;
偏自相关函数值在k>2以后,
可认为:偏自相关函数是截尾的。再次验证了一阶差分后的GDP满足AR(2)随机过程。
设序列GDPD1的模型形式为:
有如下Yule Walker 方程:
解为:
有时,在用回归法时,也可加入常数项。
本例中加入常数项的回归为:
用OLS法回归的结果为:
() ()
r2= R2= DW=
() () ()
r2 = R2 = DW.=
模型检验
下表列出三模型的残差项的自相关系数及QLB检验值。
模型1与模型3的残差项接近于一白噪声,但模型2存在4阶滞后相关问题,Q统计量的检验也得出模型2拒绝所有自相关系数为零的假设。因此:
模型1与3可作为描述中国支出法GDP一阶差分序列的随机生成过程。
用建立的AR(2)模型对中国支出法GDP进行外推预测。
模型1可作如下展开:
于是,当已知t-1、t-2、t-3期的GDP时,就可对第t期的GDP作出外推预测。
对2001年中国支出法GDP的预测结果(亿元)
预测值 实际值 误差
模型1 95469 95933 %
模型3 97160 95933 %
模型3的预测式与此相类似,只不过多出一项常数项。
由于中国人均居民消费(CPC)与人均国内生产总值(GDPPC)这两时间序列是非平稳的,因此不宜直接建立它们的因果关系回归方程。
但它们都是I(2)时间序列,因此可以建立它们的ARIMA(p,d,q)模型。
例 中国人均居民消费的ARMA(p,q)模型
下面只建立中国人均居民消费(CPC)的随机时间序列模型。
中国人均居民消费(CPC)经过二次差分后的新序列记为CPCD2,其自相关函数、偏自相关函数及Q统计量的值列于下表:
在5%的显著性水平下,通过Q统计量容易验证该序列本身就接近于一白噪声,因此可考虑采用零阶MA(0)模型:
由于k=2时,|r2|=||>
因此,也可考虑采用下面的MA模型:
当然,还可观察到自相关函数在滞后4、5、8时有大于的函数值,因此,可考虑在模型中增加MA(4)、MA(5)、MA(8)。不同模型的回归结果列于表。
可以看出:在纯MA模型中,模型4具有较好的性质,但由于MA(5)的t检验偏小,因此可选取模型3。
最后,给出通过模型3的外推预测。
模型3的展开式为:
即 ,
由于t表示预测期的随机扰动项,它未知,可假设为0,于是t期的预测式为:
为模型3中滞后2期与滞后4期的相应残差项的估计值。
表列出了采用模型3对中国居民人均居民消费水平的2期外推预测。
为了对照,表中也同时列出了采用§的模型的预测结果。
§ 协整与误差修正模型
一、长期均衡关系与协整
二、协整检验
三、误差修正模型
一、长期均衡关系与协整
1. 问题的提出
经典回归模型(classical regression model)是建立在稳定数据变量基础上的,对于非稳定变量,不能使用经典回归模型,否则会出现虚假回归等诸多问题。
由于许多经济变量是非稳定的,这就给经典的回归分析方法带来了很大限制。
但是,如果变量之间有着长期的稳定关系,即它们之间是协整的(cointegration),则是可以使用经典回归模型方法建立回归模型的。
例如,中国居民人均消费水平与人均GDP变量的例子中, 因果关系回归模型要比ARMA模型有更好的预测功能,其原因在于,从经济理论上说,人均GDP决定着居民人均消费水平,而且它们之间有着长期的稳定关系,即它们之间是协整的。
经济理论指出,某些经济变量间确实存在着长期均衡关系,这种均衡关系意味着经济系统不存在破坏均衡的内在机制,如果变量在某时期受到干扰后偏离其长期均衡点,则均衡机制将会在下一期进行调整以使其重新回到均衡状态。
假设X与Y间的长期“均衡关系”由式描述:
2. 长期均衡
式中:t是随机扰动项。
该均衡关系意味着:给定X的一个值,Y相应的均衡值也随之确定为0+1X。
在t-1期末,存在下述三种情形之一:
(1)Y等于它的均衡值:Yt-1= 0+1Xt ;
(2)Y小于它的均衡值:Yt-1< 0+1Xt ;
(3)Y大于它的均衡值:Yt-1> 0+1Xt ;
在时期t,假设X有一个变化量Xt,如果变量X与Y在时期t与t-1末期仍满足它们间的长期均衡关系,则Y的相应变化量由式给出:
式中,vt=t-t-1。
实际情况往往并非如此
如果t-1期末,发生了上述第二种情况,即Y的值小于其均衡值,则Y的变化往往会比第一种情形下Y的变化Yt大一些;
反之,如果Y的值大于其均衡值,则Y的变化往往会小于第一种情形下的Yt 。
可见,如果Yt=0+1Xt+t正确地提示了X与Y间的长期稳定的“均衡关系”,则意味着Y对其均衡点的偏离从本质上说是“临时性”的。
因此,一个重要的假设就是:随机扰动项t必须是平稳序列。
显然,如果t有随机性趋势(上升或下降),则会导致Y对其均衡点的任何偏离都会被长期累积下来而不能被消除。
式Yt=0+1Xt+t中的随机扰动项也被称为非均衡误差(disequilibrium error),它是变量X与Y的一个线性组合:
(*)
因此,如果Yt=0+1Xt+t式所示的X与Y间的长期均衡关系正确的话,(*)式表述的非均衡误差应是一平稳时间序列,并且具有零期望值,即是具有0均值的I(0)序列。
从这里已看到,非稳定的时间序列,它们的线性组合也可能成为平稳的。
假设Yt=0+1Xt+t式中的X与Y是I(1)序列,如果该式所表述的它们间的长期均衡关系成立的话,则意味着由非均衡误差(*)式给出的线性组合是I(0)序列。这时我们称变量X与Y是协整的(cointegrated)。
如果序列{X1t,X2t,…,Xkt}都是d阶单整,存在向量: =(1,2,…,k),使得:
Zt= XT ~ I(d-b)
其中,b>0,X=(X1t,X2t,…,Xkt)T,则认为序列{X1t,X2t,…,Xkt}是(d,b)阶协整,记为Xt~CI(d,b),为协整向量(cointegrated vector)。
3.协整
在中国居民人均消费与人均GDP的例中,该两序列都是2阶单整序列,而且可以证明它们有一个线性组合构成的新序列为0阶单整序列,于是认为该两序列是(2,2)阶协整。
由此可见:如果两个变量都是单整变量,只有当它们的单整阶数相同时,才可能协整;如果它们的单整阶数不相同,就不可能协整。
三个以上的变量,如果具有不同的单整阶数,有可能经过线性组合构成低阶单整变量。
例如,如果存在:
并且,
那么认为:
(d,d)阶协整是一类非常重要的协整关系,它的经济意义在于:两个变量,虽然它们具有各自的长期波动规律,但是如果它们是(d,d)阶协整的,则它们之间存在着一个长期稳定的比例关系。
例如:前面提到的中国CPC和GDPPC,它们各自都是2阶单整,并且将会看到,它们是(2,2)阶协整,说明它们之间存在着一个长期稳定的比例关系,从计量经济学模型的意义上讲,建立如下居民人均消费函数模型:
从协整的定义可以看出:
变量选择是合理的,随机误差项一定是“白噪声”(即均值为0,方差不变的稳定随机序列),模型参数有合理的经济解释。
这也解释了尽管这两时间序列是非稳定的,但却可以用经典的回归分析方法建立回归模型的原因。
从这里,我们已经初步认识到:检验变量之间的协整关系,在建立计量经济学模型中是非常重要的。
而且,从变量之间是否具有协整关系出发选择模型的变量,其数据基础是牢固的,其统计性质是优良的。
二、协整检验
1.两变量的Engle-Granger检验
为了检验两变量Yt,Xt是否为协整,Engle和Granger于1987年提出两步检验法,也称为EG检验。
第一步,用OLS方法估计方程: Yt=0+1Xt+t
并计算非均衡误差,得到:
的单整性的检验方法仍然是DF检验或者ADF检验。
由于协整回归中已含有截距项,则检验模型中无需再用截距项。如使用模型1
称为协整回归(cointegrating)或静态回归(static regression)。
进行检验时,拒绝零假设H0:=0,意味着误差项et是平稳序列,从而说明X与Y间是协整的。
需要注意是,这里的DF或ADF检验是针对协整回归计算出的误差项,而非真正的非均衡误差t进行的。
而OLS法采用了残差最小平方和原理,因此估计量是向下偏倚的,这样将导致拒绝零假设的机会比实际情形大。
于是对et平稳性检验的DF与ADF临界值应该比正常的DF与ADF临界值还要小。
MacKinnon(1991)通过模拟试验给出了协整检验的临界值,表是双变量情形下不同样本容量的临界值。
例 检验中国居民人均消费水平CPC与人均国内生产总值GDPPC的协整关系。
在前文已知CPC与GDPPC都是I(2)序列,而§中已给出了它们的回归式:
R2=
通过对该式计算的残差序列作ADF检验,得适当检验模型
() () ()
LM(1)= LM(2)=
t=<=,拒绝存在单位根的假设,残差项是稳定的,因此中国居民人均消费水平与人均GDP是(2,2)阶协整的,说明了该两变量间存在长期稳定的“均衡”关系。
2.多变量协整关系的检验—扩展的E-G检验
多变量协整关系的检验要比双变量复杂一些,主要在于协整变量间可能存在多种稳定的线性组合。
假设有4个I(1)变量Z、X、Y、W,它们有如下的长期均衡关系:
(*)
其中,非均衡误差项t应是I(0)序列:
(**)
然而,如果Z与W,X与Y间分别存在长期均衡关系:
则非均衡误差项v1t、v2t一定是稳定序列I(0)。于是它们的任意线性组合也是稳定的。例如:
(***)
一定是I(0)序列。
由于vt象(**)式中的t一样,也是Z、X、Y、W四个变量的线性组合,由此(***)式也成为该四变量的另一稳定线性组合。
(1, -0,-1,-2,-3)是对应于(**)式的协整向量,(1,-0-0,-1,1,-1)是对应于(***)式的协整向量。
对于多变量的协整检验过程,基本与双变量情形相同,即需检验变量是否具有同阶单整性,以及是否存在稳定的线性组合。
在检验是否存在稳定的线性组合时,需通过设置一个变量为被解释变量,其他变量为解释变量,进行OLS估计并检验残差序列是否平稳。
检验程序:
同样地,检验残差项是否平稳的DF与ADF检验临界值要比通常的DF与ADF检验临界值小,而且该临界值还受到所检验的变量个数的影响。
如果不平稳,则需更换被解释变量,进行同样的OLS估计及相应的残差项检验。
当所有的变量都被作为被解释变量检验之后,仍不能得到平稳的残差项序列,则认为这些变量间不存在(d,d)阶协整。
表给出了MacKinnon(1991)通过模拟试验得到的不同变量协整检验的临界值。
3、多变量协整关系的检验—JJ检验
Johansen于1988年,以及与Juselius于1990年提出了一种用极大或然法进行检验的方法,通常称为JJ检验。
《高等计量经济学》(清华大学出版社,2000年9月)P279-282.
E-views中有JJ检验的功能。
三、误差修正模型
前文已经提到,对于非稳定时间序列,可通过差分的方法将其化为稳定序列,然后才可建立经典的回归分析模型。
例如:建立人均消费水平(Y)与人均可支配收入(X)之间的回归模型:
1、误差修正模型
式中, vt= t- t-1
差分
X,Y
成为
平稳
序列
建立差分回归模型
如果Y与X
具有共同的
向上或向下
的变化趋势
然而,这种做法会引起两个问题:
(1)如果X与Y间存在着长期稳定的均衡关系:
Yt=0+1Xt+t
且误差项t不存在序列相关,则差分式:
Yt=1Xt+t
中的t是一个一阶移动平均时间序列,因而是序列相关的;
(2)如果采用差分形式进行估计,则关于变量水平值的重要信息将被忽略,这时模型只表达了X与Y间的短期关系,而没有揭示它们间的长期关系。
因为,从长期均衡的观点看,Y在第t期的变化不仅取决于X本身的变化,还取决于X与Y在t-1期末的状态,尤其是X与Y在t-1期的不平衡程度。
例如,使用Yt=1Xt+t回归时,很少出现截距项显著为零的情况,即我们常常会得到如下形式的方程:
在X保持不变时,如果模型存在静态均衡(static equilibrium),Y也会保持它的长期均衡值不变。
(*)
但如果使用(*)式,即使X保持不变,Y也会处于长期上升或下降的过程中(Why?),这意味着X与Y间不存在静态均衡。
这与大多数具有静态均衡的经济理论假说不相符。
可见,简单差分不一定能解决非平稳时间序列所遇到的全部问题,因此,误差修正模型便应运而生。
误差修正模型(Error Correction Model,简记为ECM)是一种具有特定形式的计量经济学模型,它的主要形式是由Davidson、 Hendry、Srba和Yeo于1978年提出的,称为DHSY模型。
通过一个具体的模型来介绍它的结构。
假设两变量X与Y的长期均衡关系为:
Yt=0+1Xt+t
该模型显示出第t期的Y值,不仅与X的变化有关,而且与t-1期X与Y的状态值有关。
由于现实经济中X与Y很少处在均衡点上,因此实际观测到的只是X与Y间的短期的或非均衡的关系,假设具有如下(1,1)阶分布滞后形式:
由于变量可能是非平稳的,因此不能直接运用OLS法。对上述分布滞后模型适当变形得:
或,
式中,
(**)
如果将(**)中的参数,与Yt=0+1Xt+t中的相应参数视为相等,则(**)式中括号内的项就是t-1期的非均衡误差项。
(**)式表明:Y的变化决定于X的变化以及前一时期的非均衡程度。同时,(**)式也弥补了简单差分模型Yt=1Xt+t的不足,因为该式含有用X、Y水平值表示的前期非均衡程度。因此,Y的值已对前期的非均衡程度作出了修正。
称为一阶误差修正模型(first-order error correction model)。
(**)式可以写成:
(**)
(***)
其中:ecm表示误差修正项。由分布滞后模型:
知,一般情况下||<1 ,由关系式=1-得:0<<1。可以据此分析ecm的修正作用:
(1)若(t-1)时刻Y大于其长期均衡解0+1X,ecm为正,则(-ecm)为负,使得Yt减少;
(2)若(t-1)时刻Y小于其长期均衡解0+1X ,ecm为负,则(-ecm)为正,使得Yt增大。
(***)体现了长期非均衡误差对的控制。
其主要原因在于变量对数的差分近似地等于该变量的变化率,而经济变量的变化率常常是稳定序列,因此适合于包含在经典回归方程中。
需要注意的是:在实际分析中,变量常以对数的形式出现。
于是: (1)长期均衡模型
Yt=0+1Xt+t
中的1可视为Y关于X的长期弹性(long-run elasticity)
(2)短期非均衡模型
Yt=0+1Xt+2Xt-1+Yt-1+t
中的1可视为Y关于X的短期弹性(short-run elasticity)。
如具有季度数据的变量,可在短期非均衡模型:
Yt=0+1Xt+2Xt-1+Yt-1+t
中引入更多的滞后项。
更复杂的误差修正模型可依照一阶误差修正模型类似地建立。
引入二阶滞后的模型为:
经过适当的衡等变形,可得如下二阶误差修正模型:
(*)
引入三阶滞后项的误差修正模型与(*)式相仿,只不过模型中多出差分滞后项Yt-2,Xt-2,。
多变量的误差修正模型也可类似地建立。
如三个变量如果存在如下长期均衡关系:
则其一阶非均衡关系可写成:
于是它的一个误差修正模型为:
(1)Granger 表述定理
误差修正模型有许多明显的优点:如:
a)一阶差分项的使用消除了变量可能存在的趋势因素,从而避免了虚假回归问题;
b)一阶差分项的使用也消除模型可能存在的多重共线性问题;
2、误差修正模型的建立
c)误差修正项的引入保证了变量水平值的信息没有被忽视;
d)由于误差修正项本身的平稳性,使得该模型可以用经典的回归方法进行估计,尤其是模型中差分项可以使用通常的t检验与F检验来进行选取;等等。
因此,一个重要的问题就是:是否变量间的关系都可以通过误差修正模型来表述?
如果变量X与Y是协整的,则它们间的短期非均衡关系总能由一个误差修正模型表述:
0<<1
(*)
式中,t-1是非均衡误差项或者说成是长期均衡偏差项, 是短期调整参数。
Engle 与 Granger 1987年提出了著名的Grange表述定理(Granger representaion theorem):
对于(1,1)阶自回归分布滞后模型: Yt=0+1Xt+2Xt-1+Yt-1+t
如果 Yt~I(1), Xt~I(1) ; 那么,
的左边Yt ~I(0) ,右边的Xt ~I(0) ,因此,只有Y与X协整,才能保证右边也是I(0)。
首先对变量进行协整分析,以发现变量之间的协整关系,即长期均衡关系,并以这种关系构成误差修正项。
然后建立短期模型,将误差修正项看作一个解释变量,连同其他反映短期波动的解释变量一起,建立短期模型,即误差修正模型。
因此,建立误差修正模型,需要:
注意,由于,
Y=lagged(Y, X)+ t-1 +t 0<<1
中没有明确指出Y与X的滞后项数,因此,可以是多个;同时,由于一阶差分项是I(0)变量,因此模型中也允许使用X的非滞后差分项Xt 。
Granger表述定理可类似地推广到多个变量的情形中去。
由协整与误差修正模型的的关系,可以得到误差修正模型建立的E-G两步法:
第一步,进行协整回归(OLS法),检验变量间的协整关系,估计协整向量(长期均衡关系参数);
第二步,若协整性存在,则以第一步求到的残差作为非均衡误差项加入到误差修正模型中,并用OLS法估计相应参数。
(2)Engle-Granger两步法
需要注意的是:在进行变量间的协整检验时,如有必要可在协整回归式中加入趋势项,这时,对残差项的稳定性检验就无须再设趋势项。
另外,第二步中变量差分滞后项的多少,可以残差项序列是否存在自相关性来判断,如果存在自相关,则应加入变量差分的滞后项。
(3)直接估计法
也可以采用打开误差修整模型中非均衡误差项括号的方法直接用OLS法估计模型。
但仍需事先对变量间的协整关系进行检验。如对双变量误差修正模型:
可打开非均衡误差项的括号直接估计下式:
这时短期弹性与长期弹性可一并获得。
需注意的是,用不同方法建立的误差修正模型结果也往往不一样。
经济理论指出,居民消费支出是其实际收入的函数。
以中国国民核算中的居民消费支出经过居民消费价格指数缩减得到中国居民实际消费支出时间序列(C);
以支出法GDP对居民消费价格指数缩减近似地代表国民收入时间序列(GDP)。
时间段为1978—2000(表)
例 中国居民消费的误差修正模型
(1)对数据lnC与lnGDP进行单整检验
容易验证lnC与lnGDP是一阶单整的,它们适合的检验模型如下:
()() () () ()
LM(1)= LM(2)= LM(3)= LM(4)=
首先,建立lnC与lnGDP的回归模型:
(2)检验lnC与lnGDP的协整性,并建立长期均衡关系
() ()
R2= DW=
发现有残关项有较强的一阶自相关性。考虑加入适当的滞后项,得lnC与lnGDP的分布滞后模型:
() () () ()
R2= DW= LM(1)= LM(2)=
自相关性消除,因此可初步认为是lnC与lnGDP的长期稳定关系。
(*)
残差项的稳定性检验:
()
R2= DW= LM(1)= LM(2)=
t=<=
说明lnC与lnGDP是(1,1)阶协整的,(*)式即为它们长期稳定的均衡关系:
(*)
以稳定的时间序列
如下:
(3)建立误差修正模型
做为误差修正项,可建立
误差修正模型:
() () () ()
R2= DW= LM(1)= LM(2)=
(**)
用打开误差修正项括号的方法直接估计误差修正模型,适当估计式为:
可得lnC关于lnGDP的长期弹性:
()/()=;
由(**)式可得lnC关于lnGDP的短期弹性:
由(*)式:
() () () ()
R2= = DW= LM(2)= LM(3)=
写成误差修正模型的形式如下:
(***)
由(***)式知,lnC关于lnGDP的短期弹性为,长期弹性为。
可见两种方法的结果非常接近。
(4)预测
由(*)式:
给出1998年关于长期均衡点的偏差:
=ln(18230)(39008)(17072)
+(36684)=
由(**)式:
预测1999年的短期波动:
lnC99=(ln(41400)-ln(39008))+(ln(18230)-ln(17072))(ln(39008)-ln(36684))×=
于是:
按照(*** )式:
预测的结果为:
lnC99=(ln(41400)-ln(39008))(ln(18230)(39008))=
以当年价计的1999年实际居民消费支出为39334亿元,用居民消费价格指数(1990=100)紧缩后约为19697亿元,两个预测结果的相对误差分别为%与%。
于是: