智库文档所有分类

计量经济学教案（河北经贸大学）.doc

下载

用户#349

144页 | 4.45MB | 4次下载 |

4.7

(6人评价)

我要评价：

投诉举报

用手机看文档

扫一扫,手机看文档

下载

开通VIP

计量经济学教案河北经贸大学应用经济学教研室 2006年5月目录绪论 ……………………………………………………………………………………1 计量经济学………………………………………………………………………………1 计量经济学方法论………………………………………………………………………2 一元线性回归模型……………………………………………………………………7 回归分析概述……………………………………………………………………………7 一元线性回归模型………………………………………………………………………12 多元线性回归模型…………………………………………………………………… 30 多元线性回归模型………………………………………………………………………30 多元线性回归模型的统计检验…………………………………………………………39 多元线性回归模型的置信区间…………………………………………………………43 异方差性………………………………………………………………………………49 异方差的概念……………………………………………………………………………49 异方差的后果……………………………………………………………………………51 异方差的检验……………………………………………………………………………52 异方差的修正……………………………………………………………………………54 案例—居民储蓄模型估计………………………………………………………………56 序列相关性……………………………………………………………………………59 序列相关性………………………………………………………………………………59 序列相关性的后果………………………………………………………………………61 序列相关性的检验………………………………………………………………………62 序列相关性的修正………………………………………………………………………64 案例—地区商品出口模型估计…………………………………………………………67 多重共线性……………………………………………………………………………70 多重共线性………………………………………………………………………………70 多重共线性的后果………………………………………………………………………71 多重共线性的检验………………………………………………………………………73 多重共线性的方法………………………………………………………………………74 案例—服装市场需求函数………………………………………………………………75 随机解释变量和虚拟变量……………………………………………………………78 随机解释变量问题………………………………………………………………………78 虚拟变量模型……………………………………………………………………………83 单方程计量经济学应用模型………………………………………………………… 89 生产函数模型……………………………………………………………………………89 需求函数模型……………………………………………………………………………96 滞后变量模型……………………………………………………………………… 102 滞后变量模型的基本概念……………………………………………………………102 分布滞后模型的参数估计……………………………………………………………103 滞后变量模型的构造…………………………………………………………………107 自回归模型的估计……………………………………………………………………109 案例—我国长期货币流通量需求模型………………………………………………111 联立方程计量经济学模型理论与方法……………………………………………113 联立方程模型的基本概念…………………………………………………………113 联立方程模型的结构式和简化式……………………………………………………115 计量经济学方法中的联立方程问题…………………………………………………118 联立方程计量经济学模型的识别 …………………………………………………121 模型的识别的概念……………………………………………………………………121 模型的识别的阶条件和秩条件………………………………………………………125 联立方程模型的估计 ………………………………………………………………130 联立方程模型的单方程估计方法……………………………………………………130 联立方程模型的系统估计方法………………………………………………………138 第一章绪论【教学目的与要求】通过本章学习，要求了解计量经济学的基本概念、计量经济学的内容体系以及本课程涉及的内容、计量经济学的主要应用、建立与应用计量经济学模型的工作步骤、学习计量经济学的重要性。要求掌握计量经济学的经济学科性质以及在经济学科中的地位，在建立与应用计量经济学模型的每一步骤中应注意的关键问题。【教学重点与难点】本章重点是对计量经济学的经济学科性质的理解和在建立与应用计量经济学模型的每一步骤中应注意的关键问题。难点是如何将本章的知识用于指导全课程的学习。【教学方法】课堂讲授、实证分析与学生自学相结合。 §计量经济学一、计量经济学计量经济学，是对经济学的作用存在有某种期待的结果，它把数理统计学应用于经济数据，以使数理经济学构造出来的模型得到经验上的支持，并获得数值结果。计量经济学可定义为实际经济现象的数量分析。这种分析基于理论与观测的并行发展，而理论与观测又通过适当的方法而得以联系。计量经济学研究经济定律的经验判断。本质上，计量经济学的研究方法是，利用统计推断的理论和技术作为桥头堡，以达到经济理论和实际测算相衔接的目的。对经济的数量研究有几个方面，其中任何一个就其本身来说都不应该与经济计量学混为一谈。因此，经济计量学与经济统计学绝不是一样的。它也不等于我们所说的一般经济理论，即使这种理论中有很大部分具有确定的数量特征。也不应把计量经济学的意义与经济学中应用经济学看成是一样的。经验表明，统计学、经济理论和数学的三个方面的观点之一是实际理解现代经济生活中数量关系的必要条件，但任何一种观点都不是充分条件。这三者的统一才是强有力的工具；正是由于这三者的统一才构成了经济计量学。（，Economitrica,1933） Comparison：Mathematical Economics----the mathematical development of the economic theory Economic Statistics----concerned with descriptive statistics: developing and refining Economic data (national income accounts,index numbers) Econometrics----utilizes the data to estimate quantitative economic relationships and To test hypotheses about them.. (Michael D. Intriligator, Professor of Economics, University of California, Los Angeles) 二、计量经济学模型模型（models），是对现实的描述和模拟。对现实的各种不同的描述和模拟方法，就构成了各种不同的模型：语义模型（也称逻辑模型）、物理模型、几何模型、数学模型和计算机模型等。经济理论——语义模型例1：对供给不足下的生产活动，我们可以用“产出量是由资本、劳动、技术等投入要素决定的，在一般情况下，随着各种投入要素的增加，产出量也随之增加，但要素的边际产出是递减的”来描述。数理经济模型——（经济）数学模型计量经济模型——（经济）数学模型比较：数理经济模型：揭示经济活动中各个因素之间的理论关系，用确定性的数学方程加以描述。如可将例1中的语义模型写成数理经济模型：或计量经济模型：揭示经济活动中各个因素之间的定量关系，用随机性的数学方程加以描述：如可将例1中的语义模型写成计量经济模型：三、计量经济学的内容体系广义计量经济学和狭义计量经济学计量经济学作为经济学的一个分支学科，有其广泛的内容。一般将它分为广义计量经济学和狭义计量经济学。广义计量经济学，是利用经济理论、数学以及统计学定量研究经济现象的经济计算方法的统称，包括回归分析方法、投入产出分析方法、时间序列分析方法等。狭义计量经济学，也就是我们通常所说的计量经济学，以揭示经济现象中的因果关系为目的，在数学上主要应用回归分析方法。理论计量经济学和应用计量经济学理论计量经济学：以介绍、研究计量经济学的理论与方法为主要内容，侧重于理论与方法的数学证明与推导，与数理统计联系极为密切。应用计量经济学：以建立与应用计量经济学模型为主要内容，强调应用模型的经济学和经济统计学基础，侧重于建立与应用模型过程中实际问题的处理。计量经济学建模理论与方法的发展传统方法（“结构模型方法”（50、60年代））：以先验给定的经济理论为建立模型的出发点，以模型的参数估计为重心，以参数估计值与其理论预期值相一致为判断标准。试验方法（70年代以后）：从只有少数方程和变量入手，进行试验，包括在各种变量的组合中增删变量、或增删方程、或改变函数形式等，以求取得最佳模型。 §计量经济学方法论一、传统或经典方法论（建立模型）（一）理论模型的设计 1、理论或假说的陈述； 2、理论的数学模型的设定； 3、理论的计量经济模型的设定；（二）获取数据（三）模型的参数估计（四）模型的检验 1、经济意义的检验 2、统计检验 3、计量经济学检验 4、预测检验（五）模型应用 1、经济分析/构分析 2、经济预测 3、政策评价 4、检验与发展经济理论例2：凯恩斯消费理论（一）理论模型的设计 1、理论或假说的陈述 “基本的心理定律是……，通常或平均而言，人们倾向于随着他们收入的增加而增加其消费，但比不上收入增加得那么多。”（John Maynard Keynes, The General Theory of Employment, Interest and Money）即：边际消费倾向（MPC：marginal propensity to consume）大于0而小于1。 ●确定模型所包含的变量：消费（Y）、（X） 2、理论的数学模型的设定数理经济学的设定：（）或：（）这里与分别表示一条直线的截距和斜率，其中就是对MPC的度量。 ●拟定理论模型中待估参数的理论期望值 >0; 0>>1 3、理论的计量经济学模型的设定（）其中：——误差项或干扰项（stochastic disturbance term），是一个随机变量。该计量经济消费模型假设了消费对收入有线性关系，但两者的关系还是不准确的，它从一个家庭变到另一个家庭（由误差项表示）。（二）样本数据的收集为了估计（）所示的计量经济模型，即为了得到和，需要有关于收入与消费支出的统计数据。表给出了一组美国经济的数据。表 Y(个人消费支出)和X(国内生产总值)数据(10亿万年美元) 年 Y X 年 Y X 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 4838 4821 (三) 模型的参数估计参数估计将对模型赋予经验内容，是一个纯技术的过程。包括对模型进行识别（对联立方程模型而言）、估计方法的选择、软件的应用等内容。在一定的假设下面，通过普通最小二乘法，利用表中的数据所估计的消费函数是 () 从方程（）可知，在1980~1991年期间，边际消费倾向约为，表明在此期间，实际收入每增加一美元，平均而言，实际消费支出增加约72美分。之所以说平均而言，是因为消费和收入之间没有准确的关系。（四）模型的检验经济意义的检验主要检验模型参数估计量在经济意义上的合理性。主要方法是将模型参数的估计量与预先拟定的理论期望值进行比较，包括参数估计量的符号、大小、相互之间的关系，以判断其合理性。这里，0<<1，经济意义合理。统计检验统计检验是由统计理论决定的，目的在于检验模型的统计学性质。通常最广泛应用的统计检验准则有拟合优度检验、变量和方程的显著性检验等。这里需要检验：是否在统计意义上（statistical）小于1？计量经济学检验计量经济学检验是由计量经济学理论决定的，目的在于检验模型的计量经济学性质。即运用所选定的估计方法（如上面所说的普通最小二乘法）时的前提假设是否存在。通常最主要的检验准则有随机误差项的序列相关检验和异方差性检验，解释变量的多重共线性检验等。预测检验预测检验主要检验模型参数估计量的稳定性以及相对样本容量变化时的灵敏度，确定所建立的模型是否可以用于样本观测值以外的范围，即模型的所谓超样本特性。（五）模型应用 1、经济分析/结构分析 2、经济预测 3、政策评价纯预测：假定1994年GDP为60万亿美元，问1994年的消费将是多少？经济分析/政策评价：1993年克林顿总统上任后宣布其经济计划，其中包括对年收入超过14万美元的人增税，假若政策改变的结果导致投资的下降，问这一收入政策对消费支出以至最后对就业的影响将如何？根据宏观经济理论：投资支出每改变1元，收入的改变由收入乘数（M）给出：因此，由模型中已得到的MPC=，可得到M=。即投资减少1元，将最终导致收入减少美元。于是，假定这一政策导致1994年投资支出下降1%，则可预算出收入下降%，相应的消费支出下降%。表 1994年加税政策的影响预测值 (10亿美元) 加税后预测值 (10亿美元) 政策影响绝对量 (10亿美元) 政策影响相对量 (%) 收入消费支出投资支出 60000 42968 17032 59392 42530 16861 -608 -438 -170 -1 又问：政府认为4万亿美元的消费支出水平可维持当前约%的失业率水平，问什么收入水平将保证消费支出的这一目标？ 4、检验与发展经济理论一方面，按照某种经济理论去建立模型，通过实际经济数据去拟合，根据拟合的好坏来检验经济理论；另一方面，根据实际数据来拟合各种模型，并通过分析总结拟合最好的模型所表现出来的变量间的关系，来探寻经济变化规律，即发现和发展经济理论。二、计量经济学模型成功的三要素从上述建立计量经济学模型的步骤中，不难看出，任何一项计量经济学研究、任何一个计量经济学模型赖以成功的要素应该有三个：理论、方法、数据 Economic Theory----econometric model Statistic Theory---- econometric techniques Facts----relevant data 理论、方法、数据图，The Econometric Approac 第二章一元线性回归模型的理论与方法【教学目的与要求】了解（最低要求）：一元线性单方程计量经济学模型的基本理论与方法；推导和证明与普通最小二乘法有关的参数估计过程和结论；应用计算器进行线性单方程模型的普通最小二乘估计；独立完成建立一元线性单方程计量经济学模型的全过程工作。掌握（较高要求）：关于线性单方程积极性模型的基本假设，最小二乘法的基本原理；主要的统计检验方法及应用。应用（对应用能力的要求）：学习该部分，要求建立一个实际的一元线性回归模型，用计算器完成参数估计量的计算与检验，最后提交一篇报告。【教学重点与难点】本章重点是关于线性单方程积极性模型的基本假设，最小二乘法的基本原理；主要的统计检验方法及应用。难点是推导和证明与普通最小二乘法有关的参数估计过程和结论。【教学方法】课堂讲授、实证分析与学生自学相结合。 § 回归分析概述一、变量间的关系及回归分析的基本概念经济变量之间的关系，大体可分为两类：确定性变量关系或函数关系：研究的是确定现象非随机变量间的关系。统计依赖或相关关系：研究的是非确定现象随机变量间的关系。例：圆面积=F（(,圆半径）=(*圆半径*圆半径，函数关系；农作物产量=F（气温、降雨量、阳光、施肥量），统计依赖（相关）关系。正相关线性相关不相关相关系数：有因果关系回归分析统计依赖（相关）关系负相关 -1≤ρ≤1 正相关无因果关系相关分析非线性相关不相关负相关注意：①不线性相关并不意味着不相关； ②有相关关系并不意味着一定有因果关系； ③回归分析/相关分析研究一个变量对另一个（些）变量的统计依赖关系，但它们并不意味着一定有因果关系。 ④回归分析对变量的处理方法存在不对称性，即区分应变量（被解释变量）和自变量（解释变量）：前者是随机变量，后者不是；相关分析则对称地对待任何(两个)变量，两个变量都被看作是随机的。　　回归分析是研究一个变量关于另一个（些）变量的依赖关系的计算方法和理论。其用意在于通过后者的已知或设定值，去估计和（或）预测前者的（总体）均值。前一个变量被称为被解释变量（Explained Variable）或应变量（Dependent Variable）后一个变量被称为解释变量（Explanatory Variable）或自变量（Independent Variable）。回归分析构成计量经济学的方法论基础，其主要内容包括：根据样本观察值对经济计量模型参数进行估计，求得回归方程；对回归方程、参数估计值进行显著性检验；利用回归方程进行分析、评价和预测。二、总体回归函数（方程）：PRF 由于统计相关的随机性，回归方程关心的是根据解释变量的已知或给定值，考察被解释变量的总体均值，即当解释变量取某个确定值时，与之统计相关的被解释变量所可能出现的对应值的平均值。例：一个假想的社区人口总体有６０户家庭组成，要研究该社区每月家庭消费支出Y与每月可支配家庭X的关系，即知道了家庭的每月收入，预测每月消费支出的（总体）平均水平。为达到此目的，将该６０户家庭划分为组内收入差不多的１０组，以分析每一收入组的家庭消费支出（表）表某社区每月家庭收入与消费支出查统计表每月家庭收入X(元) 800 1000 1200 1400 1600 1800 2000 2200 2400 2600 每月家庭消费支出 Y(元) 550 650 790 800 1020 1100 1200 1350 1370 1500 600 700 840 930 1070 1150 1360 1370 1450 1520 650 740 900 950 1100 1200 1400 1400 1550 1750 700 800 940 1030 1160 1300 1440 1520 1650 1780 750 850 980 1080 1180 1350 1450 1570 1750 1800 0 880 0 1130 1250 1400 0 1600 1890 1850 0 0 0 1150 0 0 0 1620 0 1910 共计 3250 4620 4450 7070 6780 7500 6850 10430 9660 12110 条件概率 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 条件均值 650 770 890 1010 1130 1250 1370 1490 1610 1730 由于不确定因素的影响，对同一收入水平X，不同家庭的消费支出不完全相同，但由于调查的完备性，给定收入水平X的消费支出Y的分布是确定的，即以X的给定值为条件的Y的条件分布（Conditional distribution）是已知的，如P（Y=550 | X=800）=1/5。对Y的每一个条件概率分布，可得其条件均值（conditional mean）或条件期望（值）（conditional expectation）：E（Y | X=），如E（Y| X=800）=650 散点图表示，随着收入的增加，消费“平均地说”也在增加，且Y的条件均值均落在一根正斜率的直线上。这条直线称为总体回归线。在给定解释变量条件下被解释变量的期望轨迹称为总体回归线（population regression line），或更一般地称为总体回归曲线（population regression curve）。相应的函数（方程）：（）称为（双变量）总体回归函数（方程）（PRF）(population regression function)。 ●含义：回归函数（PRF）说明被解释变量的平均状态（总体条件期望）随解释变量X变化的规律。 ●函数形式：可以是线性或非线性的。例中：为一线性函数。其中，为未知然而固定的参数，称为回归系数（regression coefficients）总体回归函数（方程）的随机设定个体家庭的消费支出与给定收入水平间的关系：聚集在该收入水平平均消费支出周围。对每一个个别家庭，记 EMBED （）称为观察值围绕它的期望值的离差（deviation），是一个不可观测的随机变量，又称为随机干扰项（stochastic disturbance）或随机误差项（stochastic error）。由（）式，个别家庭的消费支出为： EMBED （）即，给定收入水平，个别家庭的支出可以表示为两部分之和：（1）该收入水平下所有家庭的平均消费支出E(Y|)，称为系统性（systematic）或确定性（deterministic）部分（2）其他随机或非确定性（nonsystematic）部分。（）式称为总体回归函数（方程）PRF的随机设定形式。表明被解释变量除了受解释变量系统性影响外，还受其他未包括在模型中来而又集体地影响着的全部变量的随机性影响，即为这些集体变量的替代物。由于方程中引入了随机项，成为计量经济学模型，因此也称为总体回归模型。三、随机干扰项的含义随机干扰（误差）项是在模型设定中省略下来而由集体地影响着被解释变量的全部变量的替代物。随机误差项主要包括下列因素的影响：（1）在解释变量中被忽略的因素的影响；（2）变量观测值的观测误差的影响；（3）模型关系的设定误差的影响；（4）其他随机因素的影响。产生并设计随机误差项的主要原因：（1）理论的含糊性；（2）数据的欠缺；（3）节省原则。四、样本回归函数（SRF）由于总体的信息往往无法掌握，实现的情况只能是在一次观测中得到总体的一个样本。问题：能从一次抽样中获得总体的近似的信息吗？如果可以，如何从抽样中获得总体的近似信息？例在例的总体中有如下一个样本，问：能否从该样本中预测整个总体中对应于选定X的平均每月消费支出，即能否从该样本估计总体回归函数PRF？ Y 700 650 900 950 1100 1150 1200 1400 1550 1500 X 800 1000 1200 1400 1600 1800 2000 2200 2400 2600 回答：能该样本散点图为：样本散点图近似于一条直线，画一条直线以尽好地拟合该散点图，由于样本取自总体，可以该线近似地代表总体回归线。该成为样本回归线（sample regression lines），其函数形式为： EMBED （）称为样本回归函数（sample regression function）SRF。将（）看成（）的近似替代，则就为的估计量：为的估计量，= 样本回归函数的随机形式（）式中，称为（样本）残差（或剩余）项（residual），代表了其他影响的随机因素的集合体，可看成为的估计量。由于方程中引入了随机项，成为计量经济模型，因此也称为样本回归模型。 ▼回归分析的主要目的：根据样本回归函数SRF，估计总体回归函数PRF。即根据估计即：设计一“方法”构造SRF，以使SRF尽可能“接近”PRF，或者说使尽可能接近。（注：这里真实的PRF可能无法无从知道） §２.2　　一元线性回归模型　　一、线性回归模型的特征形如　　　　　　　　　　　　　　　　　　　　　（）的计量经济学模型称为一元线性回归模型（双变量线性模型）。其中，Y 为被解释变量，X为解释变量，是待估参数，为随机干扰项。例：凯恩斯的绝对收入假设消费理论，认为消费是由收入唯一决定的，是收入的线性函数。其模型为：（）线性回归模型的特征： 1.通过引入随机误差项，将变量之间的关系用一个线性随机方程来描述，并用随机数学的方法来估计方程中的参数，这就是线性回归模型的特征，也就是线性计量经济学模型的特征。 2.在线性回归模型中，被解释变量的特征由解释变量与随机误差项共同决定。单方程线性回归模型的一般形式为： i=1,2,…n （）其中，Ｙ被称为解释变量，被称为解释变量，为随机误差项，i为观测值下标，n为样本容量，为待估参数。二、线性回归模型的普遍性线性回归模型是计量经济学模型的主要形式，许多实际经济活动中经济变量间的复杂关系都可以通过一些简单的数学处理，使之化为数学上的线性关系。将非线性关系化为线性关系的常用的数学处理方法： 1.直接置换法例如，商品的需求曲线是一种双曲线形式，商品需求量q与商品价格p之间的关系表现为非线性关系：显然，可以用和　的置换，将方程变成：再如，拉弗曲线描述的税收s和税率r的关系是一种抛物线形式：可以用进行置换，将方程变成： 2、对数变化例如，著名的Cobb-Dauglas生产函数将产出量Q与投入要素(K，L)之间的关系描述为幂函数的形式：方程两边取对数后，即成为一个线性形式：再如，生产中成本C与产量q的关系呈现指数关系：方程两边取对数后，即成为一个线性形式： 3、级数展开例如，著名的CES生产函数将产出量Q与投入要素(K，L)之间的关系描述为如下的形式：（）方程两边取对数后，得到：将式中在=0处展开台劳级数，取关于的线性项，即得道一个线性近似式。结论：实际经济生活中的许多问题，都可以最终化成线性问题，所以，线性回归模型有普遍意义。即使对于无法采取任何变换方法使之变成线性的非线性模型，目前使用得较多的参数估计方法——非线性最小二乘法，其原理仍然是以线性估计方法为基础。三、线性回归模型的基本假设由于回归分析的主要目的是要通过样本回归函数（模型）SRF尽可能准确估计总体回归函数（模型）PRF。即通过（）估计（） 1、技术线路：由于是的估计值，要求与的“总体”误差尽可能地小→最小二乘法；由于，是的近似，要求尽可能接近尽可能接近 EMBED 对模型的解释变量与随机误差项作出合理假定。２、线性回归模型在上述意义上的基本假设： (1) 解释变量,,…是确定性变量，不是随机变量，而且解释变量之间互不相关。 (2) 随机误差项具有０均值和同方差。即Ｅ()＝０　　i=1,2,…n Var()= i=1,2,…n 其中E表示均值或期望，也可用Ｍ表示；Ｖar表示方差，也可以用Ｄ表示。 (3) 随机误差项在不同样本点之间是独立的，不存在序列相关。即　　Cov(,)=0 ij i,j=1,2,…n 其中Ｃov表示协方差。 (4) 随机误差项与解释变量之间不相关。即　　　Cov(,)=0 j=1,2,…k i=1,2,…n (5) 随机误差项服从０均值、同方差的正态分布。即　　 i=1,2,…n 在实际建立模型的过程中，除了基本假设５外，对模型是否满足假设都要进行检验。这就是“建立计量经济学模型步骤”中“计量经济学检验”的任务。对于基本假设５，根据中心极限定理，当样本容量趋于无穷大时，对于任何实际模型，都是满足的。　四、一元线性回归模型的参数估计：普通最小二乘法普通最小二乘法估计已知一组样本观测值（,），（i=1,2,…n），要求样本回归函数尽可能好地拟合这组值，即样本回归线上的点与真实观测点的“总体误差”尽可能地小，或者说被解释变量的估计值与观测值应该在总体上最为接近，最小二乘法给出的判断的标准是：二者之差的平方和　　　　　　　　　　　（）最小。即在给定样本观测值之下，选择出、能使与之差的平方和最小。为什么用平方和？因为二者之差可正可负，简单求和可能将很大的误差抵消掉，只有平方和才能反映二者在总体上的接近程度。这就是最小二乘原则。根据微积分学的运算，可推得用于估计、的下列方程组：　　　　　　　　　　　　()　　　　　　　　　或　　　　 () 解得 () 方程组()称为正则方程组(normal equations)。参数估计的离差形式(deviation form) 记，　　　　　　　，　　　　　　　 ()的参数估计量可以写成：注：在计量经济学中，往往以小写字母表示对均值的离差。至此，完成了模型的基本估计任务。由于、的估计结果是从最小二乘原理得到的，故称为最小二乘估计量。样本回归线的性质：样本回归线通过和的样本均值。证：因为有估计的的均值等于实测的的均值。　　　　证：　　　　由于，则 (3)残差的均值为零。证：由正则方程：知，故 EMBED EMBED 样本回归模型的离差形式（deviation form）：（）因为： EMBED 按照离差形式,样本回归方程(函数)SPF可写为：（）（4）残差和预测的不相关。证：在离差形式下，因：，故（5）残差与不相关。证：由正则方程：知五、最小二乘估计量的性质：高斯马尔可夫定理当模型参数估计出后，需考虑参数估计值的精度，即是否能代表总体参数的真值，或者说需考察参数估计量的统计性质。一个用于考察总体的统计量，可从三个方面考察其优劣性：线性性：即是否是另一随机变量的线性函数；无偏性：即它的均值或期望值是否等于总体的真实值；有效性：即它是否在所有线性无偏估计量中具有最小方差。关于最小二乘估计量的线性性与无偏性的证明： 1、线性性：估计量、是的线形组合。证： 2.无偏性：估计量、的均值（期望）等于总体回归参数真值与。证： 3、有效性（最小方差性）：在所有线性无偏估计量中，最小二乘估计量、具有最小方差。 (1)先求、的方差 () () (2)证明最小方差性假设是其他方法得到的关于的线性无偏估计量: EMBED 其中,为不全为零的常数。由满足无偏性,即可知: 从而有：的方差普通最小二乘估计量OLS(ordinary least Squares)具有线性、无偏性、最小方差性等优良性质。具有这些优良性质的估计量又称为最佳线性无偏估计量，即BLUE估计量(the Best Linear Unbiased Estimator)。显然这些优良的性质依赖于对模型的基本假设。六、和的概率分布及随机误差项的方差的估计 1、和的概率分布和分别是的线性组合，因此、的概率分布取决于Y。在是正态分布的假设下，Y是正态分布，因此和也服从正态分布，其分布特征（密度函数）由其均值和方差唯一决定。记和的标准差分别为： S()= () () 2、随机误差项的方差的估计在估计的参数和的方差和标准差的表达式中，都含有随机扰动项方差方差。又称为总体方差。由于实际上是未知的，因此和的方差与标准差实际上无法计算。由于随机项不可观测，只能从的估计——残差出发，对总体方差进行估计。可以证明总体方差的无偏估计量为（）在总体方差的无偏估计量求出后,估计的参数和的方差和标准差的估计量分别是的样本方差：（）的样本标准差：（）样本方差：（）的样本标准差：（）例在收入-消费支出比例中,参数估计及标准差的计算如下：收入X(元) 支出Y(元) 1 2 3 4 5 6 7 8 9 10 平均求和 800 1000 1200 1400 1600 1800 2000 2200 2400 2600 1700 700 650 900 950 1100 1150 1200 1400 1550 1500 1110 -900 -700 -500 -300 -100 100 300 500 700 900 -410 -460 -210 -160 -10 40 90 290 440 390 369000 322000 105000 48000 1000 4000 27000 145000 308000 351000 1680000 810000 490000 250000 90000 10000 10000 90000 250000 490000 810000 3300000 640000 1000000 1440000 1960000 2560000 3240000 4000000 4840000 5760000 6760000 32200000 652 754 855 957 1059 1161 1263 1365 1466 1568 11100 2321 10740 1984 53 1674 119 3935 1257 6995 4649 33727 EMBED 七、一元线性回归模型的统计检验拟合优度检验（1）总离差平方和的分解已知由一组样本观测值（），i=1,2…,n得到的回归直线为而Y的第i个观测值与样本均值的离差可分解为两部分之和：（）其中，是样本回归直线理论值（回归拟合值）与观测值的平均值之差，可认为是回归线解释的部分：是实际观测值与回归拟合值之差，是回归直线不能解释的部分。于是：（），为实测的Y值围绕其均值的总离差平方和（Total Sum of Squares）记为TSS； EMBED 为估计的Y值围绕其均值（）的离差平方和，称为回归平方和（Explained Sum of Squares），记为ESS；，为实测的Y值围绕其估计值的离差平方和，称为残差平方和 (Residual sum of squares)记为RSS。判定系数记　　　　　　　　　　　　　　　　（）称为（样本）判定系数，表明，在总离差平方和中，回归平方和所占的比重越大，残差平方和所占的比重越小，则回归直线与样本点拟合得越好。 ▲的性质与其他算法：　　　　　　　　() () 由于　　　　于是　　　TSS=ESS+RSS　可写成：　　　　() 判定系数与相关系数的关系两个变量与之间真实的线性相关程度可以用总体相关系数表示: 在总体未知的情况下,利用样本给出的的一个无偏估计为 () ,称为与之间的协方差: ,分别为的样本方差与的样本方差。于是（）存在：（）在收入—消费支出例中，参数显著性检验（t检验）回归分析是要通过样本所估计的参数来代替总体的参数，尽管从统计性质上已知，如果有足够多的重复抽样，则所估计出的的期望（均值）就是，但在一次抽样中，不一定就等于。那么，在一次抽样中，与的差异有多大，是否明显，这就需要进一步进行显著性检验，包括对取值范围的假设检验于对落入以为中心的某一范围的区间检验。（1）假设检验的原理：首先根据实际问题对所考察的总体提出一个论断，称为统计假设，记为，然后根据样本的有关信息，对的真伪进行判断，作出拒绝或接受的决策。假设检验的基本思想是基于“小概率事件”原理的反证法。该原理认为“小概率事件在一次试验中几乎是不可能发生的”。在原假设下构造一个事件，这个事件在“原假设是正确”的条件下是一个小概率事件。随即抽取一组容量为n的样本观测值进行该事件的试验，如果该事件发生了，说明“原假设是正确”是错误的，因为不应该出现的小概率事件出现了。因而应该拒绝原假设。反之，如果该小概率事件没有发生出现，就没有理由拒绝原假设，应该接受原假设。（2）对总体参数进行显著性检验的思路由于总体参数是未知的，因此首先需给出一个的假设值（如以代表），及提出原假设：。如果为真，则存在一个以为“中心”的区间，使得在多次抽样中的参数估计值以很大的概率（称为置信度）（如95%）落入该区间，亦即在一次抽样中，参数估计值在该区间外的概率（称为置信性水平）非常小（如5%）。但如果我们确实在一次抽样中得到的参数估计值落在了该区间之外，即“小概率”事件发生了，则有理由认为原假设是不真实的，从而拒绝原假设。这时，当原假设确实为真而拒绝它所犯错误的概率是很小的（如为5%）。（3）对总体参数进行显著性检验的步骤经济计量学中常用的对总体参数的假设检验为：=0。因此，如果某一=0显著成立，则意味着它所对应的变量X对于因变量Y的线性作用为零，X不是重要的解释变量，不应保留在模型中。在一元线性回归模型中，在随机误差项为正态分布的假设下，由于 ~ 则可构造统计量 t =~ t(n-2) () 即该t统计量服从自由度为n-2的t分布。用t统计量进行参数显著性检验的步骤：对总体参数提出假设（原假设）：，（对立假设/备则假设）：以原假设构造t统计量，并由观测数据计算其值 t = () 式中，为参数估计量的标准差：== 给定显著水平，查自由度为n-2的t分布表，得临界值; 若| t | >，则拒绝，接受：，即认为所对应的变量对被解释变量的影响不容忽视；若| t | < =，则接受：，即认为所对应的变量对被解释变量没有明显的影响。同样地，由于，可构造统计量（）来对总体参数进行假设检验。其中在收入——消费支出中，根据的估计值可得因此，可拒绝的假设，认为收入X是消费支出的主要解释变量。八、回归系数的置信区间检验假设检验可以通过一次抽样的结果检验总体参数可能的假设值的范围（最常用的是假设为总体参数值为零），但是它并没有指出在一次抽样中样本参数值到底离总体参数的真值有多“近”。要判断样本参数的估计值在多大程度上可以“近似”地替代总体参数的真值，往往需要通过构造一个以样本参数的估计值为中心的“区间”，来考察它以多大的可能性（概率）包含着真实的参数值。这种方法就是参数检验的置信区间的方法。要判断估计的参数值离真实的参数值有多“近”，可预先选择一个概率，试求一个正数，使得随即区间(random interval)(包含参数的真值的概率为。即：如果存在这样一个区间，称之为置信区间(confidence interval)；称为置信系数（置信度）(confidence coefficient)，称为显著性水平(level of significance)；置信区间的端点称为置信限(confidence limit)或临界值(critical values)。（1）的置信区间在假设检验中，已知在总体参数的真实值为的情况下，存在一个随机置信区间使得在多次抽样中，可使样本参数估计值以一定的概率落在该区间内。在构造了t统计量的情况下，上述表示即为或于是，在的置信度下，的置信区间为（）（2）的置信区间同样地，的置信区间为（）在收入—支出例中，由于，自由度=8，则在5%的显著水平下，，因此的95%置信区间为：（，）， ●对这个置信区间的解释是：给定置信系数（置信度/置信水平）为95%，在重复抽样中，在类似于（，）的每100个区间中，将有95个包含着真实的的值。同样地，由于，的95%的置信区间为（，） ●由于置信区间一定程度地给出了样本参数估计值与总体参数真值的“接近”程度，因此置信区间越小越好。要缩小置信区间，需（1）增大样本容量n，因为在同样的样本容量下，n越大，t分布表中的临界值越小，同时，增大样本容量，还可使样本参数估计值的标准差减小；（2）提高模型的拟合优度，因为样本参数估计值的标准差与残差平方和呈正比，模型优度越高，参差平方应越小。九、回归分析的应用：预测问题 1、点预测；给定，利用样本回归方程，求出相应的样本拟合值，可以此作为其条件均值与个值Y的一个近似估计。在总体回归函数为的情况下，Y在时的条件均值为通过样本回归函数，求得的拟合值为 () 另一方面，在总体回归模型为的情况下，Y在时的均值为 () （）式与（）式说明在时，样本估计值是总体均值和个值的无偏估计，因此可用作为与的预测值。在收入—消费支出例中，得到的样本回归函数为则在处，，它作为总体均值或个值Y在X=1000处的近似值。 2、区间预测既然作为与的预测值的估计，它也存在与真值之间的误差问题，即存在预测精度问题，从而需要考虑与的置信区间，该区间也称为各自的预测区间。（1）总体均值）的预测区间由于且则可以证明因此故 EMBED EMBED () 将未知的代以它的无偏估计量,则可以构造t统计量 () 其中：于是，在的置信度下，总体均值的置信区间为（）（2）总体个值的预测区间由于是（）将未知的代以它的无偏估计量，则可构造t统计量（）式中从而在的置信度下, 的置信区间为 () 在收入-消费支出例中, 因此,总体均值的95%置信区间为：或为同样地,对于在的个体值，其95%置信区间为：或为如果对每个值求其总体均值95%的置信区间，将区间端点边接起来，可得到一个关于总体回归函数的被称为置信带（域）（confidence band）的区域。同样地，对每个值求其个体值的95%的置信区间，将区间端点边接起来，可得一个关于个体的置信带（域）。可以看出，的个体的置信带比其总体均值的置信带宽。对于的总体值与个体的预测区间(置信区间),(1)样本容量n 越大,预测精度越高，反之预测精度越低;(2)样本容量一定时,置信带的宽度当在均值处最小，其附近进行预测(插值预测)精度越大; 越远离其均值，置信带越宽,预测可信度下降。第三章多元线性回归模型【教学目的与要求】了解（最低要求）：线性单方程计量经济学模型的基本理论与方法；运用矩阵描述、推导和证明与普通最小二乘法有关的参数估计过程和结论；应用计量经济学软件进行线性单方程模型的普通最小二乘估计。掌握（较高要求）：关于线性单方程计量经济学模型的基本假设及矩阵表示，最小二乘法的基本原理及方法；主要的统计检验方法及应用。应用（对应用能力的要求）：应用所学知识，在本章结束前独立完成一个综合练习，自己选择研究对象，自己建立理论模型，自己收集样本数据，用软件包（例如）完成模型的估计和检验，提交一篇报告。【教学重点与难点】本章重点是关于线性单方程计量经济学模型的基本假设及矩阵表示；最小二乘法的基本原理及方法；主要的统计检验方法及应用。难点是如何将本章的知识用于指导完成综合练习。【教学方法】课堂讲授、实证分析与学生自学相结合。 § 多元线性回归模型及其最小二乘估计一、多元线性回归模型在实际经济问题中，一个变量往往要受到多个原因变量的影响，表现在线性回归模型中的解释变量有多个，这样的模型被称为多元线性回归模型。多元线性回归模型参数估计的原理与一元线性回归模型相同，只是计算更为复杂。多元线性回归模型的一般形式为： i=1、2、…、n（）其中，k为解释变量的数目，其它变量和符号的含义与一元线性回归模型相同。人们习惯上把常数看成为一个虚变量的系数，在参数估计过程中该虚变量的样本观测值始终取1。这样，模型中解释变量的个数为（k+1）。由（）表示的n个随机方程的矩阵表达式为： Y=XB+N （）其中，在收入—消费支出例中，消费支出模型为：其矩阵形式为：二、多元线性回归模型的基本假定模型（）或（）在满足§所列的基本假设的情况下，可以采用普通最小二乘法估计参数。关于经典回归模型的假定标量符号矩阵符号解释变量是非随机的或固定的；而且各之间互不相关（无多重共线性）随机误差项具有零均值、同方差及不序列相关解释变量与随机项不相关 4、为了假设检验 1、矩阵X是非随机的：且X的秩，此时，也是满秩的。 2、 3、即向量N有一多维正态分布，即三、普通最小二乘估计随机抽取被解释变量和解释变量的n组样本观测值：如果模型的参数估计值已经得到，则有： i=1，2，…n （）那么，根据最小二乘原理，参数估计值应该是下列方程组的解。即（）其中 Q = = = () 于是得到关于待估参数估计值的正规方程组：解该(k+1)个方程组成的线性代数方程组，即可得到(k+1)个待估参数的估计值，j = 0,1,2,…,k.。（）的矩阵形式如下： EMBED EMBED = EMBED 即： () 由于满秩，故有 () 例：在收入—消费支出例中的一元线性回归模型中， EMBED == 可求得于是四、多元回归方程及偏回归系数的含义在经典回归模型的假定下，式（）两边对Y求条件期望得：（）称为多元回归方程（函数）。多元回归分析是以多个解释变量的固定值为条件的回归分析，并且所获得的，是诸变量X值固定时Y的平均值或Y的平均响应。诸称为偏回归系数。偏回归系数的含义如下：度量着在保持，，…，不变的情况下，每变化1个单位时，Y的均值E(Y)的变化，或者说给出的单位变化对Y均值的“直接”或“净”（不含其它变量）影响。其它参数的含义与之相同。五、OLS估计量的数值性质与一元回归分析一样，多元回归分析中，OLS估计量有如下数值性质。 1、多元回归线通过均值、、、…、证：由正则方程中的第一个方程有：从而：（） 2、估计的的均值等于真实的的均值证： = 从而：（注：）进一步，多元线性回归模型可写成如下离差的形式：（）同样地，多元线性回归模型的离差形式为： () 3、残差的均值为零，即证：由()式，即：， 4、残差与诸（j = 1, …, k）不线性相关，即证：正则方程组第二个方程以后的各方程为：即：（） 5、残差与诸不线性相关，即证：由()式：从而：，即（） (注：，) 六 OLS估计量的统计性质 1、线性性（） 2、无偏性 () 证： EMBED （）于是： 3、最小方差性若是B的任一线性无偏估计量，则有 () 证明略。（1）关于的方差—协方差矩阵由于矩阵 = 主对角线给出了各个参数估计的方差，其余部分给出了不同参数估计与的协方差，故称为姑且数估计向量的方差-协方差矩阵。由（）可得的方差-协方差矩阵的矩阵符号表达式： = E = = EMBED () 记为矩阵中第i行第j列元素，比较()与()式，知第i个回归参数估计量 ( i= 0, 1, 2, …, k )的方差、标准差、协方差为： () （）（）例如，在一元线性方程中：因此，（2）参数方差的行列式计算式容易证明，对于离差形式的回归模型记为各参数的样本估计值向量，则的方差-协方差矩阵仍为只是这里的矩阵X的第1列元素不是的系数1，而是的系数，即因此，在一元线性回归模型中，故这时，式中，第二项因子分母恰为一元正则方程（组）中的系数，分子为1。容易证明，在二元回归模型中：其中行列式恰为如下离差形式的正规方程组的系数行列式在k元回归模型中，的方差为：包含k个解释变量的模型的估计量的方差，可由两个行列式的比求得：作为分母的行列式是离差形式正规方程组各待估计参数前面系数组成的完全行列式，作为分子的行列式是该行列式中划去了要计算其方差的那个参数所在的行和列后所构成的子行列式。七、随机误差项方差的估计可以证明，随机误差项方差的无偏估计为： () 于是，参数估计量的方差、标准差、协方差可分别用其样本方差标准差协方差加以估计： () () () 附：关于的证明：由于为一数量，故，于是： §多元线性回归模型的统计检验一、拟合优度检验 1、总离差平方和的分解由于：所以有：（） 2、总离差平方和、残差平方和与回归平方和的矩阵表达式（）（）（）关于（）的证明：可以证明：为对称等幂矩阵，即于是：这里，为一数值（标量），因此它的转置就是它自己。 3、可决系数和调整后的可决系数（）对有k 个解释变量的多元回归方程，可决系数的另一计算式如下：（）由（）与（）式知，如果在模型中增加一个解释变量，回归平方就会增大，导致增大。这就给人一个错觉：要使得模型拟合得好，只要增加解释变量就可。但是，现实情况往往是，由增加解释变量个数引起的的增大与拟合好坏无关，因此在含解释变量个数k不同的模型之间比较拟合优度，就不是一个适合的指标，必须加以调整。在样本容量一定的情况下，增加解释变量必定使得自由度减少，所以调整的思路是将残差平方和与总离差平方和分别除以各自的自由度，以剔除变量个数对拟合优度的影响。（）其中为残差平方和的自由度，为总体平方和的自由度。在收入—支出例中：　　　，　二、方程的显著性检验（F检验） 1、方程显著性的F检验 F检验是要检验模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立，即检验方程　　　　　ｉ＝１，２，….，ｎ中所有的参数是否显著不为0。按照假设检验的原理与程序，提出原假设为即模型线性关系不成立。原假设的对立假设为：不全为零 F检验的思想来自于总离差平方和的分解式： TSS=ESS+RSS 由于回归平方和是解释变量X的联合体对被解释变量Y的线性作用的影响结果，考虑比值如果这个比值较大，则X的联合体对Y的解释程度高，可认为总体存在线性关系，反之总体上可能不存在线性关系。因此可通过该比值的大小对总体线性关系进行推断。由于服从正态分布，根据数理统计学中的定义，的一组样本的平方和服从分布。所以有：即回归平方和、残差平方和分别服从自由度为k和（n-k-1）的分布，进一步根据数理统计学中的定义，统计量 () 服从自由度为（k，n-k-1）的F分布。给定一个显著水平，可得到一个临界值，根据样本再求出F统计量的数值后，可通过或来拒绝或接受原假设。对于收入支出例， = 显然有 EMBED 在95%的水平下显著成立，即模型的线性关系在95%的水平下显著成立。 2、关于拟合优度检验与方程显著性检验关系的讨论由（）和（）式知，与F统计检验间存在下列关系（）或： () 由()可知与同向变化：当时，F=0；越大，F值也越大；当=1时，F为无穷大。因此，F检验是所估计回归的总显著性的一个度量，也是的一个显著性检验，亦即，检验原假设，等价于检验=0这一虚拟假设。三、变量显著性检验（t检验）对于多元线性回归模型，方程的总体线性关系是显著的，并不能说明每个解释变量对被解释变量的影响是显著的，必须对每个解释变量进行显著性检验，以决定是否作为解释变量被保留在模型中。统计量在上一节关于参数估计量的最小方差性中，已知参数估计量的方差为：以表示矩阵主对角线上的第i个元素，于是参数估计量的方差为：其中为随机误差项的方差。在实际计算时，用的估计量代替，即这样，当模型参数估计完成后，就可以估计每个参数估计值的方差。因为服从正态分布，且为无偏估计量，均值为，因此服从下列正态分布：由于，因此可构造统计量 () 等式右边分母项即为的标准差。检验在变量显著性检验中设计的原假设为：给定一个显著水平，得到一个临界值，于是可根据或来拒绝或接受原假设。 ▲注：在一元线性回归（k=1）中，t检验与F检验是一致的。一方面，t检验与F检验都是对相同的原假设进行检验；另一方面，两个统计量之间有如下关系： §多元线性回归模型的置信区间多元线性回归模型的置信区间问题仍包括参数估计量的置信区间和被解释变量预测值的置信区间两个方面。一、参数估计量的置信区间由于线性回归模型的参数估计量是随机变量的函数，即所以它也是随机变量。在多次重复抽样中，每次的样本观测值不可能完全相同，所以得到的点估计值也不可能相同。现在我们用参数估计量的一个点估计值近似代表参数值，那么，二者的接近程度如何？以多大的概率达到该接近程度？这就要构造参数的一个区间，以点估计值为中心的一个区间（称为置信区间），该区间以一定的概率（称为置信水平）包含该参数。即回答以何种置信水平位于之中，以及求得。在变量的显著性检验中已经知道：这就是说，如果给定置信水平，从t分布表中查的自由度为的临界值，那么t值处在 EMBED 的概率是。表示为：于是得道：在的置信水平下的置信区间是（）二、预测值的置信区间计量经济学模型的一个重要应用是经济预测。对于模型如果给定样本以外的解释变量的观测值，可以得到被解释变量的预测值但是，严格的说，这只是被解释变量的预测值的估计值，而不是预测值。原因在于两个方面：一是模型中的参数估计量是不确定的，正如上面所说的；二是随机项的影响。所以，我们得到的仅能是预测值的一个估计值，预测值仅以某一个置信水平处于以该估计值为中心的一个区间中。于是，又是一个区间估计的问题。下面进行置信区间的推导。如果已经知道实际的预测值，那么预测误差为：容易证明：服从正态分布，即取的方差的估计量为构造统计量利用该统计量，类似于参数估计量置信区间的分析过程，得到在给定的置信水平下的置信区间是 () 这就是说，当给定解释变量值后，能得到被解释变量以的置信水平处于该区间的结论。同理，可得到均值的预测区间：多元线性回归分析计算步骤及主要公式由样本观测值，写出； 2、计算 3、计算OLS估计量 4、计算残差及残差平方和 5、计算随机标准差的估计值 6、作拟合优度检验 7、计算样本参数估计值标准差其中， 8、进行F检验与t检验 9、在处进行点预测与区间预测例：设某中心城市对各地区商品流出量Y取决于各地区的社会购买力以及各地区对该城市的商品流入，即可能有如下总体回归方程：在下列样本下进行回归分析：地区该市对各地区销售额 Y（万元）各地区社会购买力X1（亿元）各地区商品流入该市量X2（万元） 1 6800 1300 400 2 1900 350 1200 3 2800 180 700 4 1000 340 400 5 700 70 1600 6 500 200 1200 7 60 30 240 8 50 20 400 估计总体回归模型，参数的最小二乘估计 EMBED 统计检验方差分析计算表 6800 1900 2800 1000 700 500 60 50 6692 1985 1050 1820 621 1223 224 196 5074 174 1074 -726 -1026 -1226 -1666 -1676 25742939 30189 1152939 527439 1053189 1503689 2776389 2809814 108 -85 1750 -820 79 -723 -164 -146 11654 7159 3060796 671984 6308 523179 26757 21213 4966 258 -676 93 -1106 -503 -1503 -1531 24659152 66749 456656 8742 1222517 252947 2258026 2342749 和 13810 35596588 4329050 31267537 均值 1726 TSS RSS ESS 自由度 8-1=7 8-3=5 3-1=2 均方差 865810 15633769 拟合优度检验：，总体显著性检验（F检验）：查表，在5%的显著水平下，临界值因为通过样本计算的F值大于临界值，因此模型总体上是显著的。参数显著性检验（t检验）参数估计的方差-协方差矩阵对参数分别作t检验：：：：查表：在5%的显著水平下，，因此，显著不为0而显著为0，说明个地区商品流入量不是一个重要的影响因素，而各地区社会购买力是重要的因素。故在模型中删去，重建立新模型利用表中资料通过OLS法得到回归结果如下： t：（）（）第四章异方差性【教学目的与要求】了解（最低要求）：异方差的概念、类型和后果。掌握（较高要求）：异方差违背基本假设的经济背景；异方差检验的思路和主要检验方法；加权最小二乘法的基本原理；一般加权最小二乘法的步骤和软件包中有关加权最小二乘法的应用。应用（对应用能力的要求）：应用所学知识，在本章结束前独立完成一个练习，进行异方差的检验和修正。【教学重点与难点】本章重点是异方差违背基本假设的经济背景；异方差检验的思路和主要检验方法；加权最小二乘法的基本原理。难点是一般加权最小二乘法的步骤和软件包中有关加权最小二乘法的应用。【教学方法】课堂讲授、实证分析与学生自学相结合。 §异方差的概念计量经济回归分析，是在对现行回归模型提出若干基本假设的条件下，应用普通最小二乘法得到了无偏的、有效的参数估计量。但是，在实际的计量经济学问题中，完全满足这些基本假设的情况并不多见，如果违背了某一项基本假设，那么应用普通最小二乘法估计模型就不能得到无偏的、有效的参数估计量，即OLS法失效，这就需要发展新的方法估计模型。不满足基本假设的情况，称为基本假设违背。主要包括：（1）随机项序列不是同方差的（异方差）；（2）随机项序列存在序列相关性（自相关）；（3）解释变量之间存在线性相关性（多重共线性）；在进行计量经济的回归分析时，还必须对所研究对象是否满足OLS下的基本假定进行检验，即检验是否存在一种或多种违背基本假定的情况，这种检验称为计量经济检验。当经过计量经济检验发现某一种或多种基本假定已被违背，从而已不能直接使用OLS法进行参数估计，这时就必须采取补救措施或发展新的方法。一、异方差的概念对于模型同方差性假设为如果出现即对不同的样本点，随机误差项的方差不再是常数，则认为出现了异方差性。二、异方差的类型同方差性假定的意义是指每个围绕其零平均值的变差，并不随解释变量的X的变化而变化，不论解释变量是大还是小，每个的方差保持相同，即。在异方差的情况下，已不是常数，它是随X的变化而变化的，即：。异方差一般可以归结为三种类型：（1）单调递增型：随X的增大而增大；（2）单调递减型：随X的增大而减小；（3）复杂型：与X的变化呈复杂形式三、实际经济问题中的异方差例1：在截面资料下研究居民家庭的储蓄行为： ——第个家庭的储蓄额；——第个家庭的可支配收入在该模型中，项的常数方差这一假定往往不符合实际情况。对高收入家庭来说，储蓄的差异较大，低收入家庭的储蓄则更有规律性（如为某一特定目的而储蓄），差异较小。因此的方差往往随的增加而增加，呈单调递增型变化。例2：以绝对收入假设为理论假设、以截面数据作样本建立居民消费函数：将居民按照收入等距离分成n组，取组平均数为样本观测值。我们知道，一般情况下居民收入服从正态分布，所以处于每个收入组中的人数是不等的，处于中等收入组中的人数最多，处于两端收入组中的人数最少。人数多的组平均数的误差最小，人数少的组平均数的误差大。所以样本观测值得观测误差随着解释变量观测值的不同而不同，如果样本观测值的观测误差构成随机误差项的主要部分，那么对于不同的样本点，随机误差项的方差互不相同，出现了异方差性。更进一步分析，在这个例子中，随机误差项的方差是随着解释变量Y（收入）的观测值得增大而呈U型变化，是复杂型的一种。例3：以某一行业的企业为样本建立企业生产函数模型产出量为被解释变量，选择资本、劳动、技术等投入要素为解释变量，那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。由于每个企业所处的外部环境对产出量的影响程度不同，造成了随机误差项的异方差性。这时，随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化，为复杂型的一种。 §异方差性的后果计量经济学模型一旦出现异方差性，如果仍采用最小二乘法估计模型参数，会产生下列不良后果： 1.参数估计量非有效当计量经济学模型出现异方差性，其普通最小二乘法参数估计量仍然具有无偏性，但是不具有有效性。因为在有效性证明中利用了即同方差性条件。而且，在大样本情况下，参数估计量仍然不具有渐近有效性，这就是说参数估计量不具有一致性。以一元回归模型为例说明：（1）仍存在无偏性由于（）的参数的OLS估计量为：故，（）（2）不具有最小方差性由于（注：交叉项的期望为零）在为同方差的假定下，（）在存在异方差的情况下，假设，并且记异方差情况下的OLS估计为，则（）对大多数资料有：，从而比较（）与（）（）对于的估计也存在同样的问题。 2.变量的显著性检验失去意义关于变量的显著性检验中，构造了t统计量，（）包含有随机误差项共同的方差，在同方差的假定下，该统计量被证明是服从自由度为（）的t分布的。如果出现了异方差性，t检验就失去了意义。 3.模型的预测失效一方面，由于上述后果，使得模型不具有良好的统计性质：另一方面，在预测值的置信区间中也包含有随机误差项共同的方差。所以，当模型出现异方差性时，参数OLS估计值的变异程度增大，从而造成对Y的预测误差变大，降低预测精度，预测功能失效。 § 异方差性的检验问题在于用什么来表示随机误差项的方差。一般的处理方法是首先采用普通最小二乘法估计模型，以求得随机误差的估计量（注意，该估计量是不严格的），我们称之为“近似估计量”，用表示。于是有（）即用来表示随机误差项的方差。异方差的检验有两种：图示法和解析法。一、图示法图是检验法，即可用X-Y的散点图进行判断，也可以用X-的散点图进行判断。对前者看是否存在明显的散点扩大、缩小或者复杂型趋势（即不在一个固定的带型域中）；对后者看是否能形成一斜率为零的直线。前者的图如§节图所示，后者对应的图形为：同方差 X 递增方差 X 递减方差 X 复杂型异方差 X 二、解析法戈德菲尔德--匡特（Goldfeld-Quandt）检验 G-Q检验以F检验为基础，适用于样本容量较大、异方差递增或递减的情况。 G-Q检验的步骤：将n对样本观察值（）按解释变量观察值的大小排队；将序列中间的个观察值除去，并将剩下的观察值划分为较小与较大的相同的两个子样本，每个子样样本容量均为。对每个子样分别求回归方程，并计算各自的残差平方和。分别用与表示对应较小与较大的子样本的残差平方和（自由度均为）提出假设：分别为两个子样对应的随机项误差。构造统计量 ~ 检验。给定显著性水平，确定F分布表中相应的临界值。若 EMBED ，存在递增异方差；反之，不存在递增异方差。戈里瑟（Gleiser）检验与帕克（Park）检验戈里瑟检验与帕克检验的思想是：以为解释变量，以原模型的某一解释变量为解释变量，建立如下方程：选择关于变量的不同的函数形式（如），对方程进行估计并进行显著性检验，如果存在某一种函数形式，使得方程显著成立，说明原模型存在异方差性。对一般的方程形式：通过检验的显著性，若存在统计上的显著性，表明存在异方差性。注：由于的具体形式未知，因此需要进行各种形式的试验。 §异方差的修正如果模型被检验证明存在异方差性，则需要发展新的方法估计模型，最常用的方法是加权最小二乘法（WLS）（Weighted Least Squares ）。加权最小二乘法是对原来模型加权，使之变成一个新的不存在异方差性的模型，然后采用普通最小二乘法估计其参数。例如，在递增异方差下，由于对来自的较小的子样本，其真实的总体方差较小，与回归直线拟合值之间的残差的信度较大，应予以重视；而对较大的子样本，由于真实总体的方差较大，残差反映的信息应打折扣。这就意味着，在采用OLS方法时，对较小的残差平方需要赋予较大的权数，对较大的赋予较小的权数，以对残差提供的信息的重要程度作一番校正，提高参数估计的精度。加权最小二乘法，就是对加了权重的残差平方和实施OLS法：例：对一元线性回归模型，如果在检验过程中已经知道：即随机误差项的方差与解释变量之间存在相关性，那么可以用去除原来的模型，使之变成如下形式的新模型：在该模型中，存在即满足同方差性。于是可以用普通最小二乘法估计其参数，得到关于参数的无偏的、有效的估计量。这就是加权最小二乘法，在这里权就是。一般情况下，对于模型： Y=XB+N 存在 E（N）=0 （）（）即存在异方差性。设其中用D-1左乘()两边，得到一个新的模型： D-1Y= D-1XB + D-1N () 即 Y*=X*B + N* 该模型具有同方差性。因为于是，可以用普通最小二乘法估计模型（），得到参数估计量为： () 这就是原模型()的加权最小二乘估计量，是无偏的、有效的估计量。这里权矩阵为，它来自于矩阵。如何得到？从前面推导过程看，它来自于原模型()残差项N的方差-协方差矩阵，因此仍然可对原模型()首先采用普通最小二乘法，得到随机误差项的近似估计量，以此构成权矩阵的估计量，即 () 加权最小二乘法具体步骤是：选择普通最小二乘法估计原模型，得到随机误差项的近似估计量；建立的数据序列；选择加权最小二乘法，以序列作为权，进行估计得到参数估计量。实际上是以乘原模型的两边，得到一个新模型，采用普通最小二乘法估计新模型。注：在实际操作中人们通常采用如下的经验方法，即并不对原模型进行异方差性检验，而是直接选择加权最小二乘法，尤其是采用截面数据作样本时。如果确实存在异方差性，则被有效的消除了；如果不存在异方差性，则加权最小二乘法等价于普通最小二乘法。 §案例——居民储蓄模型估计某地区31年来居民收入与储蓄额列表4-1 表4-1 (单位：元) 年份居民收入(X) 储蓄(Y) 年份居民收入(X) 储蓄(Y) 年份居民收入(X) 储蓄(Y) 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 8777 9210 9954 10508 10979 11912 12747 13499 14269 15522 16730 264 105 90 131 122 107 406 503 431 588 898 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 17663 18575 19535 21163 22880 24127 25604 26500 27670 28300 27430 950 779 819 1222 1072 1578 1654 1400 1829 2200 2017 1980 1981 1982 1983 1984 1985 1986 1987 1988 29560 28150 32100 32500 35250 33500 36000 36200 38200 2105 1600 2250 2420 2570 1720 1900 2100 2300 直接使用OLS法得： SE () () t () () 2、异方差检验（1）图示法检验（2）G-Q检验求两个子样本（n1=n2=12）回归方程的残差来方和RSS1和RSS2：对第一个子样本（1958~1969） SE () () t () () 对第二个子样本（1977~1988） SE () () t () () 计算F统计量。 .2= ③ 查表。在5%的显著性水平下，第1和第2自由度均为（31-7）/2-2=10的F分布临界值为。因为因此否定两组子方差相同的假设，从而该总体随机项存在递增异方差性。 3、异方差模型的估计 ① 设异方差，以去除原模型两边，得到新模型：其中运用OLS法得 SE （）（） t （）（） ② 如果用估计的作为矩阵W的主对角线元素，即相当于用为权重进行加权最小二乘估计（WLS），则有： SE （）（） t （）（）第五章序列相关性【教学目的与要求】了解（最低要求）：序列相关性的概念和后果，什么是虚假序列相关，如何避免虚假序列相关问题。掌握（较高要求）：序列相关性产生的经济背景；序列相关性检验的思路和主要检验方法；一阶序列相关（自相关）的.检验法的原理、适用范围和局限性；广义最小二乘法的基本原理；一阶差分法和广义差分法的原理和步骤；软件包中有关一阶差分法和广义差分法的应用。应用（对应用能力的要求）：应用所学知识，在本章结束前独立完成一个练习，进行序列相关性的检验和修正。【教学重点与难点】本章重点是序列相关性的概念和后果，序列相关性产生的经济背景；序列相关性检验的思路和主要检验方法。难点是一阶差分法和广义差分法的原理和步骤。【教学方法】课堂讲授、实证分析与学生自学相结合。 §序列相关性（Serial Correlation）普通最小二乘法（OLS）要求计量模型的随机误差项相互独立或不相关。如果模型的随机误差项违背了互相独立的基本假设情况，称为序列性相关。一、序列相关的概念对于模型随机误差项互相独立的基本假设表现为：如果出现即对于不同的样本点，随机误差项之间不再是完全互相独立，而是存在某种相关性，则认为出现了序列相关性。在其他假设仍成立的条件下，序列相关即意味着，或（）如果仅存在（）称为一阶序列相关，或自相关（autocorrelation）。这是最见的一种序列相关问题。自相关往往可写成如下形式：（）其中：被称为自协方差系数（coefficient of autocovariance）或一阶自相关系数（first-order coefficient of autocorrelation），是满足以下标准的OLS假定的随机干扰项：二、序列相关产生的原因 1、惯性大多数经济时间数据都有一个明显的特点，就是它的惯性。GDP、价格指数、生产、就业与失业等时间序列都呈周期性，如周期中的复苏阶段，大多数经济序列均呈上升势，序列在每一时刻的值都高于前一时刻的值，似乎有一种内在的动力驱使这一势头继续下去，直至某些情况（如利率或课税的升高）出现才把它拖慢下来。 2、设定偏误：模型中未含应包括的变量例：如果对牛肉的需求的正确模型为其中：Y=牛肉需求量，X1=牛肉价格，X2=消费者收入，X3=猪肉价格但在模型设定中做了下述回归：因此，该式中，于是在猪肉价格影响牛肉消费量的情况下，这种模型设定的偏误往往导致随机项中有一个重要的系统性影响因素，使其呈序列相关性。 3、设定偏误：不正确的函数形式例：如果真实的边际成本回归模型应为： EMBED 其中：Y=边际成本，X1=产出，但建模时设立了如下模型：因此，由于，包含了产出的平方对随机的系统性影响，随机项也呈现序列相关性。 4、蛛网现象例：农产品供给对价格的反映本身存在一个滞后期：供给价格意味着，农民由于在年度t的过量生产（使该期价格下降）很可能导致在年度t+1时削减产量，因此不能期望随机干扰项是随机的，往往产生一种蛛网模式。 5、数据的“编造” 例：季度数据来自月度数据的简单平均，这咱平均的计算减弱了每月数据的波动而引进了数据中的匀滑性，这咱匀滑性本身就能使干扰项中出现系统性的因素，从而出现了序列相关。还有就是两个时间点之间的“内插”技术往往导致随机项的序列相关性。 §序列相关性的后果计量经济学模型一旦出现序列相关性，如果仍采用普通最小二乘法估计模型参数，会产生下列不良后果： 1、参数计量非有效根据OLS估计中关于参数估计量的无偏性和有效性的证明过程，可以看出，当计量经济学模型出现序列相关性，其普通最小二乘法参数估计量仍然具有无偏性（无偏性的证明不需要随机项的同方差性以及无序列相关性假设），但不具有有效性。因为在有效性证明中利用了即同方差性和互相独立性条件。而且，在大样本情况下，参数估计量仍然不具有渐近有效性，这就是说参数估计量不具有一致性。例：在一阶序列相关的情况下，一元线性回归模型的参数的OLS估计仍有： EMBED 但上式中，右边第一项是无自相关时的参数的OLS的方差，第二项包含两个因素：随机项的自相关系数和X的序列相关系数/,如果（1）>0，即随机项存在自相关；且（2）/>0,即X存在序列正相关，则有（）在实际经济问题中的自相关，大多是正自相关，且一般经济变量X的时间序列也大多为正自相关，因此（）在多数经济问题中成立。这说明，当随机项存在自相关时，参数的OLS计量的方差较无自相关时大。 2、变量的显著性失去意义在关于变量的显著性检验中，当存在序列相关时，参数的OLS估计量的方差增大，标准差了增大，因此实际的t统计量变小，从而接受原假设=0的可能性增大，t检验就失去意义。采用其它检验也是如此。 3、模型的预测失效区间预测与参数估计量的方差有关，在方差有偏误的情况下，使得预测估计不准确，预测精度降低。所以，当模型出现序列相关时，它的预测功能失效。 §序列相关性的检验关于序列相关性的检验方法有多种，例如冯诺曼比检验法、回归检验法、.检验等。这些检验方法的共同思路是，首先采用普通最小二乘法估计模型，以求得随机误差项的“近似估计量”，用表示：然后通过分析这些“近似估计量”之间的相关性以达到判断随机误差项是否具有序列相关性的目的。一、图示法由于残差可以作为的估计，因此如果存在序列相关，必然会由残差项反映出来，因此可利用的变化图形来判断随机项的序列相关性。正序列相关（正自相关）负序列相关（负自相关）二、解析法： 1、回归检验法以为被解释变量，以各种可能的相关量，诸如以、、等为解释变量，建立各种方程： … 对方程进行估计并进行显著性检验，如果存在某一种函数形式，使得方程显著成立，则说明原模型存在序列相关性。具体应用时需要反复试算。回归检验法的优点是一旦确定了模型存在序列相关性，也就同时知道了相关的形式，而且它适用于任何类型的序列相关性问题的检验。杜宾—瓦森（Durbin-Watson）检验法最具有应用价值的是.检验，但是它仅适用于一阶自相关的检验。构造计量：（）计算该统计量的值，根据样本容量n和解释变量数目k查.分布表，得到临界值dl 和du，然后按照下列准则考察计算得到的.值，以判断模型的自相关状态。若 0<.<dl 则存在正自相关 dl<.<du 不能确定 du<.<4-dl 无自相关 4-du<.<4-dl 不能确定 4-dl <.<4 存在负自相关也就是说，当.值为2左右时，模型不存在一阶自相关。证明：展开.统计量：（）当n较大时，，，大致相等，则（）可以简化为：式中，为一阶自相关模型（）的参数估计，如果存在完全一阶正相关，即如果存在完全一阶负相关，即如果完全不相关，即从判断准则中看到，存在一个不能确定的.值区域，这是这种检验方法的一大缺陷。.检验虽然只能检验一阶自相关，但在实际计量经济学问题中，一阶自相关是出现最多的一类序列相关，而且经验表明，如果不存在一阶自相关，一般也不存在高阶序列相关。所以在实际应用中，对于序列相关问题一般只进行.检验。正自相关无自相关负自相关 dl du 2 4-du 4-dl 4 d § 序列相关性的修正如果模型被检验证明存在序列相关性，则需要发展新的方法估计模型，最常用的方法是广义最小二乘法和差分法。一、广义最小二乘法（GLS）对于模型 Y=XB+N （）如果存在序列相关，同时存在异方差，即有 E（N）=0 设 Ω=DD′ 用D-1左乘（）两边，得到一个新的模型： D-1Y=D-1XB+D-1N 即 Y*=X*B+N* （）该模型具有同方差性和随机误差项互相独立性。因为于是，可以用普通最小二乘法估计模型（），得到参数估计量为：（）这就是原模型（）的广义最小二乘估计量，是无偏的、有效的估计量。如何得到矩阵Ω？仍然是对原模型（）首先采用普通最小二乘法，得到随机误差项的近似估计量，以此构成矩阵Ω的估计量，即二、差分法差分法是一类克服序列相关性的有效的方法，被广泛地采用。差分法是将原模型变换为差分模型，分为一阶差分法和广义差分法。下面以一元线性模型为例说明。 1、一阶差分法一阶差分法是将原模型变换为（）其中如果原模型存在完全一阶正相关，即在中，。由于不存在序列相关，那么对于差分模型（），则满足应用普通最小乘法的基本假设，用普通最小二乘法估计可得到原模型参数的无偏的、有效的估计量。 2、广义差分法广义差分法可以克服所有类型的序列相关带来的问题，一阶差分法是它的一个特例。如果原模型存在：（）可以将原模型变换为：（）模型（）为广义差分模型，该模型不存在序列相关问题。采用普通最小二乘法估计该模型得到的参数估计量，即为原模型参数的无偏的、有效的估计量。 3、随机误差项相关系数的估计应用广义差分法，必须已知不同样本点之间随机误差项的相关系数。实际上，人们并不知道它们的具体数值，所以必须首先对它们进行估计。常用如下的杜宾两步法：以采用普通最小二乘法估计原模型得到的随机误差项的“近似估计值”作为方程（）的样本观测值，采用普通最小二乘法估计该方程，得到，作为随机误差项的相关系数的第一步估计值。变换方程（）为下列形式：（）即将的第一步估计值代入式（）的右边，然后再采用普通最小二乘法估计该方程，得各前的系数的第二步估计值。这就是求得随机误差项的相关系数估计值的“两步法”。将第二步估计值用于方程（）的样本观测值的计算中，然后再采用普通最小二乘法估计方程，得到原模型参数的估计量。在TSP软件包下，广义差分法是直接估计下式完成的这里代表了作为解释变量出现。三、虚假序列相关问题由于随机项的序列相关往往是在模型设定中遗漏了重要的解释变量或对模型的函数形式设定有误，这种情形可称为虚假序列相关，应在模型设定中排除。避免产生虚假序列相关性的措施是在开始时建立一个“一般”的模型，然后逐渐剔除确实不显著的变量。 §案例——地区商品出口模型估计某地区出口A类商品总值与国民生产总值的关系研究。年度总出口值 Y 国民生产总值 X 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 4010 3711 4004 4151 4569 4582 4697 4753 5062 5669 5628 5736 5946 6501 6549 6705 7104 7609 8100 22418 22308 23319 24180 24893 25310 25799 25886 26868 28134 29091 29450 30705 32372 33152 33764 34411 35429 36200 图示法检验二、.检验：回归结果：（） () t () () =, = .= 在5%在显著水平下，n=19，k=2（包含常数项），查表得dl=，du=，由于DW=<dl，故存在正自相关。三、自相关的处理 1.一阶差分法一阶差分形式为：或在软件支持下键入GENR Y1=Y-Y（-1），GENR X1=X-X（-1）构造Y与X的差分序列；键入LS Y1 C X2 估计一阶差分模型得： t () =, =, .= 由于DW> du=（注：样本容量为18个），已不存在自相关。则原模型为： 2.广义差分法：一阶广义差分的结果： t () () () =, =, .= 由于DW> du=（注：样本容量为19个），已不存在自相关。二阶广义差分的结果： t () () () () =, =, .= 由于DW> du=（注：样本容量为19个），已不存在自相关。但由于AR[2]前的系数的t值为，在5%的显著水平下，自由度为19-4=15的t分布临界值为，故∣t∣<，说明随机干扰不存在二阶序列相关性，模型中应去掉AR[2]项。第六章多重共线性【教学目的与要求】了解（最低要求）：多重共线性的概念和后果，完全共线性和一般共线性的区别。掌握（较高要求）：多重共线性产生的经济背景；多重共线性的检验；克服多重共线性的方法。应用（对应用能力的要求）：1. 应用所学知识，在本章结束前独立完成一个练习，进行多重共线性的检验和修正；2.应用所学知识，在本章结束前独立完成一个综合练习，自己选择研究对象，自己建立理论模型，自己收集样本数据，进行模型的估计和检验，对计量经济学模型中各类违背基本假设情况进行综合修正，给出模型的最终形式，最后提交一篇报告。【教学重点与难点】本章重点是多重共线性产生的经济背景；多重共线性的检验。难点是克服多重共线性的方法。【教学方法】课堂讲授、实证分析与学生自学相结合。 §多重共线性一、多重共线性的概念对于模型: （）其基本假设之一是解释变量X1，X2，…，Xk 是互相独立的。如果某两个或多个解释变量之间出现了相关性，则称为多重共线性（Multicollinearity）。如果存在 () 其中c不全为0，即某一个解释变量可以用其它解释变量的线性组合表示，则称为解释变量间存在完全共线性。如果存在（）其中c不全为0，vi为随机误差项，则称为一般共线性（近似共线性）或交互相关（intercorrelated）。在矩阵表示的线性回归模型 Y=XB+N 中，完全共线性指：秩（X）<k+1，即矩阵中，至少有一列向量可由其他列向量（不包括第一列）线性表出。例如，这时X1与X2的相关系数为1，解释变量X2对因变量的作用完全可由X1代替。完全共线性的情况并不多见，一般出现的是在一定程度上的共线性，即近似共线性。二、实际经济问题中的多重共线性一般地，产生多重共线性的主要原因有以下三个方面： 1、经济变量相关的共同趋势时间序列样本中发生多重共线性的主要原因在于许多基本经济变量存在相关的共同趋势。如经济繁荣时期，各基本经济变量（收入、消费、投资、价格）都趋于增长，经济衰退时期，则又同时趋于下降。这些变量的样本数据往往呈现某此近似的比例关系。横截面数据也有可能产生多重共线性。例如，对企业的生产函数，较大的企业其资本投入与劳动力投入都较大，较小的企业，二者的投入则较小，从而使资本投入与劳动力投入出现高度相关情况。 2、滞后变量的引入在经济计量模型中，往往需要引入滞后经济变量来反映真实的经济关系，如消费的变动不仅受当期收入的影响，还受前期收入的影响，这时在模型中引入前期和当期收入，显然它们之间有较强的线性相关性。 3、样本资料的限制由于完全符合理论模型所要求的样本数据较难收集，在现有数据条件下，特定样本可能存在某种程度的多重共线性。一般经验告诉我们，对于采用时间序列数据作样本、以简单线性形式建立的计量经济学模型，往往存大多重共线性。以截面数据作样本时，问题不那么严重，但仍然是存在的。 §多重共线性的后果计量经济学模型一旦出现多重共线性，如果仍采用普通最小二乘法估计模型参数，会产生下列不良后果： 1.完全共线性下参数估计量不存在多元线性模型 Y=XB+N 的普通最小二乘参数估计量为：（）如果出现完全共线性，则不存在，无法得到参数的估计量。例：对一个离差形式的二元回归模型如果两个解释变量完全相关，如则有该回归模型的正规方程为或解该线性方程组得：为不定式；同理，也为不定式，其值无法确定。事实上，当时，原二元回归模型退化为一元回归模型：只能确定综合参数的估计值： 2.近似共线性下普通最小二乘法参数估计量增大（但仍有效）在一般共线性（或称近似共线性）下，虽然可以得到变通最小二乘法参数估计量，但是由参数估计量方差的表达式可见，由于此时，引起主对角线元素较大，从而使参数估计值的方差增大。仍以为例，的方差为恰为x1与x2的线性相关系数的平方，由于，故。当完全不共线时，=0，当不完全共线性（近似共线性）时，即多重共线性使参数估计值的方差增大，方差扩大因子为，其增大趋势见下表：相关系数平方 0 方差扩大因子 1 2 5 10 20 25 33 50 100 1000 当完全共线性时，注意：在所有线形无偏估计量中，OLS估计量的方差最小，这是由高斯—马尔科夫定理所决定的。所以，一般共线性并未破坏最小方差性（有效性）！但是，有效（最小方差）并不意味该最小方差真的很小！ 3.参数估计量经济含义不合理如果模型中两个解释变量具有线性相关性，例如x1和x2，那么它们中的一个变量可以由另一个变量表征。这时，x1和x2前的参数并不反映各自与被解释变量之间的结构关系，而是反映它们对被解释变量的共同影响。所以各自的参数已经失去了应有的经济含义，于是经常表现出似乎反常的现象，例如本来应该是正的，结果恰是负的。 4.变量的显著性检验失去意义存在多重共线性时，参数估计值的方差与标准差变大，从而使t统计量的拒绝域（临界域）变小（临界值）增大，从而容易使通过样本计算的t值小于临界值，误导作出参数为0的推断，可能将重要的解释变量排除在模型之外。 5.模型的预测功能失效变大的方差容易使区间预测的“区间”变大，使预测失去意义。 §多重共线性的检验由于多重共线性表现为解释变量之间具有相关关系，所以用于多重共线性的检验方法，主要是统计方法。例如判定系数检验法、逐步回归检验法等。多重共线性检验的任务是：（1）检验多重共线性是否存在；（2）估计多重共线性的范围。一、检验多重共线性是否存在 1、对两个解释变量的模型，采用简单相关系数法求出X1与X2的简单相关系数，若接近1，则说明两变量存在较强的多重共线性。 2、对多个解释变量的模型，采用综合统计检验法若在OLS下，模型的R2与F值较大，但各参数估计值的t检验值较小，说明各解释变量以Y的联合线性作用显著，但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨，故t检验不显著。二、判断存在多重共线性的范围如果存在多重共线性，需进一步确定究竟由哪些变量引起。 1.判定系数检验法使模型中每一个解释变量分别以其余解释变量为解释变量进行回归计算，并计算相应的拟合优度，也称为判断系数。如果在某一种形式判定系数较大，则说明在该形式中作为被解释变量的可以用x1,x2,…,xl的线性组合代替，即与x1,x2,…,xl之间存在共线性。等价的检验是对上述回归方程作F检验，即构造如下F统计量：式中为第j个解释变量对其他解释变量的回归方程的决定系数，若存在较强的共线性，则较大且接近于1，这时（1-）较小，从而Fj的值较大。因此，可以给定的显著性水平a，通过计算F值的方法进行检验。另外，另一等价的检验是，在模型中排除某一个解释变量xj，估计模型，如果拟合优度与包含xj时十分接近，则说明xj与其它解释变量之间存在共线性。 2.逐步回归法以Y为被解释变量，逐个引入解释变量，构成回归模型，进行模型估计。根据拟合优度的变化决定新引入的变量是否因以用其它的线性组合代替，而不作为独立的解释变量。如果拟合优度变化显著，则说明新引入的变量是一个独立解释变量；如果拟合优度变化很不显著，则说明新引入的变量不是一个独立解释变量，它可以用其它变量的线性组合代替，也就是说它与其它变量之间存共线性关系。 §克服多重共线性的方法如果模型被检验证明存在多重共线性，则需要发展新的方法估计模型，最常用的方法有三类。 1.第一类方法：排除引起共线性的变量找出引起多重共线性的解释变量，将它排除出去，是最为有效的克服多重共线性问题的方法。以逐步回归法得到最广泛的应用。 2.第二类方法：差分法对于以时间序列数据为样本、以直接线性为模型关系形式的计量经济学模型，将原模型变换为差分模型可以有效地消除存在于原模型中的多重共线性，这是由经济时间序列数据的内在性质决定的，一般讲，增量之间的线性关系远比总量之间的线性关系弱得多。下面以消费与收入的数据加以说明。表收入与消费的总量与增量数据 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 4901 5489 6076 7164 8792 10133 11784 14704 16466 18320 21280 25864 34501 47111 59405 68498 2976 3309 3638 4021 4694 5773 6542 7451 9360 10556 11362 13146 15952 20182 27216 34529 .6072 .6028 .5996 .5631 .5339 .5697 .5552 .5067 .5684 .5762 .5339 .5083 .4624 .4284 .4581 .5041 588 587 1088 1628 1441 1651 2920 1762 1854 2960 4584 8637 12610 12294 9093 333 329 383 673 1079 769 909 1909 1196 806 1784 2860 4230 7034 7313 .5663 .5605 .3520 .4134 .7488 .4658 .3113 .6451 .2723 .3892 .3249 .3354 .5721 .8042 表中，Y表示国内生产总值，表示前一年的消费额，、分别表示二者的增量。由表中的比值可以直观地看到，增量的线性关系弱于总量之间的线性关系。进一步分析得到，Y与之间的判定系数为，与之间的判系数为。一般认为，两个变量之间的判定系数大于时，二者之间存在线性关系。所以原模型经检验被认为具有多重共线性，而差分模型则可以认为不具有多重共线性。 §案例——服装市场需求函数根据理论和经验分析，影响居民服装类支出的主要因素有：可支配收入、流动资产拥有量、服装价格指数以及物价总指数。已知某地区的如下资料，建立服装消费支出模型。年份服装支出Y（百万元）可支配收入（百万元）流动资产K（百万元）服装类价格指数P1（1984=100）总物价指数P0（1984=100） 1979 92 94 1980 88 92 95 1981 96 97 1982 29 94 97 1983 34 100 100 1984 131 40 101 101 1985 148 44 105 104 1986 49 112 109 1987 51 112 111 1988 53 112 111 设服装的需求模型为：（1）用OLS法估计上述模型： () () () () () t () () () () () R2= = F= 由于R2较大且接近于1，而且F=>（4,5）=，故认为服装支出与上述解释变量间总体线性关系显著。但由于其中参数K的估计值的t检验值较小（未能通过检验），故解释变量间存在多重共线性。（2）检验简单相关系数列出X，K，P1，P0的相关系数矩阵： r r r X,K K,P1 P1,P0 X,P1 K,P0 X,P0 各解释变量间存在高度相关性，其中尤其以X，K间的相关系数为最高。（3）找出最简单的回归形式分别作Y与X，K，P1，P0间的回归： ① EMBED =+ ② EMBED =+ t () () t () () R2= F= R2= F= ③ EMBED =+ ④ EMBED =+ t () (1253) t () () R2= F= R2= F= 可见，服装支出受可支配收入的影响最大，与经济理论相符合，因此选①为基本的回归模型。（4）逐步回归将其他解释变量分别导入上述初始模型，寻找最佳回归方程。 C X K P1 P0 R2 F Y=f(X) t Y=f(X,P1) t Y=f(X,P1,K) Y=f(X,P1,P0) Y-f(X,P1,P0,K) 分析： ①在初始模型中引入P1，模型拟合优度提高，且参数符号合理，但P1的t检验未通过； ②再引入K，拟合优度虽有提高，但K与P1的t检验值及F检验值有所下降，表明引入K并未对回归模型带来明显的“好处”，K可能是多余的； ③去掉K，加入P0，拟合优度有所提高，且各解释变量的t检验全部通过，F值也增大了。 ④将4个解释变量全部包括进模型，拟合优度未有明显改观，K的t检验未能通过，K显然是多余的。结论：回归方程Y=f(X,P1,P0)为最优。作业题：经济理论表明，家庭消费支出（Y）不仅取决于可支配收入（X），还取决于个人财富（K），即有模型：试用下面样本数据估计该模型，并判断所估模型是否可靠。编号 Y X K 1 70 80 810 2 65 100 1009 3 90 120 1273 4 95 140 1425 5 110 160 2693 6 115 180 1876 7 120 200 2052 8 140 220 2201 9 155 240 2435 10 150 260 2686 第七章随机解释变量和虚拟变量【教学目的与要求】了解（最低要求）：随机解释变量的概念和后果，模型中引入虚拟变量的作用，虚拟变量的设置原则。掌握（较高要求）：工具变量方法的概念、工具变量的选取、工具变量的应用、关于工具变量法参数估计量的正规方程组和工具变量法参数估计量的矩阵表示，软件包（例如）中工具变量方法的应用。应用（对应用能力的要求）：应用所学知识，在本章结束前独立完成一个练习，自己选择研究对象，建立虚拟变量模型，自己收集样本数据，进行模型的估计和检验，最后提交一篇报告。【教学重点与难点】本章重点是工具变量方法的概念、工具变量的选取、工具变量的应用、关于工具变量法参数估计量的正规方程组和工具变量法参数估计量的矩阵表示；模型中引入虚拟变量的作用，虚拟变量的设置原则。难点是工具变量的应用。【教学方法】课堂讲授、实证分析与学生自学相结合。 §随机解释变量问题单方程线性计量经济学模型假设之一是：，即解释变量与随机项不相关。这一假设实际是要求：或者X是确定性变量，不是随机变量；或是解释变量虽是随机变量，但与随机误差项不相关。违背这一假设设的问题被称为随机解释变量问题。一、随机解释变量问题对于模型 () 其基本假设之一是解释变量X1，X2，…，Xk是确定性变量。如果某个或多个随机变量作解释变量，则称为随机解释变量问题。为讨论方便，我们假设（）中X2为随机解释变量。对于随机解释变量问题，又分三种不同情况： 1、随机解释变量与随机误差项不相关。即 () 2、随机解释变量与随机误差项在小样本下相关，在大样本下渐近无关。即在小样本下在大样本下 Plim () 这里的符号Plim表示概率极限，等同于 P(lim)=1 随机解释变量与随机误差项高度相关。并且 Plim () 二、实际经济问题中的随机解释变量问题在实际经济问题中，经济变量往往都具有随机性。但是在单方程计量经济学模型中，凡是外生变量都有被认为是确定性的。于是随便机解释变量问题主要表现于用滞后被解释变量作为模型的解释变量的情况。而由于经济活动具有连续性，使得这类模型在以时间序列数据作样本的模型中占据较大份额。例如，消费不仅受收入的影响，还受前期消费水平的影响；投资不仅受收入的影响，还常驻前期投资水平的影响；等等。但是，并不是所有包含滞后被解释变量的模型都带来“随机解释变量问题”，下面通过几个例子如以说明。例如，耐用品的存量由前一个时期的存量和当其收入共同决定，于是著名的“耐用品存量调整模型”表示为： t=1,2,…,T () 这是一个滞后被解释变量作为解释变量的模型。但是，如果模型有存在随机误差项的序列相关性，那么随机解释变量只与相关，与不相关，属于上述的第1种情况。再如，著名的“合理预期的消费函数模型”的建模过程如下。首先认为消费是由对收入的预期所决定的，或者说消费是有计划的，而这个计划是根据对收入的预期制定的。于是有：其中表示t期收入预期值。而预期收入与实际收入之间存在差距，表现为：该式是由合理预期理论给出的。那么就容易推得： () 在该模型中，作为解释变量的不仅是一个随机解释变量，而且与模型的随机误差项高度相关，（因为与高度相关）。属于上述第3种情况。三、随机解释变量的后果计量经济学模型一旦出现随机解释变量，如果仍采用普通最小二乘法估计模型参数，不同性质的随机解释变量会产生不同的后果。将()写成矩阵形式 Y=XB+N 其普通最小二乘参数估计量为：取期望值，有（）可见，随机解释变量带来什么后果取决于它与随机误差项是否相关。 1、随机解释变量与随机误差项不相关这时采用普通最小二乘法估计模型参数，得到的参数估计量仍然是无偏估计量。 2、随机解释变量与随机误差项在小样本下相关，在大样本下渐近无关根据（）和()，这时采用普通最小二乘法估计模型参数，得到参数估计量在小样本下是有偏的，在大样本下具有渐近无偏性。 3、随机解释变量与随机误差项高度相关根据()和()，这时采用普通最小二乘法估计模型参数，得到的参数估计量在小样本下是有偏的，在大样本下也不具有渐近无偏性。普通最小二乘法失效，需要发展新的方法估计模型。 4、滞后被解释变量作解释变量，并且与随机误差项相关如果模型中的随机解释变量是滞后被解释变量，并且与随机误差项相关时，除了普通最小二乘法参数估计量是有偏的估计量之外，还带来两个后果；一是模型必然具有随机误差项的自相关性。因为该滞后被解释变量与滞后随机误差项相关，又与当期误差项相关。二是.检验统计量失效。因为不管.统计量是多少，随机误差项的自相关性总是存在的。例：假设一元回归模型为 () 式中，除X为随机变量，且之外，模型其他基本假定均满足。()式的离差形式为： () 相应的回归方程为： () 由于在OLS法下，估计量与其真值有如下关系： () 随机解释变量X与随机项的关系没，参数OLS估计量的统计性质也会不同。（1）如果X与不相关，即，于是，从而：从而有：，即是的无偏估计。（2）如果X与在小样本下相关，在大样本下渐近无关，即，但Plim 则：但：，即是的一致估计。（3）如果果X与高度相关，即，且，则，即是的非一致估计。四、工具变量法如果模型中出现随机解释变量并且与随机误差项相关时，普通最小二乘法就不能用于模型参数的估计。最常用的估计方法是工具变量法（Instrument variables）。 1、工具变量的选取工具变量，顾名思义是在模型估计过程中被作为工具使用，以替代模型中与随机误差项相关的随机解释变量。那么，选择为工具变量的变量必须满足以下条件：与所替代的随机解释变量高度相关；与随机误差项不相关；与模型中其它解释变量不相关，以避免出现多重共线性。 2、工具变量的应用工具变量法是克服X与相关影响的一种参数估计方法。以一元回归模型（）的离差形式（）为例说明如下。用普通最小二乘法估计模型（），最后归结为求解一个关于参数估计量的正规方程组：（）并利用，或而得出如果原模型中x是随机解释变量并且与随机误差项相关，就不能被视为0，从而无法求出。如果按照工具变量的选择条件选择z为x的工具变量，那么在估计过程中有用x而改用z乘以模型的两边，使得（）变为： () 利用工具变量与随机误差项不相关的性质，即，由()可得：关于的估计，仍用完成。这种求模型参数估计量的方法称为工具变量法。对于矩阵形式： Y=XB+N 采用工具变量法（假设X2与随机项相关，用工具变量Z替代）得到的正规方程组为：参数估计量为： () 其中：通常，对于没有选择另外的变量作为工具变量的解释变量，可以认为用自身作为工具变量。于是Z被称为工具变量矩阵。 3、工具变量法估计量是无偏估计量用工具变量法所求的参数估计量与总体参数真值之间的关系为两边取概率极限得：如果工具变量z的选取恰当，即有，则有：在矩阵形式下，对（）取期望：其中利用了工具变量与随机误差项不相关。 § 虚拟变量模型许多经济变量是可以定量的，如商品需求量、价格、收入、产量等，但也有一些影响经济变量的因素无法定量度量，如职业、性别对收入的影响，战争、自然灾害对GDP的影响，季节对某些产品（如冷饮）的销售量的影响等等。为了在模型中能够反映这些因素的影响，并提高模型的精度，需要将它们“量化”，这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型，构造只取“0”或“1”的人工变量，通常称为虚拟变量（dummy variables）记为D。例如，反映文化程度的虚拟变量可取为：一般地，在虚拟变量的设置中，类型、肯定类型取值为1；比较类型取值为0。同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析(analysis-of variance: ANOVA)模型。一个以性别为虚拟变量来考察教授薪金的模型如下：其中：为学院教授的薪金，为教龄，=1，若是男性，=0，若是女性。一、虚拟变量的引入虚拟变量做为解释变量引入模型有两种基本方式：加法方式和乘法方式。 1、加法方式上述学院教授薪金模型中性别虚拟变量的引入采取了加法方式，即模型中将虚拟变量以相加的形式引入模型。在该模型中，如果仍假定，则学院女教授的平均薪水金为：学院男教授的平均薪金为：从几何意义上看（图）假定，则两个函数有相同的斜率，但有不同的截距。意即，男女教授平均薪金对教龄的变化率是一样的，但两者的平均薪金水平相差。可以通过传统的回归检验，对的统计显著性进行检验，以判断学院男女教授的平均薪金水平是否有显著差异。年薪Y 男教授女教授教龄X 图又例：在横截面数据基础上，考虑个人保健支出以个人收入和教育水平的回归，教育水平考虑三个层次：高中以下，高中，大学及其以上，这时需要引入两个虚拟变量：模型可设定如下：在的初始假定下，容易得到高中以下、高中、大学及其以上教育水平下个人保健支出的函数：高中以下：高中：大学及其以上：假定，则其几何意义见图。大学教育高中教育低于中学教育收入图还可将多个虚拟变量引入模型中以考察多种“定性”因素影响。如在上述教授年薪的例中，再引入代表肤色的虚拟变量D2，D2=1，若为白色，D2=0，若为其他肤色，则学院教授年薪的回归模型可设计如下：于是，不同性别、不同肤色教授的平均年薪金分别由下面各式给出：黑人女教授的平均薪金：黑人男教授的平均薪金：白人女教授的平均薪金：白人男教授的平均薪金： 2、乘法方式加法方式引入虚拟变量，可以考察截距的不同，而在许多情况下，往往是斜率就有变化，或斜率、截距同时发生变化。斜率的变化可通过以乘法的方式引入虚拟变量来测度。例：根据消费理论，消费水平C主要取决于收入水平Y，但在一个较长的时期，人们的消费倾向会发生变化，尤其是在自然灾害、战争等反常年份，消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。如：，则消费模型可建立如下：这里，虚拟变量D以与X相乘的方式引入了模型中，从而可用来考察消费倾向的变化。在的假定下，上述模型表示和函数可化为： C 正常年份正常年份：反常年份反常年份： X 图当截距与斜率发生变化时，则需要同时引入加法与乘法工的虚拟变量。例，表中给予出了英国1946~1963年个人储蓄与收入的数据，由于1946~1954年为第二次世界大战后的重建期，1955~1963年为重期后期，想要判断这两个时期的总储蓄-收入关系是否发生变化。表 1946~1963年英国个人储蓄与收入数据（百万英镑） Period1 Savings Income Period II Savings Income 1946 1947 1948 1949 1950 1951 1952 1953 1954 10 11 1955 1956 1957 1958 1959 1960 1961 1962 1963 以Y为储蓄，X为收入，可令：重建期：重建后期：则有可能出现下述四种情况中的一种：（1），且，即两个回归相同，称为重合回归(Coincident Regressions )；（2），但，即两个回归的差异仅在其截距，称为平行回归（Parallel Regressions ）；（3），但，即两个回归的差异仅在其斜率，称为汇合回归（Concurrent Regressions ）；（4），且，即两个回归完全不同，称为相异回归（Dissimilar Regressions）。可以在两个时段以上作出两个回归，通过统计技术检验上述的可能情形，并判断两个时期的储蓄函数是否已发生变化（即参数已发生显著变化）。这一问题也可通过引入乘法形式的虚拟变量来解决。将例中的n1与n2次观察值合并，并用以估计以下回归：其中Y，X分别代表储蓄与收入，Dt为引入的虚拟变量，则有：可分别表示重建后期与重建期两个时期的储蓄函数。在统计检验中，如果等于0的假设被拒绝，则说明两个时期中储蓄函数的斜率不同。具体的回归结果为： t = () () () () = 由与的t检验可知，该两参数显著地不等于0，强烈示出两个时期的回归是相异的，储蓄函数分别为：重建时期：重建后期： 3、临界指标的虚拟变量的引入在经济转折时期，可通过建立临界指标的虚拟变量模型来反映。例如，进口消费品数量Y主要取决于国民收入X的多少，中国在改开放前后，Y对X的回归关系明显不同。这时，可以t*=1979年为转折期，以1979年的国民收入为临界值，设如下虚拟变量：，则进口消费品的回归模型可建立如下：如果用OLS法得到该模型的回归方程为则两时期进口消费品函数分别为： Y 当=1979年，当=1979年，其几何图形见图。 X t* X 图二、模型中引入虚拟变量的作用 1.分离异常因素的影响； 2.考察不可试题的“定性”因素的不同属性类型对因变量的作用； 3.提高模型精度。三、虚拟变量的设置原则虚拟变量的个数须按以下原则确定：每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1，即如果有m个定性变量，只在模型中引入m-1个虚拟变量。例。已知冷饮的销售量Y除受k种定量变量Xk的影响外，还受春、夏、秋、冬四季变化的影响，要考察该四季的影响，只需引入三个虚拟变量即可：则冷饮销售量的模型为：在上述模型中，若再引入第四个虚拟变量麦，则冷饮销售量模型变为：其矩阵形式为：如果只取六个观测值，其中春季与夏季取了两次，秋、冬各取到一次观测值，则式中的：显然，（X，D）中的第1列可表示成后4列的线性组合，从而（X，D）不满秩，参数无法唯一求出。这就是所谓的“虚拟变量陷井”，应避免。第八章单方程计量经济学应用模型【教学目的与要求】了解（最低要求）：常用的生产函数模型、消费函数模型、需求函数模型的理论模型和估计方法；在中国、建立与应用生产函数模型、需求函数模型、消费函数模型过程中实际问题的处理。掌握（较高要求）：常用的生产函数模型、需求函数模型、消费函数模型的理论模型是如何提出与发展的；在实践中自己提出与发展新的模型的方法论基础；其它常用的单方程模型，例如投资函数模型和货币需求函数模型的建模思路。应用（对应用能力的要求）：分别选择一个研究对象，建立中国的实际模型。例如某个行业的生产函数模型、某种商品的需求函数模型、某类消费者的消费函数模型。【教学重点与难点】本章重点是常用的生产函数模型、消费函数模型、需求函数模型的理论模型和估计方法；在中国、建立与应用生产函数模型、需求函数模型、消费函数模型过程中实际问题的处理。难点是在中国、建立与应用生产函数模型、需求函数模型、消费函数模型过程中实际问题的处理。【教学方法】课堂讲授、实证分析与学生自学相结合。 §生产函数模型一、生产函数 1、定义生产函数是描述生产过程中投入的生产要素的某种组合同它可能的最大产出量之间的依存关系的数学表达式。即（）其中Y为产出量，A、K、L分别为技术、资本、劳动等投入要素。生产要素对产出量的作用与影响，主要是由一定的技术条件决定的，所以，从本质上讲，生产函数反映了生产过程中投入要素与产出量之间的技术关系。根据经济理论，达到同样的产出，要以有多个不同的要素组合方案，但投入要素组合比例在完全竞争的市场条件下是遵循利润最大化原则的方向变动。以WL、WK表示两种投入要素劳动力L和资本K的价格，P为产出价格，∏为利润，则生产问题可表述为：（）于是利润最大化的必要条件为：即：（）生产函数利润最大化的一阶条件为：某种投入要素的边际产出等于该种要素价格与产出价格之比。 2、基本性质 1）生产要素的不可完全代替性（）生产过程要有产出，两种生产要素都是必不可少的。 2）产出递增性（）在一种生产要素固定时，另一种要素的增加会导致产出的增加。 3）边际效益递减性（）在一种投入要素固定时，另一种要素单位投入增量带来的产出增量越来越少。二、几个重要概念 1、弹性（Elasticity）弹性，又称产出的要素弹性。指某种要素投入相对变化一个单位所引起的产出的相对变化量。如：产出的劳动（投入）弹性= （）产出的资本（投入）弹性= （） 2、边际替代率（Marginal Rate of Substitution ）边际替代弹性是衡量不同要素间相互替代程度的经济学指标之一，表示减少一个单位的某种投入要素，要使原产出量不变，必须同时增加另一要素的投入量。在等产量线（图）下，当要素组合由A点变到B点，即在要素投入变化dK,dL时，由于有因此要素间边际替代率可定义为： K 资本对劳动的边际替代率：劳动对资本的边际替代率： L 图资本对劳动的边际替代率表示：当减少一个单位的劳动投入，必须增加单位的资本，才能使产出量保持不变，说明减少一个单位的劳动可用增加个单位的资本来代替。由利润最大化一阶条件可得，边际替代率（） 3替代弹性（Elasticity of Substitution）要素替代弹性，是描述投入要素之间替代性质的一个量，主要用于描述要素之间替代能力的大小。将要素替代弹性定义为两种要素的比例的变化率与边际替代率的变化率之比，一般用表示。则有 () 一般地，要素替代弹性的取值有以下三种可能性： 0<<∞，表明要素之间具有有限可替代性。 =0，表明要素之间不可以替代，此时K/L不变； =∞，表明无论要素的数量增加或者减少，其边际产量不变，表明要素之间具有无限可替代性。 4、规模报酬（returns-to-scale）规模报酬用来衡量随着要素投入的成倍扩大，产出是否同倍增长。设有任意，对生产函数，如果（1），称为规模报酬不变，表明L，K均扩大倍，产出也相应扩大倍；（2），称为规模报酬递增；（3），称为规模报酬递减。具有规模报酬不变的生产函数在数学上称为一次齐次函数。关于一次齐次函数有如下欧拉定理：（）根据利润最大化一阶条件可得：（）即：劳动力要素收入+资本要素收入=总产出价值表明要市场完全竞争和利润最大化条件下，不变规模报酬意味着要素总收入等于总产出。三、C-D生产函数及其估计 1、模型形式与参数的含义 1928年美国数学家Charles Cobb和经济学家Paul Dauglas提出的生产函数的数学形式为：（）其中，A，α，β是正的参数，该生产函数被称为C-D生产函数。该生产函数有如下特点：（1）不变弹性根据要素的产出弹性的定义，很容易推出：（）（）即参数α，β分别是资本与劳动的产出弹性。（2）要素替代弹性为1 根据()式，可以得到：（）（3）产出弹性之和是函数齐次性的阶（）若=1，C-D生产函数为规模报酬不变；>1，C-D生产函数为规模报酬递减；<1，C-D生产函数为规模报酬递减。（4）函数是对数线性的（）其中，a=lnA 2、C-D生产函数的估计 C-D生产函数的估计通常有如下几种方法：（1）对数线性形式的OLS估计对C-D生产函数的对数线性形式（）根据Y，K，L三组实际观测值，可直接进行OLS估计。该种估计方法存在如下问题； 1）估计中常需要作异方差和多重共线性问题的处理。在样本点来自横截面积数据的情况下，容易出现异方差；而在同一生产结构的企业间，劳动力与资本的比例大致相同，容易出现多重共线性。 2）采集到满足生产理论要求的产出和要素投入数据有困难。一般地，资本K与劳动L都有是实际投入使用的服务流量，Y也是增加值，同时，产出Y与资本K往往要求是不变价指标，而L作为劳动投入流量，也应换算成可比的形式。这里最困难的是资历本服务流量如何取得的问题。在实际应用中，L一般可用劳动力近似替代。K用固定资产存量与流动资产之和表示，但在农业部门只能用农业生产费用表示。（2）生产函数强度形式的OLS估计如果规模报酬不变，=1，则（）可写成或（）这里，Y/L表示劳动生产率，K/L表示劳动技术装备系数，分别为两个强度指标。变换后的模型消除了多重共线性，也同时缓解了异方差的影响，因此常被使用。（3）份额法估计在规模报酬不变、市场完全竞争和利润最大化条件下，可彩计算投入要素所得份额的方法来估计C-D生产函数的参数。由利润最大化一阶条件可得：（8,）在K，L分别表示资本要素与劳动要素服务流量的情况下，YP为国民收入。由于假设规模报酬不变，则由（8,）式知： =国民收入中资本所得（利润）所占份额； =国民收入中劳动者工资收入所占份额。这一方法不需要进行回归计算，甚至也不要求有资本投入K的数据。只要有工资总收入WLL和国民收入YP两个数据即可估计。同时该方法还可估计参数的时间序列：（8,）该方法的缺点是过分依赖不变规模报酬及市场完全竞争这两个假设，与实际不尽相符。例：某国营工业企业资料如表。试估计该企业的C-D生产函数。表某国营工业企业资料单位：亿元，千人年份总产值（Y）职工人数（L）固定资产原值+定额流动资金余额（K） 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 方法1：对数线性形式的OLS估计 ln(Y)=C(1)+C(2)*ln(L)+C(3)*ln(K) Coefficient t-Statistic C(1) C(2) C(3) R-squared Adjusted R-squared F-statistic Durbin-Watson stat 即：方法2：强度形式的OLS估计 ln(Y/L)=C(1)+C(2)*ln(K/L) Coefficient t-Statistic C(1) C(2) R-squared Adjusted R-squared F-statistic Durbin-Watson stat 由参数的显著性看，方法二得到的生产函数更好一些。四、不变替代弹性（CES）生产函数模型（1）模型形式与参数的含义形如：（）的生产函数，称为不变替代弹性（Constant Elasticity of Substitution）生产函数模型，简称CES生产函数模型。其中，待估参数A为效率系数，是广义技术进步水平的反映，显然，应该有A>0；和为分配系数，反映资本或劳动密集程度，0<<1，0<<1，并且满足+=1；为替代参数。考察CES生产函数的如下特征： 1）关于模报酬特征由于即当资本与劳动的数量同时增长倍时，产出量也增长倍。后来，在应用中取消了这一假定，将（）式改写为：（）对（）有：即承认研究对象可以是规模报酬递增的，也可以是规模报酬递减的，取决于参数m的估计结果。于是参数m为规模报酬参数，当m=1(<1,>1)时，表明研究对象是规模报酬不变（递减、递增）的。（）为实际应用的CES生产函数模型的理论形式。 2）要素替代弹性对模型()，要素替代弹性为：因为所以（）由于要素替代弹性为一正数，所以参数的数值范围为： -1<<∞ 由（）可以看出，一旦研究对象确定、样本观测值给定，可以得到参数的估计值，并计算得到要素替代的估计值。对于不同的研究对象，或者同一研究对象的不同的样本区间，由于样本观测值不同，要素替代弹性是不同的。这使得CES生产函数比C-D生产函数更接近现实。但是，在CES生产函数中，仍然假定要素替代弹性与样本点无关，这就是不变替代弹性生产函数模型的“不变”的含义。而这一点，仍然是与实际不符的。在不变替代弹性生产函数模型中，如果参数的估计值趋于0，则要素替代弹性的估计值趋于1，此时CES生产函数模型退化为C-D生产函数：（2）CES生产函数模型估计对于一般的CES生产函数模型为一个关于参数的非线性模型，采用简单的方法难以化为线性模型。一般可采用对数后再按台劳展开化为线性模型直接进行估计的方法。将CES生产函数模型的计量形态假设为：两边取对数，得到： - () 将其中的在=0处展开台劳级数，取0阶、1阶和2阶项，代入()中，得到： () ()为一个简单线性模型，通过变量置换，可以表示成：采用单方程模型的估计方法，得到的估计值，利用对应关系和，可以计算得到关于参数的估计值。选择在=0处展开台劳级数，是因为当=0时，要素替代弹性等于1，即模型退化为C-D生产函数，由于C-D生产函数的普遍适用性，所以可以假定为接近于0的数。当参数估计完成后，可以根据的估计值是否接近于0来检验这种估计方法的可用性。从()中可以看出，当=0时，方程为：即为C-D生产函数模型。所以可以认为CES生产函数模型是对C-D生产函数模型的修正。 §需求函数模型一、需求函数 1、需求函数在消费者支付能力有限的条件下，需求函数是建立在消费者合理选择商品组合以使其效用最大这一假设基础之上的。设表示消费者第种商品的购买量，U表示消费者的效用，则有如下效用函数（）效用函数是满足消费者欲望或需求程度的一种顺序表示，它是连续的递增函数且二阶可微。以I表示消费者收入：为各种商品的价格，则消费者选择商品组合以达到最大效用就是求解如下极值问题：（）其拉格朗日函数为最优商品组合的必要条件为：（）解（）可得各种商品的需求函数（）其中，表示对第种商品的需求量：I为收入：为各种商品的价格；为商品的数目。一般来讲，影响需求量的主要是收入与价格；对于一些特定的商品和特定的情况，也会在需求函数中引入其它的解释变量，例如耐用品的存量、一般消费品的消费习惯等。总之，需求函数反映了商品的需求行为和需求规律，反映了解释变量与被解释变量之间的因果关系，所以可以用于需求的结构分析和需求预测。 2、需求函数的性质（1）非负性（2）可加性（3）零阶齐次性对任意非零常数k，即当所有商品价格与收入按同一比例k变动时，需求量保持不变。（4）单调性如果固定第种商品以外的其他商品的价格及消费者收入，则第种商品的需求函数是其自身价格的单调递减函数；如果固定全部商品的价格，商品需求函数是消费者收入的递增函数（恩格尔()曲线。（5）对称性即，第j种商品价格对第种商品价格的影响，等于第种商品价格对第j种商品价格的影响。 3、需求函数形式常见的需求函数有下列几种形式：（1）线性需求函数（） (2)半对数需求函数（）（3）不变弹性形式需求函数（） 4、需求影响因素由需求函数知，影响商品需求量的主要因素是自价格（该商品的价格），互价格（其他商品的价格）以及消费者的可支配收入。它们对商品需求程度的程度可用需求弹性系数加以度量。（1）需求的收入弹性需求的收入弹性定义为当所有商品的价格不变时，收入变化1%所引起的第种商品需求量的变化百分比。即 () （2）需求的自价格弹性需求的收入弹性定义为当收入和其它商品的价格不变时，第种商品价格变化1%所引起的第种商品需求量的变化百分比。即（8,2,9）（3）需求的互价格弹性需求的互价格弹性定义为当收入和其它商品的价格不变时，第种商品价格变化1%所引起的第种商品需求量的变化百分比。即（8,2,10） 5、单一需求方程估计对单一需求方程的估计主要用OLS法。例：使用截面估计调查资料，求恩格尔曲线。表某地某年职工家庭收支调查资料单位：10无/月按人均月收入分组人均生活费支出Y 人均总支出 Z=∑Ci 人均消费Ci=piqi 食品衣着燃料用品非商品 20以下 20~25 25~30 30~35 35~40 40~45 45~50 50~55 55~60 60以上平均数假定加剧格尔曲线为线性函数其中,为第种商品人均消费量,即需求量,Y为人均生活费支出，通过OLS法，可分别得出食品、衣着、燃料、用品和非商品五个类别的恩格尔曲线：商品类别 t t F 食品衣着燃料日用品非商品二、线性支出系统需求函数模型及其参数估计 1、线性支出系统严格地说，需求系统是在所有商品价格给出后，消费者根据自己的预算支出来寻求商品的某种组合以使效用最大，因此各种商品需求量是在系统中同时决定的。对于线性需求系统、对数需求系统，由于函数设定本身没有要求满足上述约束条件，从而使商品需求函数实际成为单独估计，因此可能证明它们或者不满足需求函数的某些性质，或者需要很强的假设才能满足这些性质，利用它们作系统研究（许多商品组合需求的研究），并非最合适。线性支出系统需求函数模型(LES, Linear Expenditure System),是斯通（）于1954年提出的一种需求系统。线性支出系统的效用函数为（）其中，为对第种商品的基本需求量。在预算约束下极大化，即构造如下的拉格朗日函数： () 由极值条件得到如下方程组： () 该方程组中共有n+1个方程，求解该方程组即得到线性支出系统需求函数。对于前n个方程，由于有，两边求和，并解出得：因而有：最后得到线性支出系统： () 这里，为第种商品基本需求量，为第种商品的消费支出，V总消费支出（预算），为可任意支配的预算支出部分；为第种商品的边际预算份额。可以将（）写成 () 线性支出系统需求函数的经济意义十分清楚。对第种商品的需求量等于两部分之和。第一部分为基本需求量，即维持基本生活所表现的；第二部分为总预算扣除对所有商品的基本需求支出后剩余部分中愿意用于对第种商品的需求，与消费者的偏好有关。可以证明，该线性支出系统满足需求函数的所有性质。 2、线性支出系统满足估计中的困难线性支出系统需求函灵敏（）中待估参数为基本需求量和边际预算份额。但是，由于总预算V是对所有商品的需求支出之和，是内生变量，无法外生给出，使得模型难以估计。所以线性支出系统需求函数并没有被实际应用。 3、扩展的线性支出系统需求函数模型（ELES）（1）扩展的线性支出系统需求函数为克服LES在估计上的困难，1973年Liuch对LES作了两点修改，提出了扩展的线性支出系统需求函数模型。这两点修改是：以收入I代替预算V；将的概念由边际预算份额改为边际消费倾向。于是模型表达式为：（）其中，待估计参数为基本需求量和边际消费倾向。由收入和价格的样本观测值可以对模型进行估计。（2）扩展的线性支出系统需求函数与线性支出系统需求函数的关系由（）式可得：（）将I代入（）式，并注意到，（）与（）式比较，两者经济内容相同，对应参数应该相等，因此（3）扩展的线性支出系统需求函数模型的估计方法第一步：用OLS法估计总支出函数（）式：（）其中，设参数估计结果为，，则可解出的估计值：第二步：令（）第三步：用OLS法估计各项商品基本消费支出和边际消费倾向，即估计各种商品的消费需求函数：（）第九章滞后变量模型【教学目的与要求】了解（最低要求）：滞后变量模型的概念，分布滞后模型的参数估计，滞后变量模型的构造及自回归模型的估计。掌握（较高要求）：掌握分布滞后模型各种估计方法的推导；自回归模型的估计方法。【教学重点与难点】本章重点滞后变量模型的概念，分布滞后模型的参数估计，滞后变量模型的构造及自回归模型的估计。难点是模型的估计。【教学方法】课堂讲授、实证分析与学生自学相结合。 § 滞后变量模型的基本概念在经济运行过程中，广泛存在时间滞后效应。某些经济变量不仅受到同期各种因素的影响，而且也受到过去某些时期的各种因素甚至自身的过去值的影响。通常把这种过去时期的，具有滞后作用的变量叫做滞后变量(Lagged Variable)，含有滞后变量的模型称为滞后变量模型。滞的变量模型考虑了时间因素的作用，使静态分析的问题有可能成为动态分析。含有滞后解释变量的模型，又称动态模型(Dynamical Model)。一、滞后效应与滞后变量因变量受到自身或另一解释变量的前几期值影响的现象称为滞后效应，表示前几期值的变量称为滞后变量。如在研究消费函数时，通常认为，本期的消费除了受本期的收入影响之外，还受前一期，或前两期收入的影响：这就是一分滞后模型，为滞后变量。二、产生滞后效应的原因 1、心理因素；人们的心理定势，行为方式滞后于经济形势的变化，如中彩票的人不可能很快改变其生活方式。 2、技术原因：如当年的产出在某种程度上依赖于过去若干期内投资形成的固定资产。 3、制度原因：如定期存款到期限才能提取，造成了它对社会购买烽的影响具有滞性。三、滞后变量模型以滞后变量作为解释变量，就得到滞后变量模型。它的一般形式为：（）式中：，为滞后时间间隔为被解释变量Y的第期滞后为解释变量X的第期滞后若滞后期s取值有限，模型称为有限分布滞后模型；若滞后期s取值无限，模型称为无限分布滞后模型；仅有解释变量滞后值的模型称为分布滞后模型(distributed-lag model)：如果模型的解释变量中包含应变量的一个或多个滞后值，则称为自回归模型(autoregressiue model)。 1、分布滞后模型分布滞后模型的一般形式为： () 系数称短期或即期乘数(impact multiplier)，表示X对Y有本期线性作用的大小，即随X一单位的变化，Y均值的同期变化；系数又称动态乘数或延迟系数，表示在各滞后期的X对Y的线性作用的大小。如果存在，则称为长期或总分布滞后模型(long-run or total distributed-lag multiplier)，表示X变动一个单位，Y累积各期所产生的影响。 2、自回归模型自回归模型的一般形式为： () 而 () 称为一阶自回归模型。 §分布滞后模型的参数估计一、分布滞后模型的OLS估计一般会遇到如下问题：没有先验准则确定滞后期长度；如果滞后期较长，将缺乏足够的自由度进行估计和检验；同名变量滞后值之间可能存在高度线性相关，即模型存在高度的多重共线性。二、分布滞后模型估计方法针对上述困难，人们在大量研究的基础上提出了一系列的修正估计方法，但并不很完善。各种方法的基本思想大致相同：即都是通过对各滞后变量加权，组成线性合成变量而有目的地减少滞后变量的数目，以缓解多重共线性，保证自由度。 1、经验加权法根据实际问题的特点、实际经验给各滞后变量指定权数，滞后变量按权数线性组合，构成新的变量。权数据的类型有：（1）递减型：即认为权数是递减的，X的近期值对Y的影响较远期值大。如消费函数中，收入的近期值对消费的影响作用显然大于远期值的影响。如滞后期为3时的一组权数可取值如下： 1/2, 1/4, 1/6, 1/8 则新的线性组合变量为：（2）矩形：即认为权数是相等的，X的逐期滞后值对值Y的影响相同。如滞后期为3时，指定相等权数为1/4，则新的线性组合变量为：（3）倒V型：在这咱形式中，假定权数先递增后递减呈倒“V”型。如在一个较长建设周期的投资中，历年投资X为产出Y的影响，往往在周期期中投资对本期产出贡献最大。设滞后期限为4，权数可取为： 1/6, 1/4, 1/2, 1/3, 1/5 则新变量为例，对一个分布滞后模型：给定递减权数：1/2, 1/4, 1/6, 1/8 令原模型变为：对该模型应用OLS法，估计出参数。假设已估计出，分别为与，则原模型的估计结果为：经验权数法的优点是简单易行，缺点是设置权数的随意性较大。通常的做法是多选几组权数，分别估计出几个模型，然后根据常用的统计检验（R方检验，F检验，t检验，D-W检验），从中选择最佳估计式。 2、阿尔蒙（A lmon）多项式法该法的主要思想仍是针对有限滞后期模型，通过阿尔蒙变换，定义新变量，以减少解释变量个数，然后有OLS法估计参数。主要步骤为：（1）阿尔蒙变换对于分布滞后模型（）假定其回归系数可用一个关于滞后期的适当阶数的多项来表示，即（）其中，m<s-1。阿尔蒙变换要求先验地确定适当阶数k，例如取k=2，得（）即：（）将（）代入（）得定义新变量将原模型转换为：（）（2）模型的OLS估计对变换后的模型（）进行OLS估计，得到参数估计，代入（）式，求出滞后分布模型参数的估计值。由于m+1<s，变换后的模型中变量间多重共线性得到缓解；自由度也由原模型的m-s变为n-m, n-m>n-s，自由度也得到了保证。阿尔蒙多项式的阶数m一般取2或3，不超过4，否则达不到减少变量个数的目的。例表9-1给出了某行业在一定时期的库存额Y与销售额X的资料，假定库存额取决于当年的销售额和其前三年的销售额，试估计以下有限分布滞后模型：表9-1 1955-1974年美国制造业库存Y和销售X（百万美元） Y X Y X 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 45069 50642 51871 50070 52707 53814 54939 58213 60043 63383 26480 27740 28736 27280 30219 30796 30896 33113 35032 37335 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 68221 77965 84655 90875 97074 101645 102445 107719 120870 147135 41003 44869 46449 50282 53555 52859 55917 62017 71398 82078 在TSP下，输入：LS Y C PDL （x，3，2，1）即可得到表9-2的结果。这里PDL（x，s，m，n）为阿尔蒙变换信息，其中s为滞后期长度，m为多项式阶数，n为选择项，取值分别为1（限制在分布的末端接近于0）、2（限制在分布的开头接近于0）、3（限制在分布的开头末端接近于0）。表9-2 回归分析结果输出 Variable Coefficient Std. Error t-Statistic Prob. C PDL01 PDL02 R-squared Adjusted R-squared F-statistic Durbin-Watson stat i Coefficient Std. Error T-Statistic 0 1 2 3 由表9-2知：通过 ()求得的分布滞后模型参数估计值为因此，最后得到分布滞后模型估计式： 3、科伊克(Doyck) 方法科伊克方法是将无限分布滞后模型转换为自回归模型，然后进行估计。对于无限分布滞后模型： () 科伊克变换假设偏回归系数随滞后期按几何级数衰减： () 其中，0<<1，称为分布滞后衰减率，1-称为调整速率(Speed of adjustment)。科伊克变换的具体做法是：将科伊克假定()代入模型()，得 () 将()滞后一期并乘以，得 () 将()减去()得科伊克变换模型： () 整理得科伊克模型的一般形式： () 其中，科伊克模型的特点是：（1）以一个滞后因变量代替了大量的滞后解释变量，最大限度地节省了自由度，解决了滞后期长度s难以确定的问题；（2）由于滞后一期的因变量与的线性相关度可以肯定小于X的各期滞后值之间的相关程度，从而缓解了多重共线性。但科伊克变换也同时产生了新问题：一是模型存在随机项的一阶自相关；二是滞后因变量与随机项不独立，即：，这些新问题需要进一步解决。 §滞后变量模型的构造期望模型是一种构造滞后变量模型的典型方法。期望模型在合理假设经济现象的基础上，提示了现实问题中时间滞后因素的作用。期望模型包括自适应模型的局部调整模型。一、自适应预期(Adaptive expectation)模型在某些实际问题中，因变量并不取决于解释变量的当前实际值，而取决于的“预期水平”或“长期均衡水平”。例如，家庭本期消费水平，取决于本期收入的预期值；市场上某种商品供求量，决定于本期该商品价格的均衡值。因此，自适应预期模型最初表现形式是（）由于预期变量（用*号表示）是不可实际观测的，作如下自适应预期假定（）其中r为期望（预期）系数(coefficient of expectation)，。该式的经济含义为：“经济行为者将根据过去的经验修改他们的期望（预期）”，即本期预期值的形成是一个逐步调整过程，本期预期值的增量是本期实际值与前一期预期值之差的一部分，其比例为r。这个假定还可写成：（）即本期预期值为本期真值与前期预期值的加权和。预期的调整既与上期预期值有关，也取决于经济机构企图实现或改变预期所做的努力。较大的r值意味着调整幅度较大。若r=1，则=，预期值在本期完全实现；若r=0，则=，预期值与上期预期持平。自适应预期模型的估计方法如下：（1）将（）代入（）得：（）将（）滞后一期并乘以，得（）以（）减去（），整理得（）其中（2）通过适当的方法估计（）式，可得到的估计值，原模型随之确定。二、局部调整（Partial Adjustment）模型局部调整模型是构造滞后变量模型的另一个方法，这种方法时期是用来研究物资储备问题。如企业为了保证生产和销售，必须保持一定的原材料储备。对应于一定的产量或销售量，存在着预期的最佳库存。局部调整模型的最初形式为（）显然，不可观测。由于生产条件的波动，生产管理方面的原因，库存储备的实际变化量只是预期变化的一部分。储备按预定水平逐步进行调整，故有如下局部调整假设：（）其中，为调整系数，。若=1，则=，实际值等于预期最佳值，完全实现调整。若=0，则=，本期实际值等于上期实际值，完全没有调整；若，本期实现部分调整。局部调整假设还可写成（）表明实际库存储备是本期最佳预期库存与上期实际库存的加权和。将（）式代入（）式得局部调整模型（）当（）式中的参数估计出之后，原模型（）也随之确定。 §自回归模型的估计上节讨论的科伊克模型、自适应预期模型以及局部调整模型，它们在结构上的共性，是均为自回归模型：（）由于解释变量中含有滞后因变量，它与随机项相关；同时，随机项还可能自相关。也就是说存在下列两种违反OLS基本假设的情况：（1），（2）在科伊克模型中，，则有仅自相关，而且与作为解释变量的相关：由于自适应模型中随机项为，因此同样可证明不仅自相关，而且与作为解释变量的相关。 1、科伊克模型与自适应模型需通过工具变量法进行估计若解释变量与随机扰动项相关，则OLS估计是有偏的，并且不是一致估计。因此，对上述模型，通常采用工具变量法，即寻找一个新的经济变量，用来代替。要求满足与不相关，而与高度相关。于是（）式可写成（）对（）式用OLS法，所得参数估计，分别是的一致估计。在实际工作中，一般用作为的工具变量，其中是X的若干滞后的线性组合：由于（）中的随机项在科伊克模型与适应性期望模型中均为原模型中随机项与X及其滞后间朱相关性，因此（）中的与不再线性相关。一个更简单的情形是用作为的工具变量。 2、局部调整模型可直接采用OLS法估计在局部调整模型中，由于，故无自相关，且与，不相关，可直接使用OLS法进行估计。 3、自回归模型中随机项自相关性检验上述工具变量法只解决了解释变量与随机项相关对参数估计所造成的影响，但没有解决的自相关问题。因此，如果不存在自相关，则工具变量法解决了参数估计问题：如果存在自相关，问题就比较复杂，至今没有完全有效的方法。所以需要检验是否存在自相关。但通常的DW检验，只适用于非随机解释变量的场合，在自回归模型中，解释变量包括了随机变量，可证明在这种情况下计算的DW值总是接近于2，从而DW检验不适用。杜宾(Durbin)提出了自相关形式为一阶自回归下的检验一阶自相关的H统计量检验法，它适用于大样本。H统计量定义为：（）式中，为一阶自相关系数的估计值，为自回归模型（）式中（的替代）系数C2的估计值的方差，n为样本容量。杜宾(Durbin)证明了在=0的假定下，。将代入（）式，得检验统计量给定显著性水平，查正态分布表得到临界值，（1）若h>自回归模型存在一阶自相关；（2）若h<，自回归模型不存在自相关；（3）如果，h检验失效。 §案例——我国长期货币流通需求模型建立长期货币流通量需求模型，是考虑到适度的货币流通量是市场稳定的一个基本要素；而影响货币需求的因素，不仅在本期，而且在长期内发挥作用。在中国80年代中影响货币需求量的因素，经过筛选，主要有工业企业存款和城乡个人储蓄的利率因素。表9-3 中国货币流通量Y、月利率X1、工业企业存款X2历史数据季度 Y X1 X2 季度 Y X1 X2 2 3 4 2 3 4 2 3 4 2 3 4 2 3 4 2 3 4 1、模型设定（）线性化为：（）其中，长期货币流通需求量；：储蓄月利率；：工业企业季度存款额。设为实际季度货币流通量，由于长期货币流通需求理不可观测，作局部调整； () 表明每一季度货币流通量的调整，只是预期调整的一部分。将()代入()得短期货币流通量需求模型： () 这是一个自回归模型，如果能恰当估计这个短期货币流通需求模型中的参数，则能得到长期货币流通需求量模型()或()的估计式。 2、模型估计因为原模型中满足OLS假定，故也满足。用OLS法估计()式，得 () （） () () () t: () () () () =, =, F=, = 由参数估计结果=，得= 最后得到长期货币流通需求模型的估计式： () 货币流通量对利率的弹性，本期为，长期为，说明存款利率每增长1%，短期货币流通需求将下降%，长期货币流通需求将下降%. (3)模型的h检验尽管回归结果表明d=，但不能据此判断自回归模型不存在自相关，故作h检验：在5%的显著性水平下，查得，由于，可判断模型已不存在一阶自相关。第十章联立方程计量经济学模型理论与方法【教学目的与要求】了解（最低要求）：线性联立方程计量经济学模型的基本概念，线性联立方程模型的矩阵表示，有关模型识别的概念和实用的识别方法，几种主要的单方程估计方法（间接最小二乘法、工具变量法、两阶段最小二乘法）的原理与应用。掌握（较高要求）：运用矩阵描述、推导和证明与间接最小二乘法、工具变量法和两阶段最小二乘法有关的过程和结论；为什么在实践中经常采用普通最小二乘法估计线性联立方程计量经济学模型；联立方程计量经济学模型系统检验的理论与方法。应用（对应用能力的要求）：应用所学知识，在本章结束前独立完成一个综合练习，建立一个3-5个方程的中国宏观经济模型，自己建立理论模型，自己收集样本数据，采用几种方法应用计量经济学软件包（例如.）进行模型估计，对结果进行分析，最后提交一篇报告。【教学重点与难点】本章重点是有关模型识别的概念和实用的识别方法，几种主要的单方程估计方法（间接最小二乘法、工具变量法、两阶段最小二乘法）的原理与应用。难点是运用矩阵描述、推导和证明与间接最小二乘法、工具变量法和两阶段最小二乘法有关的过程和结论。【教学方法】课堂讲授、实证分析与学生自学相结合。 §联立方程模型的基本概念单一方程描述变量间单方面的因果关系，即被解释变量Y与诸解释变量X间如果有因果关系的话，则这种关系是单向的：解释变量是原因，而被解释变量是结果。然而许多情况下经济变量之间的影响是双向的，即一个经济就是影响一个或多个经济变量，而反过来又受另一个或多个变量的影响。静止地看，消费受收入影响，但动态地看，消费水平与结构的变化会导致生产规模和行业结构的变化，进面影响国民收入，即消费又影响收入。在这种必须用两个或更多个互相联系的方程，才能反映复杂的现实经济系统状况。联立方程模型(Simultaneous equation models)就是由多个相互联系的单一方程组成的方程组，每一方程中的因变量在方程组中被联合决定，从而能够全面反映经济系统的运行规律。因而，联立方程模型以经济系统为研究对象，以揭示经济系统中各部分、各因素之间的数量关系和系统的数量特征为目标，用于经济系统的预测、分析和评价，是计量经济学模型的重要组成部分。一、经济研究中的联立方程计量经济学问题从经济意义上看，联立方程模型主要反映经济系统中模型对象的经济行为以及整个经济系统的环境变化等。例一个由国内生产总值（Y）、居民消费总额（C）、投资总额（I）和政府消费额（G）等变量构成的简单的宏观经济系统，可以建立如下的模型： () 这就是一个简单的描述宏观经济模型，如果将政府消费额由系统外部给定，并对系统内部其它变量产生影响，就国内生产总值、居民消费总额、投资总额来讲，是互相影响并互为因果。所以就无法用一个方程描述它们之间的关系，就需要建立一个由多个方程组成的方程系统。例研究某种产品的需求—供给模型。假如商品的需求量Qd主要决定于消费者收入Y及其价格P，而该产品的供给量Qs主要取决于其市场价格P和气候条件因子R，则可建立如下模型： () 这是一个简单的微观经济模型，如果消费者的收入以及气候因子由系统外给定，则该商品的需求量、供给量以及其市场价格则被该方程组联合决定。二、联立方程模型的变量和方程式 1、变量在联立方程计量经济学模型中，对于其中每个随机方程，其变量仍然有被解释变量与解释变量之分。但是对于模型系统而言，变量往往分为内生变量和外生变量两人类，外生变量与滞后内生变量又被统称为先决变量。（1）内生变量(endogenous variables) 内生变量是由模型系统决定的变量，其大小由方程组的联立解得到。例中的国内生产总值（Y）、居民消费总额（C）、投资总额（I）是内生变量；例中的商品的需求量（Qd）供给量（Qs）及其价格（P）是内生变量。一般而言，内生就是既受模型系统影响，同时也对模型系统产生影响。在联立方程中，宏观它是具有某种概率分布的随机变量，并且与随机扰动项总是相关的。内生变量Y满足：或（2）外生变量(exogenous variables) 外生变量一般是由系统外部确定的变量，如例中的政府消费G，例中的消费者收入Y以及气候因子R。外生变量影响系统，但本身不受系统的影响。联立模型中，外生变量X一般是非随机变量，它与随机项不相关，即满足：或（3）先决变量(predetermined variables) 外生变量与滞后内生变量(lagged endogenous variables)统称为先决变量或前定变量。滞后内生变量是联立方程计量经济学模型中重要的不可缺少的一部分变量，用以反映经济系统的动态与连续性。如果模型满足那么例的宏观经济模型中，前期国内生产总值为滞后内生变量，它与政府消费G一起构成先决变量；例中，消费者收入Y与气候因子R是外生变量，也构成先决变量。在单方程讲师经济学模型中，内生变量作为被解释变量，外生变量与滞后内生变量作为解释变量。而在联立方程模型中，内生变量既作为被解释变量。又可以在不同的方程中作为解释变量。 2、方程式联立方程中的方程，可有如下两种分类。按方程是否含有随机扰动项，可分为：随机方程和确定性方程；按模型对象的形为方式、性质等，可分为：行为方程、技术方程、制度方程的恒等式。（1）行为方程，它是反映经济活动的主体，如政府、企业、个人的经济行为方式的函数关系式。例中的消费方程、投资方程；例中的商品需求方程、商品供给方程。（2）技术方程，它是指基于客观经济技术关系而建立的函数关系式，如C-D生产函数就是一具技术方程，这反映了投入与产出之间的经济技术联系。行为方程和技术一般都是随机方程，其参数未知，需要经济估计。（3）制度方程，是指与法律、法令、规章制度有直接关系的经济变量方程。例如税收方程：应交税额适用税率*应税额，这里税率由制度确定，是已知的。（4）恒等式，有两种，一种表示某种定义的恒等式，如例中的国内生产总值方程；另一种是表示综合的或局部的均衡条件，如例中的商品供需平衡式。制度方程和恒等式都是确定性方程，其参数已知，无需估计。 §联立方程模型的结构式和简化式联立方程模型有两种基本的形式：结构式和简化式一、结构式(Structural form)模型根据经济理论和行为规律建立的描述经济变量之间直接关系结构的计量经济学方程系统称为结构式模型。例与例均为结构式模型。结构式模型中的每一个方程都是结构方程，各个方程的参数被称为结构参数。结构式模型有以下特点： 1、结构式模型，是根据经济理论，以计量方程形式对经济变量之间真实的结构关系作出的直接表达。结构方程经济意义明确。 2、在结构方程中，一个内生变量是其它内生变量、先决变量和随机误差项函数。设模型含有g个内生变量Y，k个前定变量X，则第个结构方程可写成该式被称为结构方程的正规形式。 3、结构参数表示方程中解释变量的直接影响。如例中的结构参数表示，当价格固定时，消费者收入Y每变动一个单位而引起的需求量Qd的改变量。如果结构式模型中方程娄数等于内生变量个数，则称结构式模型为完备的，或称完备模型。习惯上用Y表示内生变量，X表示先决变量，N表示随机项，表示内生变量的结构参数，表示先决变量的结构参数，如果模型中有常数项，可以看成都市一个外生的虚变量，它的观测值始终取1。在完备的结构式模型中，独立的结构方程的数目等于内生变量的数目，每个内生变量都分别由一个方程来描述。一个完备的结构式模型可以写成：其矩阵形式为： () 或 () 其中用n表示样本容量，则参数矩阵为：为结构参数矩阵将()表示的宏观经济模型写成矩阵方程()的形式，其中各个矩阵为：二、简化式(Reduced form)模型将联立方程模型的每个内生变量表示成所有先决变量和随机误差项的函数，即用所有先决变量作为每个内生变量的解释变量，所形成的模型称为简化式模型。简化式模型中每个方程称为简化式方程，方程的参数称为简化式参数。简化式模型的特点是： 1、每个简化式方程中，内生变量都是前定变量和随机项的函数。在有g个内生变量Y，k个前定变量X的模型中，第个简化式方程可写成 2、简化式参数表示前定变量变化对内生变量的直接影响和间接影响的总度量。 3、简化式参数可由结构式参数导出。通常用表示简化式参数，则有g个内生变量Y，k个前定变量X的简化式模型为：用表示简化式参数，于是简化式模型的矩阵形式为： E () 其中宏观经济模型()的简化式模型为： () 三、参数关系体系将()作如下变换：与()比较，可以得到：该式描述了简化式参数与结构式参数之间的关系，称为参数关系体系。将()结构式模型进行变量连续替代后得到：与（）对照，得到简化式参数与结构式参数之间关系体系为：利用参数关系体系，首先估计简化式参数，然后可以计算得到结构式参数。从参数关系体系还可以看出，简化式参数反映了先决变量对内生变量的直接与间接影响之和，这是简化式模型的另一个重要作用。例如表示对的影响，即增加1个单位时对的影响。根据这种影响被分成两部分，其中前一项正是结构式方程中反映对的直接影响的参数，后一项反映对的间接影响，只有通过简化式模型才能得到。 §计量经济学方法中的联立方程问题如果联立方程模型中的每个方程都可以看作单方程模型，用单方程模型方法估计，则会出现许多问题。这些问题主要表现在以下三个方面： 1、随机解释变量问题在OLS法中一个关键的假设是解释变量X是非随机变量，但与随机项独立。如果不满足这一假设，如X是随机变量且与随机项相关，则OLS估计量不仅是有偏的，而且是非一致的，即即使样本无限增大，估计量也不收敛于总体的真值。以上述简单的宏观经济模型为例。如果我们用单方程模型方法估计其中的居民消费方程，从方程系统中可以判断，作为居民消费总额的解释变量的国内生产总值是一个随机变量。因为根据第3个方程，它是由居民消费与投资决定，而根据第1和第2个方程，居民消费和投资都是随机变量，所以国内生产总值不是确定性变量。更进一步分析，居民消费C是与随机误差相关，所以国内生产总值Y也与相关。如果直接利用普通最小二乘法估计居民消费方程，将得到关于和的有偏估计量。对于投资方程也是如此。例在如下简单的凯恩斯收入决定模型中消费函数：（）收入恒等式：（）其中，随机项满足经典线性回归模型中的全部假定：同时，在消费方程中，可以作出假定：但从联立方程的角度，这个假定事实上是不成立的。证明如下：由模型结构方程（）与（）可联立解出：于是：计算与的协方差：由于，这说明与事实上是相关的。如果此时对（）式应用OLS法估计参数得 () 于是是边际消费倾向，，因此是有偏估计量。而且，从()式知，的概率极限(probability limit)为：说明也是的非一致估计量。由此，结构式方程中，内生变量作为解释变量而引起的参数OLS估计的这种联立性偏误，与样本无关，并不因样本容量增大而消失。因此这时OLS法失效。 2、损失变量信息问题在一个经济系统中，变量之间或多或少地存在着某种关联。在估计联立方程系统中某一个随机方程参数时，必须考虑没有包含在该方程中的变量的数据信息。而采用单方程模型方法是无法实现这一点的。 3、损失方程之间的相关性信息问题联立方程模型系统中每个阻碍机方程之间往往存在某种相关性，表现于不同方程随机误差项之间。尤其在时间序列数据作样本时，不同方程随机误差项之间往往存在同期相关性，即在同一个样本点上，它们经常是相关的。如果采用单方程模型方法估计某一个方程，是不可能考虑这种相关性的，造成信息的损失。由此得出的结论是，需要发展新方法估计联立模型。在上述三个问题中，随机解释变量问题最为严重，这一问题使得OLS估计法失效。关于这一问题的解决方案之一，可以通过比较结构式模型与简化式模型来得到。结构式模型反映了系统内变量之间的真实关系，刻划、描述了经济活动主体的具体形为方式。但解释变量包括内生变量，与扰动项相关，参数的OLS估计失效。简化式模型中，看不出明确的经济关系，无法说明诸如消费、投资这些具体经济形为方式。但解释变量只是前定变量，与扰动项不相关，利用OLS法可得到精度较高的参数估计。由上述两点可以看出，在对联立模型进行估计时，可先直接估计简化模型，然后利用简化式参数与结构式参数的关系——参数关系体系，由简化式参数估计值导出结构式参数估计值。进一步的问题在于，由简化式参数导出结构式参数是有条件的，即只有在一定的条件下才能由简化模型参数导出结构式模型参数，这就是需进一步研究的模型识别问题。第十一章联立方程计量经济学模型的识别【教学目的与要求】了解（最低要求）：线性联立方程计量经济学模型识别的基本概念，模型识别的阶条件和秩条件掌握（较高要求）：对联立方程计量经济学模型能用各种方法进行模型识别，并能够利用经验方法建立联立方程计量经济学模型。应用（对应用能力的要求）：应用所学知识，对联立方程计量经济学模型进行模型识别。【教学重点与难点】本章重点是有关模型识别的概念和实用的识别方法，【教学方法】课堂讲授、实证分析与学生自学相结合。 §模型的识别的概念联立方程计量经济学模型是由多个方程组成，对方程之间的关系有严格的要求，否则方程就可能无法估计。所以在进行模型估计之前首先要判断它是否可以估计，这就是模型的识别(Identification)。先看一个例子。有如下3个方程构成的简单商品供求模型： t=1,2,…,n () 其中、、P分别是供给量、需求量、均衡价格。问：在市场均衡条件下，给出一组、P的时间序列，估计出的函数是需求函数还是供给函数？显然在上述模型给定的信息条件下，很难判断得到的是需求函数还是供给函数。这时，我们只能认为原模型是不可估计的。这种情况被称为不可识别。一、模型识别的定义关于模型识别的定义，存在两种不同的表述： 1、从结构方程的统计形式角度，如果联立方程模型中某个结构方程不具有确定的统计形式，则称该方程为不可识别，否则为可识别。所谓确定的统计形式，是指模型系统中若干个方程或全部方程以及它们的任意组合所构成的新的方程都不具有被识别方程的统计形式（即与被识别方程含有不同的变量）。 2、从结构式参数与简化式参数的关系角度，一个结构方程可以识别，是指它的全部结构式系数可以从简化参数关系体系的方程组求解出。上述识别的定义是针对结构方程而言的。模型中每个需要估计其参数的随机方程都存在识别问题。如果一个模型中的所有随机方程都是可以识别的。则认为该联立方程模型系统是可以识别的。反过来，如果一个模型系统中存在一个不可识别的随机方程，则认为该联立方程模型系统是不可以识别的。恒等方程由于不存在参数的估计问题，所以也不存在识别问题。但是，必须注意，在判断随机方程的识别问题时，应该将恒等方程考虑在内。结构方程可以识别又包括两种情况：恰好识别与过度识别。如果由简化式参数求解结构式参数值唯一，则称恰好识别；如果求解结构参数值不唯一，则称过度识别。二、模型识别状态不可识别对模型（），在均衡条件下容易解得：（）其中，（）（）由（）式知，在已知时，2个方程不能求得4个结构参数的确定值，所以供给方程与需求方程都是不可识别的，从而联立模型不可识别。从模型的统计形式看，在均衡条件下，（）式中的供给方程与需求方程含有完全相同的变量P与Q，即两者的统计形式相同；同时，有（≠0）乘以供给方程两边，用（1-）乘以需求方程两边，再将两式相加，得到原供求方程的如下线性组合：（）其中，显然，（）式与（）式的供给方程与需求方程具有完全相同的统计形式。即给出一组P，Q值，做回归后无法判断回归出的方程是该三个方程中的哪一个。结构方程的统计形式不确定，原模型不可识别。模型（）不可识别的理由是在供给与需求函数中出现同样的变量P和Q，而且再没有其他信息（变量）。如果在对该模型需求函数增加一具前定变量——消费者收入Y，则该供求模型变为：（）方模型的简化式模型为：（）其中：（）同样地，（）式中随机项是（）式中随机项的函数。待求的求知结构参数有5个：，而参数关系式体系（）中简化式参数只有4个，无法由简化式参数求出结构式参数，故模型（）总体上是不可识别的。但是供给方程是可以识别的，这是因为：但是，需求函数仍无法唯一求出，故需求函数不可识别。同样地，用（≠0）乘以（）式供给方程两边，用（1-）乘以需求方程两边，再将两式相加，得到原供求方程的如下线性组合：（）其中：为与的函数。方程()虽然有别于有不含解释变量Y的供给方程，却与需求函数在形式上是相同的，因此需求函数仍不可识别。 2、恰好识别在模型中增加新信息，可改进模型的识别状态。因此在上述商品供给-需求模型中的供给方程中再引入新的变量——上期商品价格，则需求方程可识别。引入新变量后的联立模型如下： () 此模型的简化式为： () 其中， () 是的函数。联立模型()含6个结构参数：，结构参数与简化参数体系恰好有6个方程，可唯一确定6个结构参数，因此模型恰好识别。同样地，用（≠0）乘以（）式供给方程两边，用（1-）乘以需求方程两边，再将两式相加，得到原供求方程的如下线性组合：（）此式中含有Y和两个前定变量，从而该方程从统计形式上有别于原需求与供给方程。 3、过度识别如果在模型（）中继续引入新变量，如在需求函数中再引入表示消费与者财富的变量W，模型可写成： () 此模型的简化式为： () 其中，仍是的函数。这里原供求模型中有7个结构参数：，但在结构参数与简化参数的关系体系中有8个方程，即方程个数大于未知数个数，其结果是，虽然可以求出结构参数的解，但解并不唯一。如可以由两个式子求出：或模型（）中供求函数的任意线性组合具有如下统计形式：显然该式既不同于模型（）中的供给函数，也不同于需求函数，因此，模型中识别。需要特别指出，在求解线性代数方程时，如果方程数目大于未知数数目，被认为无解；如果方程数目小于求知数数目，被认为有无穷多解。但是在这里，无穷多解意味着没有确定值，所以，如果参数关系体系中有效方程数目小于求知结构参数估计量数目，被认为不可识别。如果参数关系体系中有效方程数目大于求知结构参数估计量数目，那么每次从中选择与求知结构参数估计量数目相等的方程数，可以解得一组结构参数估计值，换一组方程，又可以解得一组结构参数估计值，这样就可以得到多组结构参数估计值，被认为可以识别，但不是恰好识别，而是过度识别。 § 模型的识别的阶条件和秩条件从识别的定义出发，利用被识别方程参数关系的一组方程的解的情况，或被识别方程的统计形式的唯一确定性的判断，识别模型的状态，是一个复杂的过程。下面提供的所谓识别的阶条件和秩条件（order and rank conditions of identification）提供了一种较为方便的模型识别程式。一、可识别的阶条件可识别的一个必要（但非充分）条件，称阶条件（order condition），可表述如下：在前面商品供求模型的例子中，模型（）供给函数：需求函数：此模型有两个内生变量Q与P而无前定变量。为了能识别，每个方程至少要排除g-1=1个变量。但实际情况并非如此，故两个方程均不可识别。在模型（）中：供给函数：需求函数：内生变量仍为Q与P，但引入了一个前定变量Y。对于供给方程，它排除了g-1=1个变量（变量Y），因而可识别（恰好识别）；但对需求方程，它未排除至少1个变量，因而不可识别。在模型（）中：供给函数：需求函数：内生变量仍为Q与P，前定变量为Y与。对于供给方程与需求方程，各自排除了g-1=1个变量（前者排除Y，后者排除）因而两个方程均可识别，而且是恰好识别。在模型（）中：供给函数：需求函数：内生变量仍为Q与P，前定变量为Y、与W。需求方程排除了g-1=1个变量（排除Y），因而是恰好识别；而对供给方程排除了２个变量（排除Ｙ、Ｗ），是过度识别。二、可识别的秩条件阶条件是模型识别的必要条件而非充分条件；就是说，即使它得到满足，方程也会出现不能识别的情形。如在模型()中，供给方程排除了出现在需求方程中的收入变量Ｙ，按照阶条件来说是可以识别的，但识别的实现还只有当需求函数中Ｙ的系数不为零时，即收入变量不仅仅有可能进入而且确实进入了需求模型。因此在进行模型的识别判断时还需要一个既必要又充分的识别条件，这就是可识别的秩条件(rank condition)：联立方程计量经济学模型的结构式 () 中的第个方程中包含个内生变量（含被解释变量）和个先决变量（含常数项），模型系统中内生变量和先决变量的数目仍用g和k表示，矩阵表示第个方程中未包含变量（包括内生变量和先决变量）在其它g-1个方程对应系数所组成的矩阵。于是，判断第个结构方程识别状态的结构式条件为：如果R<g-1,则第个结构方程不可识别；如果R=g-1,则第个结构方程不可识别，并且如果，第个结构方程恰好识别；如果，第个结构方程过度识别；其中符号R表示矩阵的秩。一般将该条件的前一部分称为秩条件，用以判断结构方程是否识别；后一部分称为阶条件，用以判断结构方程恰好识别或者过度识别。例1：对下面的一个宏观经济模型： t=1,2,…,n 结构参数矩阵为：常数项首先判断第1个结构方程的识别状态。对于第1个方程，有所以，该方程可以识别。矩阵（）实际上就是矩阵除去第1个结构方程参数所在的行（第1行）和第1行中非0元素（对应于第1个结构方程包含的元素）所在的列之后剩下的元素按照原次序排列而得到的。又因为有：所以，第1个结构方程为恰好识别的结构方程。与我们上面的判断结论是一致的。再看第2个结构方程，有所以，该方程可以识别。并且所以，第2个结构方程为过度识别的结构方程。与我们上面的判断结论也是一致的。第3个方程是平衡方程，不存在识别问题。综合以上结果，该联立方程模型是可以识别的。例2：对（）的模型供给函数：需求函数：结构参数矩阵为：常数对于第1个方程，=，所以，该方程可以识别。并且所以，第1个结构方程为恰好识别的结构方程。对第2个结构方程，由于不存在，则可以认为其秩为零，小于g-1=1，故不可识别。综合以上结果，该联立方程模型不可以识别。与上面的判断结论是一致的。例3：对模型（）供给函数：需求函数：结构参数矩阵为：常数对于第1个方程，=，所以，该方程可以识别。并且所以，第1个结构方程为过度识别的结构方程。对于第2个方程，=，所以，该方程可以识别。并且所以，第2个结构方程为恰好识别的结构方程。三、实际应用中的经验方法当一个联立方程计量经济学模型系统中的方程数目比较多时，无论是从识别的概念出发，还是利用规范的结构式或联立方程计量经济学模型简化式识别条件，对模型进行识别，困难都是很大的，或者说是不可能的。因为一般实际联立方程计量经济学模型包含几百个、上千个方程是正常的。这就是理论与实际的脱节，理论上很严格的方法在实际中往往是无法应用的，在实际中应用的往往是一些经验方法。关于联立方程计量经济学模型的识别问题，我们并不是等到理论模型已经建立了之后再象上面所介绍那样进行识别，而是在建立模型的过程中设法保证模型的可识别性。那么，在建立模型时就要遵循如下原则： “在建立某个结构方程时，要使该方程包含前面每一个方程中都不包含的至少1个变量（内生或先决变量）；同时使前面每一个方程中都包含至少1个该方程所未包含的变量，并且互不相同。” 该原则的前一名话是保证该方程的引入不破坏前面已有方程的可识别性。只要新引入方程包含前面每一个方程中都不包含的至少1个变量，那么它与前面方程的任意线性组合都不能构成与前面方程相同的统计形式，原来可以识别的方程仍然是可以识别的。该原则的后一名话是保证该新引入方程本身是可以识别的。只要前面每个方程都包含至少1个该方程所未包含的变量，并且互不相同。那么所有方程的任意线性组合都不能构成与该方程相同的统计形式。在实际建模型时，将每个方程所包含的变量记录在如表所示的表式中，将是有帮助的。例如，在建立第4个方程时，必须包含变量1、2、3、4、5、6之外的至少一个变量；同时需要检查方程1、2、3是否都存在至少1个方程4所未包含的变量，且互不相同，这里可以认为方程1中的变量1、方程2的变量4和5、方程3中的变量6满足要求。于是，所建立的方程4是可以识别的。表变量记录表变量1 变量2 变量3 变量4 变量5 变量6 … 方程1 × × × 方程2 × × × × 方程3 × × × × 方程4 × × × … 第十二章联立方程模型的估计【教学目的与要求】了解（最低要求）：计量经济学模型的单方程估计方法及联立方程模型的系统估计方法。掌握（较高要求）：对于各种估计方法的运用。应用（对应用能力的要求）：应用所学知识，对单方程计量经济学模型及联立方程模型进行识别。【教学重点与难点】本章重点是有关模型识别的概念和实用的识别方法，几种主要的单方程估计方法（间接最小二乘法、工具变量法、两阶段最小二乘法）的原理与应用。难点是运用矩阵描述、推导和证明与间接最小二乘法、工具变量法和两阶段最小二乘法有关的过程和结论。【教学方法】课堂讲授、实证分析与学生自学相结合。联立方程计量经济学模型的估计方法分为两大类：单方程估计方法与系统估计方法。单方程方法，又称有限信息法(limited information)，指每次只估计模型系统中的方程，依次逐个估计；系统估计方法，又完全信息法(full information methods)，指同时对全部方程进行估计，同时得到所有方程的参数估计量。显然，从模型估计的性质来讲，系统估计方法必然优于单方程方法，但从方法的复杂性来讲，单方程方法双优于系统估计方法。在实际中，单方程方法得到广泛的应用。单方程估计方法仅考虑对被估计方程的约束（如对某些变量的排除）而不考虑对其他方程的约束，即仅该方程给出的有限信息；系统估计方法则同时考虑到了因某些变量被排除而对方程造成的全部约束，即全部方程给出的信息。 §联立方程模型的单方程估计方法单方程估计方法主要有普通最小二乘法(ordinary least squares, OLS)、间接最小二乘法(indirect least squares, ILS)、两阶段最小二乘法（Two-stage least squares）、工具变量法(instrument variables)等。一、普通最小二乘法：递归模型普通最小二乘法可以用来估计联立模型中的单个方程，但由于存在随机性变量等问题，该方法得到的估计结果往往是有偏的，非一致的，因此该方程在理论上是不适当的。但对一种特殊的联立——递归型(recursive)联立方程，OLS法是适用的。如果联立模型 () 中的B具有如下特征：即内生变量结构系数构成g阶一角阵，主对角线元素为1。该系统中，第一个方程的内生变量可由全部先决变量确定，将其代入第二个方程，与全部先决变量一道可确定第二个方程的内生变量，依次类推。这类模型称为递归模型。递归模型是恰好识别的，每个方程的均可作为独立方程处理。前一方程的内生变量，对后一方程而言是先决变量，而后一方程的内生变量对前一方程没有影响，显示出一种单向的因果关系。只要各方程随机项互不相关，即就可以用OLS法估计参数。参数估计是无偏有效的。二、恰好识别方程的估计：间接最小二乘法联立方程模型的结构方程中包含有内生解释变量，不能直接采用变通最小二乘法估计其参数。但是对于简化式方程，正如在关于简化式模型概念介绍中提到的，可以采用普通最小二乘法直接估计其参数。于是就提出了间接最小二乘法：先对关于内生解释变量的简化式方程采用普通最小二乘法估计简化式参数，得到简化式参数估计量，然后通过参灵敏关系体系，计算得到结构式参数的估计量。间接最小二乘法只适用于恰好识别的结构方程的参数估计，因为只有恰好识别的结构方程才能从参数关系体系中得到唯一一组结构参数的估计量。 1、一个简单的例子现有一个联立方程模型，其结构式模型为：现欲估计第1个结构方程的参数，可以证明，该方程是恰好识别的，可以采用间接最小二乘法。该方程中有两个内生变量，相应的简化式方程为：应用变通最小二乘法，在样本数据的支持下对每个简化式方程分别估计其参数，得到参数估计量。将简化式代入第1个结构方程，得到参数关系体系由简化式参数估计量，计算得到结构参数估计值例1：对于第11章给出的一个如下的农产品供需模型供给函数：需求函数：供需均量Q与价格P为内生变量，消费个人收入Y为前定变量。如前所述，供给函数恰好识别，需求函数不可识别。该模型的简化方程为由于前定变量（外生）Y与随机项不相关，可用OLS法估计如下：由参数关系体系，可得到供给方程参数的估计值：即供给函数的ILS估计是：为了比较，供给函数的OLS直接估计如下：表 1970~1991年美国作物产量指数（Q）、价格指数（P）与个人消费支出（Y）年份 Q P Y 年份 Q P Y 年份 Q P Y 1970 1971 1972 1973 1974 1975 1976 1977 77 86 87 92 84 93 92 100 52 56 60 91 117 105 102 100 3152 3372 3658 4002 4337 4745 5241 5772 1978 1979 1980 1981 1982 1983 1984 1985 102 113 101 117 117 88 111 118 105 116 125 134 121 128 138 120 6394 7035 7677 8375 8868 9634 10408 11184 1986 1987 1988 1989 1990 1991 109 108 92 107 114 111 107 106 126 134 127 130 11843 12568 13448 14241 14996 15384 2、间接最小二乘法参数估计的统计性质对于简化模型应用普通最小二乘法得到的参数估计量具有线性、无偏性、有效性。通过参数关系体系计算得到结构方程的结构参数估计量在小样本下是有偏的，在大样本下是渐近无偏的。三、工具变量法（IV）工具变量方法的基本思想是利用适当的工具变量去替代结构方程中作为解释变量的内生变量，以减少解释变量与随机项的相关性，从而可以用OLS法估计参数。在联立方程模型的估计中，工具变量法的具体作法如下： 1、选取合适的工具变量设模型有g个内生变量k个前定变量。被估计方程有个内生变量和个前定变量。工具变量的选择，就是要求在被估方程所排除的个前定变量中去寻找与被替代的个内生变量在经济意义上高度相关的前定变量。这样，它与随机项不相关，与其他前定变量的相关性也很小。工具变量的个数应与所替代的内生变量的个数相等。为了使每个结构参数有确定的解，对结构方程所含的个前定变量，以它们自身为工具变量。 2、分别用每个工具变量乘结构方程，并对样本容量的n个观察求和，得到方程个数与求知结构参数个数一样的一组线性方程。解此方程组，可得结构参数的估计值。例2：设联立方程模型中，被估计方程形如是作为解释变量的内生变量。运用工具变量法，中k-1个前定变量中，选取作为的工具变量，以作为自己的工具变量。用分别乘被估计方程，并对样本观察值求和：由于可得拟正规方程：解此方程组，可得。在TSP下，工具变量法与通过输入下列命令完成的： TSLS Y C Y1 Y2 X1 @ X2 X3 X1 @后面即为工具变量 3、工具变更法的局限性：如果被估计的结构方程是恰好识别的，即满足=，那么，该方程中排除的前定变量的数目恰好等于方程中作为解释变量的内生变量数目，工具变量的选法唯一，拟正规方程有唯一解，即结构参数的IV估计唯一。如果被估结构方程是过度识别的，即满足>，那么，工具变量的选择就比较麻烦。且参数估计结果有一定的任意性，因为每从个没有包含在方程之中的先决变量中选出变量作为工具变量，就得到一组参数估计值。共计可能有种不同的参数估计值。所以，一般认为，这种工具变量方法只适用于恰好识别的结构方程的估计。 4、IV参数估计量及其统计特性工具变量法参数估计量，正如在以前已经说明的，一般情况下，在小样本下是有偏的，但在大样本下是渐无偏的。如果选取的工具变量与方程随机误差项完全不相关，那么其参数估计量是无偏性估计量。四、二阶段最小二乘法（2SLS）工具变量方法和间接最小二乘法一般只适用于联立方程模型中恰好识别的结构方程的估计。但是，在实际的联立方程模型中，恰好识别的结构方程很少出现，一般情况下结构方程都是过度识别的。二阶段最小二乘法(Two Stage Least Squares)是一种既适用于恰好识别的结构方程，又适用于过度识别的结构方程的单方程估计方法，由Theil和Basmann分别于1953年和1957年各自独立提出，是一种应用最普遍的方法。 1、二阶段最小二乘法的基本思想设被估计方程形如：方程中作为解释变量的内生变量共有个，且随机项满足OLS基本假定。一般情况下，由于往往又是的函数，从而使与相关，即被估计方程出现随机解释变量的问题而无法直接采用OLS法。二阶段最小二乘法的第一步就是通过OLS法求出的全部简化式方程：（）或（）显然，作为前定变量的线性组合，与无关。第二步：将（）代入（）式，相当于以作为工具变量。得（）其中，，仍然满足OLS法所要求和零均值、同方差、不序列相关的基本假定，同时，由于是所有前定变量的线性组合面与无关，因此与无关，从而也与无关。于是（）式可用OLS法估计，得到结构参数估计值。在TSP下，2SLS估计可用如下命令完成： TSLS Y C Y1 Y2 X1 @ C X2 X3 X1 @后面即为工具变量。在此命令中工具变量的个数应大于或等于解释变量个数。一般地，@符号之后也应包括常量序列C。二阶段最小二乘法如下特点： ①在应用二阶段最小二乘法的整个过程中，并没有涉及结构方程中内生解释变量和先决解释变量的数目，所以二阶段最小二乘法的应用与方程的识别状态无关，既适用于恰好识别的结构方程，又适用于过度识别的结构方程。 ②从选择工具变量的角度，作为的变量比较合适，这是因为：（1）是简化式估计量，是全体前定变量的线性组合，因此既与排除了与被估方程随机项的相关性，又毫无遗漏地使用了所有前定变量的信息；（2）以自身的估计为前定变量，可以认为两者是高度相关的。 ③2SLS估计需要较大的样本容量。尤其当模型包括很多前定变量时，如果样本容量小于前定变量数目，则很难保证在第一阶段内正确求出内生变量的简化式。 ④当第一阶段估计式判定系数很高，譬如大于，用2SLS估计的结果与ILS法估计的结果相近，如果第一阶段估计的判定系数值很低，表明作为的工具变量的代表性差，2SLS的估计结果实际上是没有意义的。 ⑤当第一阶段估计式的判定系数 2、二阶段最小二乘估计量的统计性质采用二阶段最小二乘法得到结构方程的结构参数估计量在小样本下是有偏的，在大样本下是渐近无偏的。五、对于恰好识别的结构方程，三种方法是等价的上述三种单方程估计方法都有适用于恰好识别的结构方程，对于同一具结构方程，选择不同的方法，应该得到相同的参数估计量。从理论上说，三种结果都是用不同的工具变量方法得到的，区别仅在于工具变量选取不同。工具变量法和间接最不二乘法的参数估计量，它们选取了同样的一组变量X作为被估计结构方程中解释变量的工具变量，只是次序不同。工具变量法用结构方程中未包含的先决变量作为内生解释变量的工具变量，用被估计结构方程中包含的先决变量作为自己的工具变量；而间接最小二乘法则将先决变量X按自己的顺序作为被估方程内生解释变量与先决变量的工具变量，这就使得被估计结构方程中包含的先决变量也选择了其它先决变量作为工具变量，而不是自身。可以证明，这两种不同的选取只影响正规方程组中方程的次序，并不影响方程组的解。所以狭义工具变量法和间接最小二乘法参数估计量是等价的。比较二阶段最小二乘法和间接最小二乘法的参数估计量：间接最小二乘法选取X作为结构方程中解释变量（，）的工具变量，二阶段最小二乘法选取X的线性组合作为结构方程中内生解释变量的工具变量，选取作为自己的工具变量。尽管这样使得关于二者参数估计量的正规方程组是不同的，但后者可以由前者经过初等线性变换得到。而根据代数知识，初等线性变换不影响方程组的解。所以二阶段最小二乘法和间接最小二乘法的参数估计量是结论是，对于恰好识别的结构方程，狭义工具变量法、间接最小二乘法和二阶段最小二乘法三种方法地等价的。六、简单宏观经济模型实例演示下面建立一个包含3个方程的中国宏观经济模型，主要借此进行方法上的演示。描写包含3个内生变量，即国内生产总值Y、居民消费总额C和投资总额I：3个先决变量，即政府消费（将净出口也包含其中，为了实现数据的平衡）G、前期居民消费总额和常数项。完备的结构式模型为： t=1978,1979,…,1996 () 容易判断，消费方程是恰好识别的方程，投资方程是过度识别的方程，模型是可以识别的。现在对模型进行估计。表中国宏观经济数据单位：亿元年份 Y I C G 年份 Y I C G 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 3606 4074 4551 4901 5489 6076 7164 8792 10133 11784 1378 1474 1590 1581 1760 2005 2469 3386 3846 4322 1759 2005 2317 2604 2868 3182 3675 4589 5175 5961 469 595 644 716 861 889 1020 817 1112 1501 1988 1989 1990 1991 1992 1993 1994 1995 1996 14704 16466 18320 21280 25864 34501 47111 59405 68498 5495 6095 6444 7517 9636 14998 19261 23877 26867 7633 8524 9113 10316 12460 15682 21230 27839 32589 1576 1847 2763 3447 3768 3821 6620 1689 9042 1、用狭义的工具变量法估计消费方程选取消费方程中未包含的先决变量G作为内生解释变量Y的工具变量，得到结构参数的工具变量法估计量： 2、用间接最小二乘法估计消费方程消费方程中包含的内生变量的简化式方程为：参数关系体系为：用普通最小二乘法估计简化式方程，得到简化式参数估计量为：由参数关系体系计算得到结构参数间接最小二乘估计值为： 3、用两阶段最小二乘法估计消费方程两阶段最小二乘法的第一阶段是用普通最小二乘法估计内生解释变量的简化式方程，得到：据此计算替换结构方程中的，再用普通最小二乘法估计变换了的结构式方程，得到消费方程的两阶段最小二乘参数估计量为：比较上述消费方程的3种估计结果，证明这3种方法对于恰好识别的结构方程是等价的。估计量的差别只是很小的计算误差。 4、用两阶段最小二乘法估计投资方程投资方程是过度识别的结构方程，只能用两阶段最小二乘法估计。估计过程与上述两阶段最小二乘法估计消费方程的过程相同。得到投资方程的参数估计量为：至此，我们完成了该模型系统的估计。为了比较，下面给出消费方程与投资方程的OLS估计： §联立方程模型的系统估计方法联立方程计量经济学模型的系统估计方法是相对于单方程估计方法而言。单方程方法每次只对一个结构方程进行估计，利用了有限信息，对于没有包含在所估计结构方程中的变量的样本数据信息，只是部分地利用了，而对于方程之间的关系信息（联立模型结构信息），则完全没有利用。系统估计方法，正是针对单方程方法的问题提出来的，它同时估计全部结构方程，利用了模型系统的全部信息。因此系统估计方法的参数估计方法的参数估计量具有良好的统计性。也正因为此，系统估计方法也相当复杂。本节主要介绍三阶段最小二乘法（3SLS）。二阶段最小二乘法（2SLS）是假定联立模型各结构方程的随机项是序列不相关的，即。但在联立方程模型中，各个方程的扰动项，可能与其他方程的扰动项相关。这时应考虑引入广义最小二乘法（GLS），以克服各方程之间随机项相关造成的估计偏误。因此三阶段最小二乘法（Three-stage least squares）的第一、二阶段是2SLS法，第三阶段实际上是广义最小二乘法GLS的应用。一、三阶段最小二乘法（3SLS）法的估计过程第一阶段：用OLS法估计简化式方程，求出内生变量的估计式。设联立方程模型为（）其中，模型内生变量个数为g，前定变量个数为k，在第个方程中，内生变量个数为，前定变量个数为。相应的简化式模型为（）运用OLS法，简化式模型的估计为（）将前定变量的样本观察值代入（）相应的方程中，得到内生变量的一组简化式估计值：，其中，第二阶段：将所求内生变量的估计值代入结构方程（）左端作为工具变量，对变换后的方程应用OLS，得到参数的2SLS估计量。并求每个结构方程随机扰动项的估计量——残差，以及的方差、协方差估计量。如对第个结构方程的2SLS估计结果为： t=1,2,…,n () 残差为：， t=1,2,…,n () ()式可写为： () 其中，：n×1向量，由第个方程因变量的n次样本观察值组成：：n×(-1)矩阵，由第个方程中作解释变量的内生变量的简化式估计值组成；：n×矩阵，由第个方程所包含的前定变量的样本观察值组成；：（-1）×1向量，第个方程的内生变量结构参数；：×1列向量，第个方程前定变量结构参数；：n×1向量，第个方程的随机扰动项。第三阶段：用广义最小二乘法（GLS）求结构参数的估计量。将整个2SLS方程组表示成一个矩阵形式的单一方程：或者（） () 其中，：（g×n）×1向量；：（g×n）×(-1) 矩阵；：（g×n）× EMBED 矩阵：(-1) ×1向量；： EMBED ×1向量；：（g×n）×1向量对于()中的随机误差项，为了使问题适当简单，作如下假设： 1、对于一个结构方程的随机误差项，在不同样本点之间，具有同方差性和序列不相关性。即 2、对于不同结构方程的随机误差项之间，具有且仅具有同期相关性。即于是，联立方程模型系统随机误差项方差一协方差矩阵为：其中表示“直积”，即用符号后面的矩阵去乘符号前面矩阵的每个元素。协方差矩阵是由(g×g)个子矩阵组成，每个子矩阵都是一个主对角阵，且主对角线元素相同。如果放弃两条假设，每个子矩阵就不是一个主对角阵，且主对角线元素也不相同。由于随机项不可观察，与未知，但可根据残差给出它的估计值：于是有估计用GLS法估计()式，得结构参数向量的估计：二、三阶段最小二乘法估计量的统计性质 3SLS估计量的统计性质主要有：（1）如果联立方程模型系统中所有结构方程都是可以识别的，并且非奇异，则3SLS估计量是一致性估计量。为了保证非奇异，必须将模型系统中的恒等式排除在外，不参加估计过程，因为恒等式的随机误差项为0，将使矩阵中出现0行和0列，使之成为奇异矩阵。（2）对大样本来说，3SLS估计量比2SLS估计量更有效。将3SLS估计量和2SLS估计量的分布进行比较，并根据Gauss-Markov定理，即可清楚看到这点。（3）如果是对角矩阵，即模型系统中不同结构方程的随机误差项之间无相关性，那么可以证明3SLS估计量与2SLS估计量是等价的。这反过来说明，3SLS方法主要优点是考虑了模型系统中不同结构方程的随机误差项之间的相关性。在软件包下，3SLS估计需要首先利用文稿编辑命令Edit编写一个模型文件。然后按F5键进入统计操作菜单，选中系统估计法（SYS）。之后在系统估计法中进一步选择三阶段最小二乘法（3SLS）。回答屏幕提问：模型文件名称？这时键入前面用Edit命令完成的模型文件名称，回车后TSP将自动进行系统估计，并显示估计结果。例：克莱因（Klein）美国经济模型是一个小型的宏观经济模型，结构如下：消费函数：投资函数：劳动力需求函数：国民收入：利润：资本存量：其中：C为消费支出、I为投资支出、P为利润、Y为可支配收入、K为资本存量、WP为私营工资、WG为政府工资、G为政府支出、T为税金、t为时间。该联立模型共同6个方程组成，其中3个行为方程，3个定义方程。变量共有10个，其中6个内生变量（C、I、WP、Y、P、K），4个前外生变量（WG、G、T、t）；前定变量共有7个（WG、G、T、t、P-1、T-1、K-1）。容易判断该联立模型中消费函数、投资函数为过度识别，劳动力需要函数为恰好识别。 PAGE PAGE I

联系我们

智库文档公众号

客服微信

计量经济学教案（河北经贸大学）.doc

下载

标签

相关文档

联系我们

意见反馈