计量经济学全部答案(庞浩)第二版
第二章练习题及参考解答
为研究中国的货币供应量(以货币与准货币 M2 表示)与国内生产总值(GDP)的相互
依存关系,分析表中 1990 年—2007 年中国货币供应量(M2)和国内生产总值(GDP)的
有关数据:
表 1990 年—2007 年中国货币供应量和国内生产总值(单位:亿元)
年份 货币供应量 M2 国内生产总值 GDP
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
资料来源:中国统计年鉴 2008,中国统计出版社
对货币供应量与国内生产总值作相关分析,并说明相关分析结果的经济意义。
练习题 参考解答:
计算中国货币供应量(以货币与准货币 M2 表示)与国内生产总值(GDP)的相关系数为:
计算方法:
或
计算结果:
M2 GDP
M2 1
2 2 2 2( ) ( )
i i i i
XY
i i i i
n X Y X Y
r
n X X n Y Y
, 2 2
( )( )
( ) ( )
i i
X Y
i i
X X Y Y
r
X X Y Y
GDP 1
经济意义: 这说明中国货币供应量与国内生产总值(GDP)的线性相关系数为 ,线性
相关程度相当高。
为研究美国软饮料公司的广告费用 X 与销售数量 Y 的关系,分析七种主要品牌软饮
料公司的有关数据
表 美国软饮料公司广告费用与销售数量
品牌名称 广告费用 X(百万美元) 销售数量 Y(百万箱)
Coca-Cola Classic
Pepsi-Cola
Diet-Coke
Sprite
Moutain Dew
7-Up
资料来源:(美) Anderson D R 等. 商务与经济统计.机械工业出版社.1998. 405
绘制美国软饮料公司广告费用与销售数量的相关图, 并计算相关系数,分析其相关程度。
能否在此基础上建立回归模型作回归分析?
练习题 参考解答
美国软饮料公司的广告费用 X 与销售数量 Y 的散点图为
说明美国软饮料公司的广告费用 X 与销售数量 Y 正线性相关。
相关系数为:
x y
x 1
y 1
说明美国软饮料公司的广告费用 X 与销售数量 Y 的正相关程度相当高。
若以销售数量 Y 为被解释变量,以广告费用 X 为解释变量,可建立线性回归模型
利用 EViews 估计其参数结果为
经 t 检验表明, 广告费用 X 对美国软饮料公司的销售数量 Y 确有显著影响。回归结果表明,
广告费用 X 每增加 1 百万美元, 平均说来软饮料公司的销售数量将增加 (百万箱)。
为了研究深圳市地方预算内财政收入与国内生产总值的关系,得到以下数据:
表 深圳市地方预算内财政收入与国内生产总值
年 份 地方预算内财政收入 Y
(亿元)
本市生产总值(GDP)X
(亿元)
1990
1991
1992
1993
1994 .
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
iii uXY 21
2007
资料来源: 深圳市统计年鉴 2008. 中国统计出版社
(1)建立深圳地方预算内财政收入对本市生产总值 GDP 的回归模型;
(2)估计所建立模型的参数,解释斜率系数的经济意义;
(3)对回归结果进行检验。
(4)若是 2008 年深圳市的本市生产总值为 8000 亿元,试对 2008 年深圳市的财政收入
作出点预测和区间预测 ( )。
练习题 参考解答:
1、 建立深圳地方预算内财政收入对 GDP 的回归模型,建立 EViews 文件,利用地
方预算内财政收入(Y)和 GDP 的数据表,作散点图
可看出地方预算内财政收入(Y)和 GDP 的关系近似直线关系,可建立线性回归模型:
利用 EViews 估计其参数结果为
ttt uGDPY 21
即
() ()
t=() ()
R2= F=
经检验说明,深圳市的 GDP 对地方财政收入确有显著影响。 ,说明 GDP 解释
了地方财政收入变动的近 98%,模型拟合程度较好。
模型说明当 GDP 每增长 1 亿元时,平均说来地方财政收入将增长 亿元。
当 2008 年 GDP 为 7500 亿元时,地方财政收入的点预测值为:
(亿元)
区间预测:
为了作区间预测,取 , 平均值置信度 95%的预测区间为:
利用 EViews 由 GDP 数据的统计量得到 n=18
则有
取 , , 平均值置信度 95%的预测区间为:
时
(亿元)
个别值置信度 95%的预测区间为:
即
(亿元)
为研究中国改革开放以来国民总收入与最终消费的关系,搜集到以下数据:
ˆ tY GDP
2
2008
ˆ 8000
fY
2
2 2
( )1ˆ ˆ ff
i
X X
Y t
n x
m
2 2 2( 1) (18 1) xx n
2 2
1( ) (8000 ) X
2008ˆ (18 - 2) =
2^ ^
2 2
( )1 f
f
i
X X
Y t
n x
m
2008 8000GDP
1
18
m
m
fY
2^ ^
2 2
( )1
1 ff
i
X X
Y t
n x
m
1
1
18
m
m
表 中国国民总收入与最终消费 (单位:亿元)
年份 国民总收入
X
最终消费
Y
年份 国民总收入
X
最终消费
Y
1978 1993
1979 1994
1980 1995
1981 1996
1982 1997
1983 1998
1984 1999
1985 2000 61516
1986 2001
1987 2002
1988 2003 135174
1989 2004
1990 2005
1991 2006
1992 2007
资料来源:中国统计年鉴 2008. 中国统计出版社,2008.
(1) 以分析国民总收入对消费的推动作用为目的,建立线性回归方程,并估计其参数。
(2) 计算回归估计的标准误差 和可决系数 。
(3) 对回归系数进行显著性水平为 5%的显著性检验。
(4) 如果 2008 年全年国民总收入为 300670 亿元,比上年增长 %,预测可能达到的最终
消费水平,并对最终消费的均值给出置信度为 95%的预测区间。
练习题 参考解答:
(1)以最终消费为被解释变量 Y,以国民总收入为解释变量 X,建立线性回归模型:
利用 EViews 估计参数并检验
̂ 2R
iii uXY 21
回归分析结果为:
() ()
t= () ()
n=30
(2)回归估计的标准误差即估计的随机扰动项的标准误差 ,由 EViews 估
计参数和检验结果得 , 可决系数为 。
(3)由 t 分布表可查得 ,由于 ,或
由 P 值= 可以看出, 对回归系数进行显著性水平为 5%的显著性检验表明, 国民总收入
对最终消费有显著影响。
(4)如果 2008 年全年国民总收入为 300670 亿元,预测可能达到的最终消费水平为:
(亿元)
对最终消费的均值置信度为 95%的预测区间为:
由 Eviews 计算国民总收入 X 变量样本数据的统计量得:
n=30
则有
取 , , ,已知 ,平均值置信
度 95%的预测区间为:
=
= (亿元)
美国各航空公司业绩的统计数据公布在《华尔街日报 1999 年年鉴》(The Wall
Street Journal Almanac 1999)上。航班正点到达的比率和每 10 万名乘客投诉的次数的数据
ˆ tY X
2
2ˆ ( 2)te n
ˆ
(30 2) 2 (28) t
2008
ˆ 300670
2^ ^
2 2
( )1 f
f
i
X X
Y t
n x
m
2 2 2( 1) (30 1) xx n
2 2( ) (300670 ) X
2008ˆ (30 - 2) = ˆ
2^ ^
2 2
( )1 f
f
i
X X
Y t
n x
m
1
30
m
如下 1。
表 美国各航空公司业绩的统计数据
航空公司名称 航班正点率(%) 投诉率(次/10 万名乘客)
西南(Southwest)航空公司
大陆(Continental)航空公司
西北(Northwest)航空公司
美国(US Airways)航空公司
联合(United)航空公司
美洲(American)航空公司
德尔塔(Delta)航空公司
美国西部(Americawest)航空公司
环球(TWA)航空公司
资料来源:(美) Anderson D R 等.商务与经济统计. 机械工业出版社.1998,405.
(1)画出这些数据的散点图
(2)根据散点图。表明二变量之间存在什么关系?
(3)估计描述投诉率如何依赖航班按时到达正点率的回归方程。
(4)对估计的回归方程斜率的意义作出解释。
(5)如果航班按时到达的正点率为 80%,估计每 10 万名乘客投诉的次数是多少?
练习题 参考解答:
美国各航空公司航班正点到达比率 X 和每 10 万名乘客投诉次数 Y 的散点图为
1资料来源:(美)David 等《商务与经济统计》,第 405 页,机械工业出版社
由图形看出航班正点到达比率和每 10 万名乘客投诉次数呈现负相关关系,
利用 EViews 计算线性相关系数为:
X Y
X 1
Y
建立描述投诉率(Y)依赖航班按时到达正点率(X)的回归方程:
利用 EViews 估计其参数结果为
即
()()
t=() ()
R2= F=
从检验结果可以看出, 航班正点到达比率对乘客投诉次数确有显著影响。
这说明当航班正点到达比率每提 1 个百分点, 平均说来每 10 万名乘客投诉次数将下降
次。
如果航班按时到达的正点率为 80%,估计每 10 万名乘客投诉的次数为
(次)
表 中是 16 支公益股票某年的每股帐面价值 Y 和当年红利 X 的数据:
表 某年 16 支公益股票每股帐面价值和当年红利
公司序号
帐面价值 Y
(元)
红利 X(元) 公司序号
帐面价值 Y
(元)
红利 X(元)
1 9
2 10
iii uXY 21
ii XY ˆ
ˆ iY
3 11
4 12
5 13
6
7
8
14
15
16
(1)分析每股帐面价值和当年红利的相关性?
(2) 建立每股帐面价值和当年红利的回归方程;
(3)解释回归系数的经济意义。
练习题 参考解答:
1.分析每股帐面价值和当年红利的相关性
作散布图:
从图形看似乎具有一定正相关性,计算相关系数:
每股帐面价值和当年红利的相关系数为
2.建立每股帐面价值 X 和当年红利 Y 的回归方程:
回归结果:
1 2i i iY X u
参数 的 t 检验:t 值为 ,查表 < ,或者 P 值为
< ,表明每股红利对帐面价值有显著的影响。
3.回归系数的经济意义:
平均说来公司的股票每股红利增加 1 元,当年帐面价值将增加 元
设销售收入 X 为解释变量,销售成本 Y 为被解释变量。现已根据某百货公司某年 12
个月的有关资料计算出以下数据:(单位:万元)
(1) 拟合简单线性回归方程,并对方程中回归系数的经济意义作出解释。
(2) 计算可决系数和回归估计的标准误差。
(3) 对 进行显著水平为 5%的显著性检验。
(4) 假定下年 1 月销售收入为 800 万元,利用拟合的回归方程预测其销售成本,并给出
置信度为 95%的预测区间。
练习题 参考解答:
(1)建立回归模型:
用 OLS 法估计参数:
2 (16 2) 2
2( ) X
2( ) Y
( )( ) tX X Y Y
2
iii uXY 21
2 2 2
( )( ) ˆ
( )
i i i i
i i
X X Y Y x y
X X x
估计结果为:
说明该百货公司销售收入每增加 1 元,平均说来销售成本将增加 元。
(2)计算可决系数和回归估计的标准误差
可决系数为:
由 可得
回归估计的标准误差:
(3) 对 进行显著水平为 5%的显著性检验
查表得 时, <
表明 显著不为 0,销售收入对销售成本有显著影响.
(4) 假定下年 1 月销售收入为 800 万元,利用拟合的回归方程预测其销售成本,并给出置
信度为 95%的预测区间。
1 2
ˆ ˆ X
ˆ iY X
2 2 2 2
2 22
2 2 2
2
ˆ ˆˆ ( )
i i i
i i i
y x x
R
y y y
2
2
21
i
i
e
r
y
2 2 2(1 )i ie R y
2 2 2(1 ) (1 ) ie R y
2ˆ ( 2) (12 2) n
2
* 2 2 2
^ ^
2 2
ˆ ˆ
~ ( 2)
ˆ ˆ( ) ( )
t t n
SE SE
^
2 2
ˆ ˆ( )
i
SE
x
* 2
^
2
ˆ
ˆ( )
t
SE
(12 2)
*
2
万元
预测区间为:
表 中是 1992 年亚洲各国人均寿命(Y)、按购买力平价计算的人均 GDP
(X1)、成人识字率(X2)、一岁儿童疫苗接种率(X3)的数据:
表 1992 年亚洲各国人均寿命等数据
序
号
国家和
地区
平均寿命
Y (年)
人均 GDP
X1(100 美元)
成人识字率
X2(%)
一岁儿童疫苗接种
率 X3 (%)
1 日本 79 194 99 99
2 中国香港 77 185 90 79
3 韩国 70 83 97 83
4 新加坡 74 147 92 90
5 泰国 69 53 94 86
6 马来西亚 70 74 80 90
7 斯里兰卡 71 27 89 88
8 中国大陆 70 29 80 94
9 菲律宾 65 24 90 92
10 朝鲜 71 18 95 96
11 蒙古 63 23 95 85
12 印度尼西亚 62 27 84 92
13 越南 63 13 89 90
14 缅甸 57 7 81 74
15 巴基斯坦 58 20 36 81
16 老挝 50 18 55 36
17 印度 60 12 50 90
18 孟加拉国 52 12 37 69
19 柬埔寨 50 13 38 37
20 尼泊尔 53 11 27 73
21 不丹 48 6 41 85
22 阿富汗 43 7 32 35
资料来源:联合国发展规划署. 人的发展报告. 1993
(1)分别设定简单线性回归模型,分析各国人均寿命与人均 GDP、成人识字率、一岁儿
童疫苗接种率的数量关系。
ˆ 800 iY X
2
2 2
( )1ˆ ˆ FFF
i
X X
Y Y t
n x
m
21 (800 )
12
FY
m
m
(2)对所建立的多个回归模型进行检验。
(3)分析对比各个简单线性回归模型。
练习题 参考解答:
(1) 分别设定简单线性回归模型,分析各国人均寿命与人均 GDP、成人识字率、一岁
儿童疫苗接种率的数量关系:
1) 人均寿命与人均 GDP 关系
估计检验结果:
2) 人均寿命与成人识字率关系
3) 人均寿命与一岁儿童疫苗接种率关系
1 2 1i i iY X u
(2)对所建立的多个回归模型进行检验
由人均 GDP、成人识字率、一岁儿童疫苗接种率分别对人均寿命回归结果的参数 t 检验
值均明确大于其临界值,而且从对应的 P 值看,均小于 ,所以人均 GDP、成人识字率、一
岁儿童疫苗接种率分别对人均寿命都有显著影响.
(3)分析对比各个简单线性回归模型
人均寿命与人均 GDP 回归的可决系数为
人均寿命与成人识字率回归的可决系数为
人均寿命与一岁儿童疫苗接种率的可决系数为
相对说来,人均寿命由成人识字率作出解释的比重更大一些
按照“弗里德曼的持久收入假说”: 持久消费 正比于持久收入 ,依此假说建
立的计量模型没有截距项,设定的模型应该为: ,这是一个过原点的回归。
在古典假定满足时,证明过原点的回归中 的 OLS 估计量 的计算公式是什么?对该模
型是否仍有 和 ?对比有截距项模型和无截距项模型参数的 OLS 估计
有什么不同?
练习题 参考解答:
没有截距项的过原点回归模型为:
因为
求偏导
Y X
2i i iY X u
2 2̂
0ie 0i ie X
2i iY X u
2 2
2
ˆ( )i i ie Y X
2
2
2
ˆ2 ( )( ) 2ˆ
i
i i i i i
e
Y X X e X
令
得 而有截距项的回归为
对于过原点的回归,由 OLS 原则: 已不再成立, 但是 是成立的。
还可以证明对于过原点的回归 ,
而有截距项的回归为 ,
练习题 中如果将“地方财政收入”和“本市生产总值”数据的计量单位分别或同
时由”亿元”改为”万元”,重新估计参数,对比参数估计及检验结果与计量单位更改之前有什
么区别? 你能从中总结出什么规律性吗?
练习题 参考解答:
如果将“地方财政收入 Y”和“本市生产总值 GDP”数据的计量单位分别或同时由”亿元”改为”
万元”,数据变为:
深圳市地方预算内财政收入与国内生产总值
地方预算内财政收入 Y 本市生产总值(GDP)年 份
(亿元)Y1 (万元)Y2 (亿元)GDP1 (万元) GDP2
1990 217000 1716700
1991 273300 2366600
1992 429600 3173200
1993 672500 4531400
1994 . 744000 6346700
1995 880200 8424800
1996 1317500 10484400
1997 1420600 12974200
1998 1643900 15347300
1999 1842100 18040200
2000 2219200 21874500
2001 2624900 24824900
2002 2659300 29695200
2003 2908400 35857200
2
2
2
ˆ2 ( )( ) 0ˆ
i
i i i
e
Y X X
2 2
ˆ i i
i
X Y
X
2 2
ˆ i i
i
x y
x
0ie 0i ie X
2
2 2
ˆ( )
i
Var
X
2
2ˆ
1
ie
n
2
2 2
ˆ( )
i
Var
x
2
2ˆ
2
ie
n
2004 3214700 42821400
2005 4213800 49509100
2006 5008800 58135600
2007 6580600 68015700
A.当“地方财政收入”和“本市生产总值”数据的计量单位均为“亿元”时估计检验结果为:
() ()
t=() () R2=
B.当“地方财政收入” 的计量单位为“亿元”,“本市生产总值” 的计量单位为“万元”
时:
()()
t=() () R2=
C.当“地方财政收入” 的计量单位为“万元”,“本市生产总值” 的计量单位为“亿元”
时:
() ()
t=() () R2=
D.当“地方财政收入” 的计量单位为“万元”,“本市生产总值” 的计量单位为“万元”
时:
() ()
t=() () R2=
可以总结出,变量度量单位对回归影响的一般规律为:
1)当被解释变量测量单位改变(扩大或缩小常数 c 倍),而解释变量测量单位不变时:OLS
截距和斜率的估计值及标准误差都缩小或扩大为原来的 c 倍. (如 C 的情况)
2)当解释变量测量单位改变(扩大或缩小常数 c 倍),而被解释变量测量单位不变时:OLS
斜率的估计值及标准误差扩大或缩小为原来的 c 倍,但不影响截距的估计. (如 B 的情况)3)当
被解释变量和解释变量测量单位同时改变相同倍数时,OLS 的截距估计值及标准误差扩大
为原来的 c 倍,但不影响斜率的估计. (如 D 的情况)
4)当被解释变量和解释变量测量单位改变时,不会影响拟合优度.可决系数是纯数没有
维度,所以不随计量单位而变化。
第三章练习题参考解答
1 1
ˆ tY GDP
1 2
ˆ tY GDP
2 1
ˆ tY GDP
2 2
ˆ tY GDP
练习题
为研究中国各地区入境旅游状况,建立了各省市旅游外汇收入(Y,百万美元)、旅
行社职工人数(X1,人)、国际旅游人数(X2,万人次)的模型,用某年 31 个省市的截面
数据估计结果如下:
t=() () ()
R2= F= n=31
(1) 从经济意义上考察估计模型的合理性。
(2) 在 5%显著性水平上,分别检验参数 的显著性。
(3) 在 5%显著性水平上,检验模型的整体显著性。
根据下列数据试估计偏回归系数、标准误差,以及可决系数与修正的可决系数:
, , , ,
, ,
, ,
,
经研究发现,家庭书刊消费受家庭收入几户主受教育年数的影响,表中为对某地区
部分家庭抽样调查得到样本数据:
家 庭 书 刊 年
消费支出(元)
Y
家 庭 月 平 均
收入
(元)X
户 主 受 教 育
年数
(年)T
家 庭 书 刊 年
消费支出(元)
Y
家 庭 月 平 均
收入
(元)X
户 主 受 教 育
年数
(年)T
450 8 14
9 2196 10
12 12
9 8
7 2154 10
15 14
1641 9 1121 18
10 16
18 1253 20
(1) 建立家庭书刊消费的计量经济模型;
iii XXY 21 ˆ
R
21 ,
1 2 15n
2( ) Y 21 1( ) X
2
2 2( ) X 1 1( )( ) iY Y X X
2 2( )( ) iY Y X X 1 1 2 2( )( ) iX X X X
(2)利用样本数据估计模型的参数;
(3)检验户主受教育年数对家庭书刊消费是否有显著影响;
(4)分析所估计模型的经济意义和作用
考虑以下“期望扩充菲利普斯曲线(Expectations-augmented Phillips curve)”模型:
其中: =实际通货膨胀率(%); =失业率(%); =预期的通货膨胀率(%)
下表为某国的有关数据,
表 1. 1970-1982 年某国实际通货膨胀率 Y(%),
失业率 X2(%)和预期通货膨胀率 X3(%)
年份 实际通货膨胀率 Y
(%)
失业率 X2
(%)
预期的通货膨胀率
X3(%)
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
(1)对此模型作估计,并作出经济学和计量经济学的说明。
(2)根据此模型所估计结果,作计量经济学的检验。
(3)计算修正的可决系数(写出详细计算过程)。
某地区城镇居民人均全年耐用消费品支出、人均年可支配收入及耐用消费品价格指
数的统计资料如表所示:
年份 人均耐用消费品支出
Y(元)
人均年可支配收入
X1(元)
耐用消费品价格指数
X2(1990 年=100)
tttt uXXY 33221
tY tX 2 tX 3
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
利用表中数据,建立该地区城镇居民人均全年耐用消费品支出关于人均年可支配收入和
耐用消费品价格指数的回归模型,进行回归分析,并检验人均年可支配收入及耐用消费品
价格指数对城镇居民人均全年耐用消费品支出是否有显著影响。
下表给出的是 1960—1982 年间 7 个 OECD 国家的能源需求指数(Y)、实际 GDP 指
数(X1)、能源价格指数(X2)的数据,所有指数均以 1970 年为基准(1970=100)
年份 能 源 需
求 指 数
Y
实 际
GDP 指
数 X1
能源价格
指数 X2
年份 能源需求
指数 Y
实 际
GDP 指
数 X1
能源价格
指数 X2
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
(1) 建 立 能 源 需 求 与 收 入 和 价 格 之 间 的 对 数 需 求 函 数
,解释各回归系数的意义,用 P 值检验所估计回tttt uXXY 2ln1lnln 210
归系数是否显著。
(2) 再建立能源需求与收入和价格之间的线性回归模型 ,
解释各回归系数的意义,用 P 值检验所估计回归系数是否显著。
(3 )比较所建立的两个模型,如果两个模型结论不同,你将选择哪个模型,为什么?
练习题参考解答
练习题 参考解答
有模型估计结果可看出:旅行社职工人数和国际旅游人数均与旅游外汇收入正相关。平
均说来,旅行社职工人数增加 1 人,旅游外汇收入将增加 百万美元;国际旅游人数
增加 1 万人次,旅游外汇收入增加 百万美元。
取 ,查表得
因为 3 个参数 t 统计量的绝对值均大于 ,说明经 t 检验 3 个参数均显
著不为 0,即旅行社职工人数和国际旅游人数分别对旅游外汇收入都有显著影响。
取 ,查表得 ,由于 ,说
明旅行社职工人数和国际旅游人数联合起来对旅游外汇收入有显著影响,线性回归方程显著
成立。
练习题 参考解答
(1)建立家庭书刊消费的计量经济模型:
其中:Y 为家庭书刊年消费支出、X 为家庭月平均收入、T 为户主受教育年数
(2)估计模型参数,结果为
即
uXXY ttt 21 210
)331( t
)331( t
)28,2( F )28,2( FF
iiii uTXY 321
iii TXY ˆ
()() ()
t= () () ()
R2= F=
(3) 检验户主受教育年数对家庭书刊消费是否有显著影响:
由估计检验结果, 户主受教育年数参数对应的 t 统计量为 , 明显大于 t 的临界值
,同时户主受教育年数参数所对应的 P 值为 ,明显小于
,均可判断户主受教育年数对家庭书刊消费支出确实有显著影响。
(4)本模型说明家庭月平均收入和户主受教育年数对家庭书刊消费支出有显著影响,家庭
月平均收入增加 1 元,家庭书刊年消费支出将增加 元,户主受教育年数增加 1 年,家
庭书刊年消费支出将增加 元。
练习题 参考解答
(1) 建立该地区城镇居民人均全年耐用消费品支出关于人均年可支配收入和耐用消费品
价格指数的回归模型:
(2)估计参数结果
由估计和检验结果可看出,该地区人均年可支配收入的参数的 t 检验值为 ,其
绝 对 值 大 于 临 界 值 ; 而 且 对 应 的 P 值 为 , 也 明 显 小 于
。说明人均年可支配收入对该地区城镇居民人均全年耐用消费品支出确实有显著
影响。
但是,该地区耐用消费品价格指数的参数的 t 检验值为,其绝对值小于临界值
;而且对应的 P 值为 ,也明显大于 。这说明该地区耐
用消费品价格指数对城镇居民人均全年耐用消费品支出并没有显著影响。
第四章
R
)318( t
tttt uTXY 321
)311( t
)311( t
假设在模型 中, 之间的相关系数为零,于
是有人建议你进行如下回归:
(1)是否存在 ?为什么?
(2)
(3)是否有 ?
练习题 参考解答:
(1) 存在 。
因为
当 之间的相关系数为零时,离差形式的
有
同理有:
(2)
因为 ,且 ,
由于 ,则
则
(3) 存在 。
iiii uXXY 33221 32 XX 与
iii
iii
uXY
uXY
2331
1221
3322
ˆˆˆˆ 且
1 1 1
ˆ ˆ ˆ 会等于 或 或两者的某个线性组合吗?
3322 ˆvarˆvarˆvarˆvar 且
3322
ˆˆˆˆ 且
2322322
323
2
32
2
ˆ
iiii
iiiiiii
xxxx
xxxyxxy
32 XX 与 032 ii xx
222
2
2
3
2
2
2
32
2 ˆˆ
i
ii
ii
iii
x
xy
xx
xxy
33
ˆˆ
1 1 1
ˆ ˆ ˆ 会等于 或 的某个线性组合
1 2 2 3 3
ˆ ˆ ˆY X X 1 2 2ˆ ˆY X 1 3 3ˆ ˆY X
3322
ˆˆˆˆ 且
1
1 2 2 2 2 2
2
ˆˆ ˆˆ ˆ YY X Y X
X
1
1 3 3 3 3 3
3
ˆˆ ˆˆ ˆ YY X Y X
X
1 1
1 2 2 3 3 2 3 1 1
2 3
ˆ ˆˆ ˆ ˆ ˆ ˆY YY X X Y X X Y
X X
3322 ˆvarˆvarˆvarˆvar 且
因为
当 时,
同理,有
在决定一个回归模型的“最优”解释变量集时人们常用逐步回归的方法。在逐步回归
中既可采取每次引进一个解释变量的程序(逐步向前回归),也可以先把所有可能的解释变量
都放在一个多元回归中,然后逐一地将它们剔除(逐步向后回归)。加进或剔除一个变量,通
常是根据 F 检验看其对 ESS 的贡献而作出决定的。根据你现在对多重共线性的认识,你赞
成任何一种逐步回归的程序吗?为什么?
练习题 参考解答:
根据对多重共线性的理解,逐步向前和逐步向后回归的程序都存在不足。逐步向前法不
能反映引进新的解释变量后的变化情况,即一旦引入就保留在方程中;逐步向后法则一旦某
个解释变量被剔出就再也没有机会重新进入方程。而解释变量之间及其与被解释变量的相关
关系与引入的变量个数及同时引入哪些变量而呈现出不同,所以要寻找到“最优”变量子集则
采用逐步回归较好,它吸收了逐步向前和逐步向后的优点。
下表给出了中国商品进口额 Y、国内生产总值 GDP、居民消费价格指数 CPI。
表 中国商品进口额、国内生产总值、居民消费价格指数
年份
商品进口额
(亿元)
国内生产总值
(亿元)
居民消费价格指数(1985=100)
1985
1986
1987
1988
1989
1990
1991
1992
1993
2
23
2
2
2
2 1
ˆvar
rx i
023 r 222
2
2
23
2
2
2
2 ˆvar1
ˆvar
ii xrx
33 ˆvarˆvar
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
资料来源:《中国统计年鉴》,中国统计出版社 2000 年、2008 年。
请考虑下列模型:
1)利用表中数据估计此模型的参数。
2)你认为数据中有多重共线性吗?
3)进行以下回归:
根据这些回归你能对数据中多重共线性的性质说些什么?
4)假设数据有多重共线性,但 在 5%水平上个别地显著,并且总的 F 检验也是显
著的。对这样的情形,我们是否应考虑共线性的问题?
练习题 参考解答:
(1) 参数估计结果如下
ittt uCPIGDPY lnlnln 321 +
itt
itt
itt
vCPICCGDP
vCPIBBY
vGDPAAY
321
221
121
lnln
lnln
lnln
+
+
32
ˆˆ 和
(括号内为标准误)
(2)居民消费价格指数的回归系数的符号不能进行合理的经济意义解释,且且 CPI 与进口之
间的简单相关系数呈现正向变动。可能数据中有多重共线性。
计算相关系数:
(3)最大的 CI=,表明 GDP 与 CPI 之间存在较高的线性相关。
(4)分别拟合的回归模型如下:
2 2
ln( ) ln( ) ln( )
() () ()
F
GDP CPI
R R
进口
2 2
ln Y ( )
t= () ()
GDP
R R F
单方程拟合效果都很好,回归系数显著,可决系数较高,GDP 和 CPI 对进口分别有显著
的单一影响,在这两个变量同时引入模型时影响方向发生了改变,这只有通过相关系数的分
析才能发现。
(5)如果仅仅是作预测,可以不在意这种多重共线性,但如果是进行结构分析,还是应该引
起注意。
自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造解释变量数据
矩阵 X 才可能避免多重共线性的出现?
练习题 参考解答:
本题很灵活,主要应注意以下问题:
2 2
ln Y ln ( PI)
t= () ()
C
R R F
2 2
ln( ) ( PI)
t=() ()
GDP C
R R F
(1)选择变量时要有理论支持,即理论预期或假设;变量的数据要足够长,被解释变量与
解释变量之间要有因果关系,并高度相关。
(2)建模时尽量使解释变量之间不高度相关,或解释变量的线性组合不高度相关。
克莱因与戈德伯格曾用 1921-1950 年(1942-1944 年战争期间略去)美国国内消费 Y
和工资收入 X1、非工资—非农业收入 X2、农业收入 X3 的时间序列资料,利用 OLSE 估计
得出了下列回归方程:
括号中的数据为相应参数估计量的标准误差。试对上述模型进行评析,指出其中存在的问
题。
练习题 参考解答:
从模型拟合结果可知,样本观测个数为 27,消费模型的判定系数 ,F 统计量
为 ,在 置信水平下查分子自由度为 3,分母自由度为 23 的 F 临界值为 ,
计算的 F 值远大于临界值,表明回归方程是显著的。模型整体拟合程度较高。
依据参数估计量及其标准误,可计算出各回归系数估计量的 t 统计量值:
除 外,其余的 值都很小。工资收入 X1 的系数的 t 检验值虽然显著,但该系数的估计值
过大,该值为工资收入对消费边际效应,因为它为 ,意味着工资收入每增加一美元,
消费支出的增长平均将超过一美元,这与经济理论和常识不符。
另外,理论上非工资—非农业收入与农业收入也是消费行为的重要解释变量,但两者的 t
检验都没有通过。这些迹象表明,模型中存在严重的多重共线性,不同收入部分之间的相互
关系,掩盖了各个部分对解释消费行为的单独影响。
理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发
展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费总量 Y (万吨标
准煤)、国民总收入(亿元)X1(代表收入水平)、国内生产总值 (亿元)X2(代表经济发展水平)、
工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发
()()()()
ˆ
2
FR
XXXY
R
0 1 2 3
, , ,
t t t t
1t jt
展水平及产业结构)、人均生活电力消费 (千瓦小时)X6(代表人民生活水平提高)、能源加工
转换效率(%)X7(代表能源转换技术)等在 1985-2007 年期间的统计数据,具体如表 所示。
表 1985~2007 年统计数据
能源消费
国民
总收入
国内生
产总值
工业
增加值
建筑业
增加值
交通运输邮电
增加值
人均生活
电力消费
能源加工
转换效率
年份
y X1 X2 X3 X4 X5 X6 X7
1985 76682 9016
1986 80850 3967
1987 86632
1988 92997 810 661
1989 96934 6484 794 786
1990 98703 6858
1991 103783
1992 109170 1415
1993 115993 35260 14188
1994 122737
1995 131176
1996 138948
1997 137798 78973 4593
1998 132214
1999 133831 88189
2000 138553
2001 143199
2002 151797
2003 174990 135174
2004 203227 65210
2005 223319
2006 246270
2007 265583
资料来源:《中国统计年鉴》,中国统计出版社 2000、2008 年版。
要求:
1)建立对数多元线性回归模型,分析回归结果。
2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么?
3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。
练习题 参考解答:
(1)建立对数线性多元回归模型,引入全部变量建立对数线性多元回归模型如下:
生成: lny=log(y), 同样方法生成: lnx1,lnx2,lnx3,lnx4,lnx5,lnx6,lnx7.
作全部变量对数线性多元回归,结果为:
从修正的可决系数和 F 统计量可以看出,全部变量对数线性多元回归整体对样本拟合很
好,,各变量联合起来对能源消费影响显著。可是其中的 lnX3、lnX4、lnX6 对 lnY 影响不显
著,而且 lnX2、lnX5 的参数为负值,在经济意义上不合理。所以这样的回归结果并不理想。
(2) 预料此回归模型会遇到多重共线性问题, 因为国民总收入与 GDP 本来就是一对关
联指标;而工业增加值、建筑业增加值、交通运输邮电业增加值则是 GDP 的组成部分。这
两组指标必定存在高度相关。
解释变量国民总收入(亿元)X1(代表收入水平)、国内生产总值(亿元)X2(代表经济发展水
平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表
产业发展水平及产业结构)、人均生活电力消费 (千瓦小时)X6(代表人民生活水平提高)、能
源加工转换效率(%)X7(代表能源转换技术)等很可能线性相关,计算相关系数如下:
可以看出 lnx1 与 lnx2、lnx3、lnx4、lnx5、lnx6 之间高度相关,许多相关系数高于
以上。如果决定用表中全部变量作为解释变量,很可能会出现严重多重共线性问题。
(3)因为存在多重共线性,解决方法如下:
A:修正理论假设,在高度相关的变量中选择相关程度最高的变量进行回归建立模型:
而对变量取对数后,能源消费总量的对数与人均生活电力消费的对数相关程度最高,可建立
这两者之间的回归模型。如
B:进行逐步回归,直至模型符合需要研究的问题,具有实际的经济意义和统计意义。
采 用 逐 步 回 归 的 办 法 , 去 检 验 和 解 决 多 重 共 线 性 问 题 。 分 别 作 对
的一元回归,结果如下:
一元回归结果:
变量 lnX1 lnX2 lnX3 lnX4 lnX5 lnX6 lnX7
参数估计值
t 统计量
可决系数
调整可决系
数
其中加入 lnX6 的方程调整的可决系数最大, 以 lnX6 为基础, 顺次加入其他变量逐步回归。
结果如下表:
变量 lnX1 lnX2 lnX3 lnX4 lnX5 lnX6 lnX7
lnX6
lnX1
()
()
lnX6
lnX2
()
()
lnX6
lnX3
()
()
lnX6
lnX4
()
()
lnX6
lnX5
()
()
lnX6
lnX7
()
经比较,新加入 lnX5 的方程调整可决系数改进最大, 各参数的 t 检验也都显著,但是 lnX5 参数
的符号与经济意义不符合。若再加入其他变量后的逐步回归,若剔除不显著的变量和无经济意义
的变量后, 仍为第一步所建只包含 lnX6 的一元回归模型。
如果需要建立多元线性回归模型,则需寻找新的变量或改变模型形式。
例如, 不取对数作全部变量多元线性回归,结果为:
2 2
ln 6
() ()
y x
R R F
lnY
1 2 3 4 5 6 7ln , ln , ln , ln , ln , ln , ln XX X X X X X
2R
可以看出还是有严重多重共线性。作逐步回归:
分别作一元回归得到:
变量 X1 X2 X3 X4 X5 X6 X7
参数估计值
t 统计量
以 X1 为基础加入其他变量, 结果为:
X1 X2 X3 X4 X5 X6 X7
X1,X2
()
()
X1,X3
()
()
X1,X4
()
()
X1,X5
()
()
X1,X6
()
()
X1,X7
()
()
注: 括号中为 p 值.
可以发现加入 X2、X5、X6、X7 后参数的符号不合理,加入 X4 后并不显著。只有加入 X3
后修正的可决系数有所提高,而且参数符号的经济意义合理, X3 参数估计值的 p 值为 ,
在 10%的显著性水平下是显著的。所以相对较为合理的模型估计结果可以为:
2R
2R
2R
在本章开始的“引子”提出的“农业的发展反而会减少财政收入吗?”的例子中,如果所采
用的数据如下表所示
表 1978-2007 年财政收入及其影响因素数据
年份
财政收入
(亿元)CS
农业增加值
(亿元)NZ
工业增加值
(亿元)GZ
建筑业增加
值(亿
元)JZZ
总人口(万
人)TPOP
最终消费
(亿元)CUM
受灾面积
(千公
顷)SZM
1978 1607 96259 50790
1979 97542 39370
1980 98705 44526
1981 100072 39790
1982 101654 37148 33130
1983 1367 103008 34710
1984 2789 104357 31890
1985 105851 44365
1986 2122 3967 107507 47140
1987 109300 42090
1988 810 111026 50870
1989 6484 794 112704 46991
1990 6858 114333 38474
1991 115823 55472
1992 1415 117171 51333
1993 14188 118517 48829
1994 119850 55043
1995 121121 45821
1996 122389 46989
1997 123626 53429
1998 124761 50145
1999 125786 49981
2000 126743 61516 54688
2001 127627 52215
2002 128453 47119
2003 129227 54506
2004 65210 129988 37106
2005 130756 38818
2006 131448 41091
2007 132129 48992
(资料来源:《中国统计年鉴 2008》,中国统计出版社 2008 年版)
试分析:为什么会出现本章开始时所得到的异常结果?怎样解决所出现的问题?
练习题 参考解答:
(1)根据样本数据得到各解释变量的样本相关系数矩阵如下:
样本相关系数矩阵
解释变量之间相关系数较高,特别是农业增加值、工业增加值、建筑业增加值、最终消费之
间,相关系数都在 以上。这显然与第三章对模型的无多重共线性假定不符合。
(2)解决方案:
采用逐步回归的方式,可以得到没有共线性的回归模型,但可能存在设定偏误。
合并工业增加值与建筑业增加值,得到财政收入与第二产业的回归。
取对数再回归,可以减低共线性。
第五章
设消费函数为
式中, 为消费支出; 为个人可支配收入; 为个人的流动资产; 为随机误差
项,并且 (其中 为常数)。试解答以下问题:
(1)选用适当的变换修正异方差,要求写出变换过程;
(2)写出修正异方差后的参数估计量的表达式。
练习题 参考解答:
(1)因为 ,所以取 ,用 乘给定模型两端,得
上述模型的随机误差项的方差为一固定常数,即
(2)根据加权最小二乘法,可得修正异方差后的参数估计式为
3
1 2 3
2 2 2 2
1i i i
i i i i
Y X u
X X X X
2
2
2 2
1
( ) ( )i i
i i
u
Var Var u
X X
* * *
1 2 2 3 3
ˆ ˆ ˆY X X
iiii uXXY 33221
iY iX 2 iX 3 iu
2
2
2)(,0)( iii XuVaruE
2
2
2( )i if X X 2
2
1
i
i
W
X
2iW
其中
下表是消费 Y 与收入 X 的数据,试根据所给数据资料完成以下问题:
(1)估计回归模型 中的未知参数 和 ,并写出样本回归模型
的书写格式;
(2)试用 Goldfeld-Quandt 法和 White 法检验模型的异方差性;
(3)选用合适的方法修正异方差。
表 某地区消费 Y 与收入 X 的数据(单位:亿元)
Y X Y X Y X
55 80 152 220 95 140
65 100 144 210 108 145
70 85 175 245 113 150
80 110 180 260 110 160
79 120 135 190 125 165
84 115 140 205 115 180
98 130 178 265 130 185
95 140 191 270 135 190
90 125 137 230 120 200
75 90 189 250 140 205
74 105 55 80 140 210
110 160 70 85 152 220
113 150 75 90 140 225
125 165 65 100 137 230
108 145 74 105 145 240
115 180 80 110 175 245
140 225 84 115 189 250
* * *2 * * * *
2 2 2 3 2 3 2 2 3
2 2*2 *2 * *
2 2 2 3 2 2 3
ˆ i i i i i i i i i i i
i i i i i i i
W y x W x W y x W x x
W x W x W x x
* * *2 * * * *
2 3 2 2 2 2 2 2 3
3 2*2 *2 * *
2 2 2 3 2 2 3
ˆ i i i i i i i i i i i
i i i i i i i
W y x W x W y x W x x
W x W x W x x
2 2 2 3 2* * *
2 3
2 2 2
, ,i i i i i i
i i i
W X W X W Y
X X Y
W W W
* * * * * *
2 2 2 3 3 3i i i i ix X X x X X y Y Y
uXY 21 1 2
120 200 79 120 180 260
145 240 90 125 178 265
130 185 98 130 191 270
练习题 参考解答:
(1)该模型样本回归估计式的书写形式为
(2)首先,用 Goldfeld-Quandt 法进行检验。
将样本 X 按递增顺序排序,去掉中间 1/4 的样本,再分为两个部分的样本,即
。
分别对两个部分的样本求最小二乘估计,得到两个部分的残差平方和,即
求 F 统计量为
给定 ,查 F 分布表,得临界值为 。
c.比较临界值与 F 统计量值,有 => ,说明该模型的随机误
差项存在异方差。
其次,用 White 法进行检验。具体结果见下表
White Heteroskedasticity Test:
F-statistic Probability
Obs*R-squared Probability
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 08/05/05 Time: 12:37
Sample: 1 60
Included observations: 60
Variable Coefficient Std. Error t-Statistic Prob.
C
X
X^2
R-squared Mean dependent var
Adjusted R-squared . dependent var
. of regression Akaike info criterion
Sum squared resid Schwarz criterion
1 2 22n n
2
1
2
2
e
e
2
2
2
1
e
F
e
F
2 2
ˆ +
t= () ()
R = R = F= DW=
i iY X
(20,20)
(20,20)
Log likelihood F-statistic
Durbin-Watson stat Prob(F-statistic)
给定 ,在自由度为 2 下查卡方分布表,得 。比较临界值与卡方
统计量值,即 ,同样说明模型中的随机误差项存在异方差。
(2)用权数 ,作加权最小二乘估计,得如下结果
Dependent Variable: Y
Method: Least Squares
Date: 08/05/05 Time: 13:17
Sample: 1 60
Included observations: 60
Weighting series: W1
Variable Coefficient Std. Error t-Statistic Prob.
C
X
Weighted Statistics
R-squared Mean dependent var
Adjusted R-squared . dependent var
. of regression Akaike info criterion
Sum squared resid Schwarz criterion
Log likelihood F-statistic
Durbin-Watson stat Prob(F-statistic)
Unweighted Statistics
R-squared Mean dependent var
Adjusted R-squared . dependent var
. of regression Sum squared resid
Durbin-Watson stat
用 White 法进行检验得如下结果:
White Heteroskedasticity Test:
F-statistic Probability
Obs*R-squared Probability
给定 ,在自由度为 2 下查卡方分布表,得 。比较临界值与卡方
统计量值,即 ,说明加权后的模型中的随机误差项不存在异
方差。其估计的书写形式为
下表是 2007 年我国各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数
2
2
1
1W
X
2
2 <
2 2
ˆ
() ()
R R = DW= F=
Y X
t
据
表 各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数据(单位:元)
地 区
家庭人均纯收
入
家庭生活消费
支出
地 区
家庭人均纯收
入
家庭生活消费
支出
北 京 湖 北 3090
天 津 湖 南
河 北 广 东
山 西 广 西
内蒙古 海 南
辽 宁 重 庆
吉 林 四 川
黑龙江 贵 州
上 海 云 南
江 苏 西 藏
浙 江 陕 西
安 徽 甘 肃
福 建 青 海
江 西 宁 夏
山 东 新 疆
河 南
(1)试根据上述数据建立 2007 年我国农村居民家庭人均消费支出对人均纯收入的线
性回归模型。
(2)选用适当方法检验模型是否在异方差,并说明存在异方差的理由。
(3)如果存在异方差,用适当方法加以修正。
练习题 参考解答:
解: (1)建立样本回归函数。
()()
(2)利用 White 方法检验异方差,则 White 检验结果见下表:
Heteroskedasticity Test: White
F-statistic Prob. F(2,28)
Obs*R-squared Prob. Chi-Square(2)
Scaled explained SS Prob. Chi-Square(2)
ˆ + X
2 , F=
由上述结果可知,该模型存在异方差。分析该模型存在异方差的理由是,从数据可以看出,
一是截面数据;二是各省市经济发展不平衡,使得一些省市农村居民收入高出其它省市很多,
如上海市、北京市、天津市和浙江省等。而有的省就很低,如甘肃省、贵州省、云南省和陕
西省等。
(3)用加权最小二乘法修正异方差,分别选择权数 ,经
过试算,认为用权数 的效果最好。结果如下:
书写结果为
下表是某一地区 31 年中个人储蓄和个人收入数据资料
表 个人储蓄和个人收入数据(单位:元)
时期 储蓄额(Y) 收入额(X) 时期 储蓄额(Y) 收入额(X)
1 264 8777 17 1578 24127
2 105 9210 18 1654 25604
3 90 9954 19 1400 26500
4 131 10508 20 1829 27670
5 122 10979 21 2200 28300
6 107 11912 22 2017 27430
7 406 12747 23 2105 29560
8 503 13499 24 1600 28150
2
1 1 1
1 , 2 , 3w w w
X XX
3w
2
ˆ
() ()
,
Y X
R F
9 431 14269 25 2250 32100
10 588 15522 26 2420 32500
11 898 16730 27 2570 35250
12 950 17663 28 1720 33500
13 779 18575 29 1900 36000
14 819 19635 30 2100 36200
15 1222 21163 31 2300 38200
16 1702 22880
(1)建立一元回归函数,判断有无异方差存在,并说明存在异方差的原因。
(2)用适当方法修正异方差。
练习题 参考解答:
(1)建立样本回归函数。
()()
从估计的结果看,各项检验指标均显著。但由于收入通常存在不同的差异,因此需要判断模
型是否存在异方差。
首先,用图形法。从残差平方对解释变量散点图可以看出(见下图),模型很可能存在
异方差。
其次,用运用 Goldfeld-Quanadt 检验异方差。
第一,对变量 X 取值以升序排序。
第二,构造子样本。由于本例的样本容量为 31,删除 1/4 观测值,约 7 个,余下部分分
得两个样本区间:1—12 和 20—31,它们的样本个数均是 12 个。
ˆ + X
2 , F=
第三,在样本区为1—12,所计算得到的残茶平方和为 ;在样本区为
20—31,所计算得到的残茶平方和为 。
第四,根据Goldfeld-Quanadt检验,F统计量为 。
第五,判断。在显著性水平为条件下,分子分母的自由度均为10,查F分布表得临
界值为 ,因为 ,所以拒绝原假设,表
明模型存在异方差。
最后,用ARCH方法检验异方差,则ARCH检验结果见下表:
Heteroskedasticity Test: ARCH
F-statistic Prob. F(1,28)
Obs*R-squared Prob. Chi-Square(1)
由上述结论可知,拒绝原假设,则模型中随机误差项存在异方差。
(2)分别用权数 ,发现用权数 求加权最小二乘估计
效果最好,即
下表的数据是 2007 年我国建筑业总产值(X)和建筑业企业利润总额(Y)。试根
据资料建立回归模型,并对模型判断是否存在异方差,如果有异方差,选用适当方法修正。
表 各地区建筑业总产值(X)和建筑业企业利润总额(Y)(单位:万元)
地 区
建筑业总产值
x
建筑业企业利
润总额 y
地 区
建筑业总产值
x
建筑业企业利
润总额 y
北 京 25767692 湖 北 21108043
天 津 12219419 湖 南 18288148
河 北 16146909 广 东 29995140
山 西 10607041 广 西 6127370
2
1
2
2
2
2
2
1
i
i
e
F
e
(10,10) (10,10) F
2
1 1 1
1 , 2 , 3w w w
X XX
2w
2
ˆ
( ) ()
,
Y X
R F
内蒙古 海 南 821834
辽 宁 21000402 重 庆 11287118
吉 林 102742 四 川 21099840 466176
黑龙江 贵 州
上 海 25241801 云 南
江 苏 70105724 西 藏
浙 江 69717052 陕 西 11730972
安 徽 15169772 甘 肃
福 建 15441660 青 海
江 西 宁 夏
山 东 32890450 新 疆
河 南 21517230
数据来源:国家统计局网站
练习题 参考解答:
(1)求 对 的回归,得如下估计结果
用怀特检验的修正方法,即建立如下回归模型
通过计算得到如下结果:
注意,表中 E2 为残差平方 。
即
Y X
2
ˆ
( ) ()
,
Y X
R F
2 2
1 2 3
ˆ ˆ
i i i ie Y Y v
2
te
2 2ˆ ˆˆ ( 09) i ie E Y Y
对该模型系数作判断,运用 或 检验,可发现存在异方差。
具体 EViews 操作如下:在得到 的估计 后,进一步得到残差平方 ,然后建立 对
和 的线性回归模型。再通过上述回归对 和 前的系数是否为零进行判断,从而检验原
模 型 中 是 否 存 在 异 方 差 。 在 上 表 界 面 , 按 路 径 : VIEW/COEFFIEICENT
TESTS/REDUANDANT VARIABLES,得到如下窗口,并输入变量名“YF YF^2”,即
然后“OK”即得到检验结果为
从表中 统计量值和 统计量值看,拒绝原假设,表明原模型存在异方差。
F LM
Y Ŷ 2ie
2
ie Ŷ
2Ŷ Ŷ 2Ŷ
F LM
(2)通过对权数的试算,最后选择权数 ,用加权最小二乘法得到如下估计
(还原后的结果)
对该模型进行检验,发现已无异方差。
下表为四川省农村人均纯收入、人均生活费支出、商品零售价格指数 1978 年至
2008 年时间序列数据。试根据该资料建立回归模型,并检验是否存在异方差,如果存在异
方差,选用适当方法进行修正。
表 1978——2008 四川省农村人均纯收入、人均生活费支出、商品零售价格指数
时间 农村人均
纯收入 X
农村人均
生活消费
支出 Y
商品零售
价格指数
时间 农村人均
纯收入 X
农村人
均生活消
费支出 Y
商品零售
价格指数
1978 100 1994
1979 102 1995
1980 1996
1981 221 184 1997
1982 256 1998
1983 1999
1984 2000
1985 2001
1986 2002 347
1987 2003
1988 2004
1989 2005
1990 2006
1991 2007
1
w
lX
2
ˆ
( ) ()
, ,
Y X
R F DW
1992 2008
1993
资料来源:中经网统计数据库
练习题 参考解答:
(1)设 表示人均生活费支出, 表示农村人均纯收入,则建立样本回归函数
()()
从估计结果看,各项检验指标均显著,但从经济意义看,改革开放以来,四川省农村经济发
生了巨大变化,农村家庭纯收入的差距也有所拉大,使得农村居民的消费水平的差距也有所
加大,在这种情况下,尽管是时间序列数据,也有可能存在异方差问题。而且从残差平方对
解释变量的散点图可以看出,模型很可能存在异方差(见下图)。
进一步作利用 ARCH 方法检验异方差,得 ARCH 检验结果(见下表)
(2)运用加权最小二乘法,选权数为 ,得如下结果
Y X
^
+
2 , F=
1
w
X
()()
经检验,时模型的异方差问题有了明显的改进。
在题的数据表里,如果考虑物价因素,则对异方差性的修正应该怎样进行?
练习题 参考解答:
剔除物价上涨因素后的回归结果如下
其中, 代表实际消费支出, 代表实际可支配收入。
用 ARCH 方法来检验模型是否存在异方差:
在显著性水平为 的条件下,接收原假设,模型不存在异方差。表明剔除物价上涨因素
之后,异方差的问题有所改善。
第六章
下表给出了美国 1960-1995 年 36 年间个人实际可支配收入 X 和个人实际消费支出
Y 的数据。
表 美国个人实际可支配收入和个人实际消费支出 (单位:百亿美元)
年份
个人实际可
支配收入
X
个人实际
消费支出
Y
年份
个人实际可
支配收入
X
个人实际
消费支出
Y
1960
1961
1962
1963
1964
1965
157
162
169
176
188
200
143
146
153
160
169
180
1978
1979
1980
1981
1982
1983
326
335
337
345
348
358
295
302
301
305
308
324
^
+
2 , F=
1 1
2 2
ˆ
() ()
R R F=
Y X
t
1Y 1X
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
211
220
230
237
247
256
268
287
285
290
301
311
190
196
207
215
220
228
242
253
251
257
271
283
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
384
396
409
415
432
440
448
449
461
467
478
493
341
357
371
382
397
406
413
411
422
434
447
458
注:资料来源于 Economic Report of the President,数据为 1992 年价格。
要求:(1)用普通最小二乘法估计收入—消费模型;
(2)检验收入—消费模型的自相关状况(5%显著水平);
(3)用适当的方法消除模型中存在的问题。
练习题 参考解答:
(1)收入—消费模型为
Se = () ()
t = () ()
R2 = ,F = ,d f = 34,DW =
(2)对样本量为 36、一个解释变量的模型、5%显著水平,查 DW 统计表可知,
dL=,dU= ,模型中 DW<dL,显然消费模型中有自相关。
(3)采用广义差分法
et= et-1
()
t = () ()
R2 = F = d f = 33 DW =
查 5%显著水平的 DW 统计表可知 dL = ,dU = ,模型中 DW = > dU,说明广
义差分模型中已无自相关。同时,可决系数 R2、t、F 统计量均达到理想水平。
最终的消费模型为
tt uXY 221
tt XY ˆ
** ˆ tt XY
)(Se
936613
7285501
78313
1 ..
.ˆ
Y t = + X t
在研究生产中劳动所占份额的问题时,古扎拉蒂采用如下模型
模型 1
模型 2
其中,Y 为劳动投入,t 为时间。据 1949-1964 年数据,对初级金属工业得到如下结果:
模型 1
t = ()
R2 = DW =
模型 2
t = ()()
R2 = DW =
其中,括号内的数字为 t 统计量。
问:(1)模型 1 和模型 2 中是否有自相关;
(2)如何判定自相关的存在?
(3)怎样区分虚假自相关和真正的自相关。
练习题 参考解答:
(1)模型 1 中有自相关,模型 2 中无自相关。
(2)通过 DW 检验进行判断。
模型 1:dL=, dU=, DW<dL, 因此有自相关。
模型 2:dL=, dU=, DW>dU, 因此无自相关。
(3)如果通过改变模型的设定可以消除自相关现象,则为虚假自相关,否则为真正自相
关。
下表是北京市连续 19 年城镇居民家庭人均收入与人均支出的数据。
表 北京市 19 年来城镇居民家庭收入与支出数据表(单位:元)
年份
顺序
人均收入
(元)
人均生活消
费支出(元)
商品零售
物价指数(%)
人均实
际收入(元)
人 均 实 际
消 费 支 出
(元)
1
2
3
4
5
6
tt utY 10
tt uttY
2
210
tYt ˆ
ˆ ttYt
7
8
9
10
11
12
13
14
15
16
17
18
19
要求:(1)建立居民收入—消费函数;
(2)检验模型中存在的问题,并采取适当的补救措施预以处理;
(3)对模型结果进行经济解释。
练习题 参考解答:
(1)收入—消费模型为
(2)DW=,取 ,查 DW 上下界 ,说
明误差项存在正自相关。
(3)采用广义差分法
使用普通最小二乘法估计 的估计值 ,得
DW=,已知 。因此,在广义差分模型中已无自相关。据
2
ˆ ()
()()
() ()
t tY X
Se
t
R DW
%5 ,, DWdd UL
̂
).(t
).(Se
tt
7013
1780
6570 1
83019850
416324434
02101058
669001036
2 .
).().(t
).().(Se
X..Ŷ *t
*
t
2, DWdd UU
,可得:
因此,原回归模型应为
其经济意义为:北京市人均实际收入增加 1 元时,平均说来人均实际生活消费支出将增加
元。
下表给出了日本工薪家庭实际消费支出与可支配收入数据
表 日本工薪家庭实际消费支出与实际可支配收入 单位:1000 日元
年份
个人实际可
支配收入
X
个人实际
消费支出
Y
年份
个人实际可
支配收入
X
个人实际
消费支出
Y
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
239
248
258
272
268
280
279
282
285
293
291
294
302
300
311
329
351
354
364
360
366
370
378
374
371
381
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
304
308
310
312
314
324
326
332
334
336
334
330
384
392
400
403
411
428
434
441
449
451
449
449
注:资料来源于日本银行《经济统计年报》数据为 1990 年价格。
要求:(1)建立日本工薪家庭的收入—消费函数;
(2)检验模型中存在的问题,并采取适当的补救措施预以处理;
(3)对模型结果进行经济解释。
要求:(1)检测进口需求模型 的自相关性;
(2)采用科克伦-奥克特迭代法处理模型中的自相关问题。
)ˆ1(ˆ1
ˆ
1
tt XY
ttt uXY 21
练习题 参考解答:
(1)收入—消费模型为
t = () ()
R2 = DW =
(2)对样本量为 25、一个解释变量的模型、5%显著水平,查 DW 统计表可知,
dL=,dU= ,模型中 DW<dL,显然消费模型中有自相关。
采用广义差分法
et= et-1
t = () ()
R2 = DW =
查 5%显著水平的 DW 统计表可知 dL = ,dU = ,模型中 DW = > dU,说明广
义差分模型中已无自相关。
最终的消费模型为
Y t = + X t
(3)模型说明日本工薪居民的边际消费倾向为 ,即收入每增加 1 元,平均说来消费
增加 元。
下表给出了某地区 1980-2000 年的地区生产总值(Y)与固定资产投资额(X)的数据。
表 地区生产总值(Y)与固定资产投资额(X) 单位:亿元
年份
地区生产
总值(Y)
固定资产
投资额(X)
年份
地区生产
总值(Y)
固定资产
投资额(X)
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1402
1624
1382
1285
1665
2080
2375
2517
2741
2730
216
254
187
151
246
368
417
412
438
436
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
3124
3158
3578
4067
4483
4897
5120
5506
6088
7042
8756
544
523
548
668
699
745
667
845
951
1185
1180
要求:(1)使用对数线性模型 进行回归,并检验回归模型
tt XY ˆ
** ˆ tt XY
ˆ
1
ttt uLnXLnY 21
的自相关性;
(2)采用广义差分法处理模型中的自相关问题。
(3) 令 (固定资产投资指数), (地区生产总值增长指
数),使用模型 ,该模型中是否有自相关?
练习题 参考解答:
(1)对数模型为
ln(Y)=+(X)
t = () ()
R2 = DW =
样本量 n=21,一个解释变量的模型,5%显著水平,查 DW 统计表可知,dL=,
dU= ,模型中 DW<dL,显然模型中有自相关。
(2)采用广义差分法
et= et-1
令 , 。
对 回归,得
t = ()()
R2 = DW =
模型中 DW = > dU,说明广义差分模型中已无自相关。
最终的模型为
Ln(Y t )= +(X t )
(3)回归模型为
ln(Yt/Yt-1)= + (Xt/Xt-1)
t () ()
R2= DW=
模型中 DW = > dU,说明广义差分模型中已无自相关。
第七章 分布滞后模型和自回归模型
表 中给出了 1970-1987 年期间美国的个人消费支出(PCE)和个人可支配收入
(PDI)数据,所有数字的单位都是 10 亿美元(1982 年的美元价)。
1 tt
*
t X/XX 1 tt
*
t Y/YY
t
*
t
*
t vLnXLnY 21
)ln()ln( 1
*
ttt YYLY 1
* )ln( ttt XXLX
*
tLY
*
tLX
** ˆ tt XY
ˆ
1
表 1970-1987 年美国个人消费支出(PCE)和个人可支配收入(PDI)数据
年份 PCE PDI 年份 PCE PDI 年份 PCE PDI
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
估计下列模型:
(1) 解释这两个回归模型的结果。
(2) 短期和长期边际消费倾向(MPC)是多少?
练习题 参考解答:
1)第一个模型回归的估计结果如下,
Dependent Variable: PCE
Method: Least Squares
Date: 07/27/05 Time: 21:41
Sample: 1970 1987
Included observations: 18
Variable Coefficient Std. Error t-Statistic Prob.
C
PDI
R-squared Mean dependent var
Adjusted R-squared . dependent var
. of regression Akaike info criterion
Sum squared resid Schwarz criterion
Log likelihood F-statistic
Durbin-Watson stat Prob(F-statistic)
回归方程:
(32.69425) ()
t =() ()
= F=
第二个模型回归的估计结果如下,
tttt
ttt
PCEBPDIBBPCE
PDIAAPCE
1321
21
ˆ tPC E PD I
2R
Dependent Variable: PCE
Method: Least Squares
Date: 07/27/05 Time: 21:51
Sample (adjusted): 1971 1987
Included observations: 17 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C
PDI
PCE(-1)
R-squared Mean dependent var
Adjusted R-squared . dependent var
. of regression Akaike info criterion
Sum squared resid Schwarz criterion
Log likelihood F-statistic
Durbin-Watson stat Prob(F-statistic)
回归方程:
() () ()
t = () () ()
= F=
2)从模型一得到 MPC=;从模型二得到,短期 MPC=,由于模型二为自回归模
型,要先转换为分布滞后模型才能得到长期边际消费倾向,我们可以从库伊克变换倒推得到
长期 MPC=
表 中给出了某地区 1980-2001 年固定资产投资 Y 与销售额 X 的资料。
表 某地区 1980-2001 年固定资产投资 Y 与销售额 X 的资料(单位:亿元)
年份 Y X 年份 Y X
1980 1991
1981 1992
1982 1993
1983 1994
1984 1995
1985 1996
1986 1997
1987 1998
1988 1999
1989 2000
1990 2001
运用局部调整假定或自适应预期假定估计以下模型参数,并解释模型的经济意义,探测
模型扰动项的一阶自相关性:
1
ˆ t tPCE PDI PCE
2R
1)设定模型
其中 为预期最佳值。
2)设定模型
其中 为预期最佳值。
3)设定模型
其中 为预期最佳值。
练习题 参考解答:
1)在局部调整假定下,先估计一阶自回归模型:
回归的估计结果如下,
Dependent Variable: Y
Method: Least Squares
Date: 25/02/10 Time: 22:42
Sample (adjusted): 1981 2001
Included observations: 21 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C
X
Y(-1)
R-squared Mean dependent var
Adjusted R-squared . dependent var
. of regression Akaike info criterion
Sum squared resid Schwarz criterion
Log likelihood F-statistic
Durbin-Watson stat Prob(F-statistic)
回归方程:
() () ()
t = () () ()
= F= DW=
ttt uXY
*
*
tY
tu
tt eXY
*
*
tY
ttt uXY
*
*
tX
* * * *
0 1 1t t t tY X Y u
^
t t tY X Y
2R
根据局部调整模型的参数关系,有
将上述估计结果代入得到:
故局部调整模型估计结果为:
经济意义:该地区销售额每增加 1 亿元,未来预期最佳新增固定资产投资为 亿元。
运用德宾 h 检验一阶自相关:
在显著性水平 上,查标准正态分布表得临界值 ,由于
,则接收原假设 ,说明自回归模型不存
在一阶自相关问题。
2)先对数变换模型,有
在局部调整假定下,先估计一阶自回归模型:
回归的估计结果如下,
Dependent Variable: LNY
Method: Least Squares
Date: 25/02/10 Time: 22:55
Sample (adjusted): 1981 2001
Included observations: 21 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C
LNX
LNY(-1)
R-squared Mean dependent var
Adjusted R-squared . dependent var
. of regression Akaike info criterion
Sum squared resid Schwarz criterion
Log likelihood F-statistic
Durbin-Watson stat Prob(F-statistic)
回归方程:
0
* * * *
0 1 , , 1 , t tu u
*
11 1
*
*
0
^
* tY X
* 2
1
1 21
(1 ) (1 )
2 1 ( ) 2 1-21
d n
h
nVar
2
2
h
*ln ln lnt t tY X u
* * * *
0 1 1ln ln lnt t t tY X Y u
^
1ln t t tY X Y
() () ()
t = () () ()
= F= DW1=
根据局部调整模型的参数关系,有 , ,
将上述估计结果代入得到:
故局部调整模型估计结果为: ,也即
经济意义:该地区销售额每增加 1%,未来预期最佳新增固定资产投资为 %。
运用德宾 h 检验一阶自相关:
在显著性水平 上,查标准正态分布表得临界值 ,由于
,则接收原假设 ,说明自回归模型不存在
一阶自相关。
3)在自适应预期假定下,先估计一阶自回归模型:
回归的估计结果如下,
Dependent Variable: Y
Method: Least Squares
Date: 25/02/10 Time: 22:42
Sample (adjusted): 1981 2001
Included observations: 21 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C
X
Y(-1)
R-squared Mean dependent var
Adjusted R-squared . dependent var
. of regression Akaike info criterion
Sum squared resid Schwarz criterion
Log likelihood F-statistic
0
*
1
*
1
*
0
*
tttt uYXY
2R
*ln ln *0
*
1 1
*
11 1
*ln
ln
*
0
^
*ln tY X
^
* tY X
* 2
1
21
(1 ) (1 )
2 1 ( ) 2 1 21
d n
h
nVar
2
2
h
Durbin-Watson stat Prob(F-statistic)
回归方程:
() () ()
t = () () ()
= F= DW=
根据局部调整模型的参数关系,有
将上述估计结果代入得到:
故局部调整模型估计结果为:
经济意义:该地区销售额每增加 1 亿元,未来预期最佳新增固定资产投资为 亿元。
运用德宾 h 检验一阶自相关:
在显著
性 水 平 上 , 查 标 准 正 态 分 布 表 得 临 界 值 , 由 于
,则接收原假设 ,说明自回归模型不存在一阶自相关。
利用表 的数据,取阿尔蒙多项式的次数 m=2,运用阿尔蒙多项式变换法估计
分布滞后模型:
练习题 参考解答:
分布滞后模型: s=4,取 m=2。
假 设 , , , ,
(*)
则模型可变为: ,其中:
0
^
t t tY X Y
2R
* * * *
0 1 1 t tu u
*
11 1
*
*
0
^
* tY X
* 2
1
1 21
(1 ) (1 )
2 1 ( ) 2 1-21
d n
h
nVar
2
2
h
0 1 1 2 2 3 3 4 4t t t t t t tY X X X X X u
0 1 1 4 4...t t t t tY X X X u
0 0 1 0 1 2 2 0 1 22 4 3 0 1 23 9
4 0 1 24 16
0 0 1 1 2 2t t t t tY Z Z Z u
估计的回归结果如下,
Dependent Variable: Y
Method: Least Squares
Date: 25/02/10 Time: 23:19
Sample (adjusted): 1984 2001
Included observations: 18 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C
Z0
Z1
Z2
R-squared Mean dependent var
Adjusted R-squared . dependent var
. of regression Akaike info criterion
Sum squared resid Schwarz criterion
Log likelihood F-statistic
Durbin-Watson stat Prob(F-statistic)
回归方程:
由(*)式可得,
由阿尔蒙多项式变换可得如下估计结果:
表 中给出了 1962-1995 年某地区基本建设新增固定资产 Y 和全省工业总产值
X 按当年价格计算的历史资料。
表 1962-1995 年某地区基本建设新增固定资产 Y 和全省工业总产值 X(单位:亿元)
年份 Y X 年份 Y X
1962 1979
0 1 2 3 4
1 1 2 3 4
2 1 2 3 4
2 3 4
4 9 16
t t t t t t
t t t t t
t t t t t
Z X X X X X
Z X X X X
Z X X X X
^
0 1 t tY Z Z Z
0 1 , , ,
0 1 2 3 , , , ,
^
1 2 3 t t t t tY X X X X X
1963 1980
1964 1981
1965 1982
1966 1983 16
1967 1984
1968 1985
1969 1986
1970 1987
1971 1988
1972 1989
1973 1990
1974 1991
1975 1992
1976 1993
1977 1994
1978 1995
(1) 设定模型 作局部调整假定,估计参数,并作解释。
(2) 设定模型 作自适应预期假定,估计参数,并作解释。
(3) 比较上述两种模型的设定及拟合情况,你觉得哪一个模型较好,为什么?
练习题 参考解答:
1)在局部调整假定下,先估计一阶自回归模型,
回归的估计结果如下,
Dependent Variable: Y
Method: Least Squares
Date: 07/27/05 Time: 22:31
Sample (adjusted): 1963 1995
Included observations: 33 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C
X
Y(-1)
R-squared Mean dependent var
Adjusted R-squared . dependent var
. of regression Akaike info criterion
Sum squared resid Schwarz criterion
Log likelihood F-statistic
Durbin-Watson stat Prob(F-statistic)
*
t t tY X
*
t t tY X
*
1
*
1
*
0
*
tttt uYXY
回归方程:
()() ()
t =()() ()
= F=
可以看出, 的回归系数显著,而 的回归系数不显著, 不是很高,模型整体上对样
本数据拟合一般。
根据局部调整模型的参数关系,有 ,将上述估计结果
代入得到:
故局部调整模型为:
经济意义:为了达到全省工业总产值的计划值,寻求一个未来预期新增固定资产的最佳量。
全省工业总产值每计划增加 1(亿元),则未来预期最佳新增固定资产量为 亿元。
2)在自适应预期假定下,先估计一阶自回归模型,
回归的估计结果如下,
Dependent Variable: Y
Method: Least Squares
Date: 07/27/05 Time: 22:31
Sample (adjusted): 1963 1995
Included observations: 33 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C
X
Y(-1)
R-squared Mean dependent var
Adjusted R-squared . dependent var
. of regression Akaike info criterion
Sum squared resid Schwarz criterion
Log likelihood F-statistic
Durbin-Watson stat Prob(F-statistic)
回归方程:
()() ()
t =()() ()
= F=
可以看出, 的回归系数显著,而 的回归系数不显著, 不是很高,模型整体上对样
^
t tY X Y
2R
tX 1tY
2R
* * * *
0 1, , 1 , t t
, ,
* t tY X
*
1
*
1
*
0
*
tttt uYXY
^
t tY X Y
2R
tX 1tY
2R
本数据拟合一般。
根据自适应模型的参数关系,有 ,代入得
到:
故局部调整模型为:
经济意义:新增固定资产的变化取决于全省工业总产值的预期值。全省工业总产值每预期增
加增加 1(亿元),当期新增固定资产量为 (亿元)。
3)局部调整模型和自适应模型的区别在于:局部调整模型是对应变量的局部调整而得到的;
而自适应模型是由解释变量的自适应过程而得到的。由回归结果可见,Y 滞后一期的回归系
数并不显著,说明两个模型的设定都不合理。
表 给出某地区各年末货币流通量 Y,社会商品零售额 X1、城乡居民储蓄余额
X 2 的数据。
表 某地区年末货币流通量、社会商品零售额、城乡居民储蓄余额数据(单位:亿元)
年份
年末货币
流通量 Y
社会商品零
售额 X1
城乡居民储
蓄余额 X2
年份
年末货币
流通量 Y
社会商品零
售额 X1
城乡居民
储蓄余额
X2
1953 10518 78676 4163 1970 38500 240332 26156
1954 14088 101433 4888 1971 47100 274534 30944
1955 13375 103989 5689 1972 57200 299197 35961
1956 18354 124525 7406 1973 60000 314006 39667
1957 16867 126467 9156 1974 62500 318954 43320
1958 18515 134446 10193 1975 64500 336015 46184
1959 22558 154961 13939 1976 68000 352924 48311
1960 29036 170370 15495 1977 63000 378115 53313
1961 41472 149182 12553 1978 66000 415830 61290
1962 34826 154564 10080 1979 76000 452032 70033
1963 30000 142548 11602 1980 85000 512543 92800
1964 24300 143415 15031 1981 90000 547956 109707
1965 29300 156998 17108 1982 101000 591088 133799
1966 33900 176387 19301 1983 100000 646427 164314
* * * *
0 1 1, , 1 , (1 )t t t
, ,
* t tY X u
1967 36100 178162 20485 1984 160000 733162 201199
1968 39600 167074 22572 1985 192000 919045 277185
利用表中数据设定模型:
其中, 为长期(或所需求的)货币流通量。试根据局部调整假设,作模型变换,估计并检验
参数,对参数经济意义做出解释。
练习题 参考解答:
1)在局部调整假定下,先估计一阶自回归模型:
回归的估计结果如下:
Dependent Variable: Y
Method: Least Squares
Date: 26/02/10 Time: 15:56
Sample (adjusted): 1954 1985
Included observations: 32 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C
X1
X2
Y(-1)
R-squared Mean dependent var
Adjusted R-squared . dependent var
. of regression Akaike info criterion
Sum squared resid +09 Schwarz criterion
Log likelihood F-statistic
Durbin-Watson stat Prob(F-statistic)
回归方程:
() () () ()
t = () () () ()
= F= DW=
根据局部调整模型的参数关系,有
将上述估计结果代入得到:
*
1 1 2 2t t t tY X X
* 1 2
1 2
t
t
u
t tY X X e
*
tY
* * * * *
0 1 1 2 2 1t t t t tY X X Y u
^
1 2 t t tY X X Y
2R
* * * *
0 0 1 1 2ln ln , , , 1
^
* * * *
0 1 1 2 2 1
ˆln ln ln ln lnt t t t tY Y X X Y
*
21 1
故局部调整模型估计结果为:
经济意义:在其他条件不变的情况下,该地区社会商品零售额每增加 1 亿元,则预期年末货
币流通量增加 亿元。同样,在其他条件不变的情况下,该地区城乡居民储蓄余额每
增加 1 亿元,则预期年末货币流通量增加 亿元。
2)先对数变换模型形式,
在局部调整假定下,先估计一阶自回归模型:
回归的估计结果如下:
Dependent Variable: LNY
Method: Least Squares
Date: 26/02/10 Time: 16:12
Sample (adjusted): 1954 1985
Included observations: 32 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C
LNX1
LNX2
LNY(-1)
R-squared Mean dependent var
Adjusted R-squared . dependent var
. of regression Akaike info criterion
Sum squared resid Schwarz criterion
Log likelihood F-statistic
Durbin-Watson stat Prob(F-statistic)
回归方程:
() () () ()
t = () () () ()
= F= DW=
根据局部调整模型的参数关系,有
将上述估计结果代入得到:
*
*
0
0
*
1
1
^
*
1 t tY X X
*
1 1 2 2ln ln ln lnt t t tY X X u
* * * * *
0 1 1 2 2 1ln ln ln lnt t t t tY X X Y u
^
1 2 1ln t t tY X X Y
2R
* * * *
0 0 1 1 2ln ln , , , 1
*
21 1
故局部调整模型估计结果为:
经济意义:货币需求对社会商品零售额的长期弹性为:;货币需求对城乡居民储蓄
余额的长期弹性为。
设
其中:M 为实际货币流通量, 为期望社会商品零售总额, 为期望储蓄总额,对于期望
值作如下假定:
其中 为期望系数,均为小于 1 的正数。
(1) 如何利用可观测的量来表示 ?
(2) 分析这样变换存在什么问题?
(3) 利用 题的数据进行回归,估计模型,并作检验。
练习题 参考解答:
1)首先将 M 滞后一期并乘上 得到
再将原始方程减去该方程,得到
*ln
ln
*
0
0
*
1
1
^
*
1 2ln t tY X X
* *
1 2t t t tM Y R
*Y *R
* *
1 1 1(1 )t t tY Y Y
*
2 2 1(1 )t t tR R R
1, 2
tM
1(1 )
* *
1 1 1 1 1 1 1 2 1 1(1 ) (1 ) (1 ) (1 )t t t tM Y R
* *
1 1 1 1 1 2 1 1 1 1
* *
1 1 1 2 2 2 1 1 1 1
* * *
1 1 1 2 2 1 1 2 1 1 1
* *
1 1 1 2 2 1
(1 ) [ (1 ) ] (1 )
[ (1 ) ] (1 )
[ (1 ) ( ) ] (1 )
[ (1 ) ]
t t t t t t t
t t t t t
t t t t t t
t t t
M M Y R R
Y R R
Y R R R
Y R R
*2 1 2 1 1 1
*
1 1 1 2 2 2 1 2 1 1 1
( ) (1 )
( ) (1 )
t t t
t t t t t
R
Y R R
(1)-(2) 于是 可表示为:
2)从上面的变化中可看出,随机扰动项变为 ,
这就可能导致出现随机扰动项的自相关,进而导致估计出来的结果是有偏的,而且不是一致
估计。
3)对( )回归的估计结果如下,
Dependent Variable: MT
Method: Least Squares
Date: 07/26/05 Time: 00:18
Sample(adjusted): 1955 1985
Included observations: 31 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C
Y
Y(-1)
R
R(-1)
MT(-1)
MT(-2)
R-squared Mean dependent var
Adjusted R-squared . dependent var
. of regression Akaike info criterion
Sum squared resid 1510162034 Schwarz criterion
Log likelihood F-statistic
Durbin-Watson stat Prob(F-statistic) 0
回归方程:
可以看到,只有 的回归系数在 10% 的显著性水平下是显著的,其他回归系数均不显著;
F 统计量较大,方程整体显著; 较高,模型整体上对样本数据拟合较好。
)2(])1()[1(
)1)(()1()1()1(
])1()[1(
)1()()1(
)1()1()()1(
2112
*
222121222111212
2112
211
*
22121221111211
11
*
12122211111
tt
ttt
tt
ttttttt
ttttttt
RRY
MM
RRYMM
RRYMM
tM
1 2 1 1 2 1 2 2 1 1 2 1 1
1 2 2 1 2 1 1 2 2
[ (1 ) ] [ ( 1) ] ( )
(1 )(1 ) (2 ) (1 )(1 )
t t t t t t
t t t t
M Y Y R R M
M
( )
*
1 2 1 1 2 2(2 ) (1 )(1 )t t t t
^
1 1 1 t t t t t tM Y Y R R M M
1tM
2R
考虑如下回归模型:
其中,y 为通货膨胀率,x 为生产设备使用率。
1) 生产设备使用率对通货膨胀率的短期影响和总的影响分别是多大?
2) 如果库伊克模型为 ,你怎样得到生产设备使用率对通货膨
胀率的短期影响和长期影响?
练习题 参考解答:
1)该模型为有限分布滞后模型,故生产设备使用率对通货膨胀的短期影响为 ,总的
影响为 +=。
2 ) 利 用 工 具 变 量 法 , 用 来 代 替 进 行 估 计 , 则 库 伊 克 模 型 变 换 为
。若原先有 ,则需估计的模型为
,所以生产设备使用率对通货膨胀的短期影响
为 ,总的影响为 。
表 中给出了某地区消费总额 Y 和货币收入总额 X 的年度资料。
表 某地区消费总额 Y(亿元)和货币收入总额 X(亿元)的年度资料(单位:亿元)
年份 X Y 年份 X Y
1975 1990
1976 1991
1977 1992
1978 1993
1979 1994
1980 1995
1981 1996
1982 1997
1983 1998
1984 1999
1985 2000
1986 2001
1
ˆ 3012
t t tY X X
t
2
( - 6. 27) ( 2. 6) ( 4. 26)
R
1 2 3 1t t t tY b b X b Y
1t̂Y 1tY
1 2 3 1
ˆ
t t t tY b b X b Y u 1 2 3 1ˆ ˆ ˆ ˆt t tY a a X a X
1 1 2 2 3 3 1ˆ ˆ ˆ( ) ( )t t t tY b a b a X b a X u
^
2 2ˆb a
^ ^
2 2 3 3ˆ ˆ( )b a b a
1987 2002
1988 2003
1989 2004
分析该地区消费同收入的关系
1) 做 关于 的回归,对回归结果进行分析判断;
2) 建立适当的分布滞后模型,用库伊克变换转换为库伊克模型后进行估计,并对估计
结果进行分析判断。
练习题 参考解答:
1)做 关于 的回归,回归的估计结果如下,
Dependent Variable: Y
Method: Least Squares
Date: 05/03/10 Time: 15:24
Sample: 1975 2004
Included observations: 30
Variable Coefficient Std. Error t-Statistic Prob.
C
X
R-squared Mean dependent var
Adjusted R-squared . dependent var
. of regression Akaike info criterion
Sum squared resid Schwarz criterion
Log likelihood F-statistic
Durbin-Watson stat Prob(F-statistic)
回归方程:
() ()
t =() ()
= F=
从回归结果来看,t 检验值、F 检验值及 都显著,但在显著性水平 上,DW 值
,说明模型扰动项存在正自相关,需对模型进行修改。
2)事实上,当年消费不仅受当年收入的影响,而且还受过去各年收入水平的影响,因此,
我们在上述模型中增添货币收入总额 X 的滞后变量进行分析。如前所述,对分布滞后模型
直接进行估计会存在自由度损失和多重共线性等问题。在此,选择库伊克模型进行回归分析,
即估计如下模型:
tY tX
tY tX
^
tY X
2R
2R
ldd
*
1
*
1
*
0
*
tttt uYXY
回归的估计结果如下,
Dependent Variable: Y
Method: Least Squares
Date: 05/03/10 Time: 15:31
Sample (adjusted): 1976 2004
Included observations: 29 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C
X
Y(-1)
R-squared Mean dependent var
Adjusted R-squared . dependent var
. of regression Akaike info criterion
Sum squared resid Schwarz criterion
Log likelihood F-statistic
Durbin-Watson stat Prob(F-statistic)
回归结果显示,t 检验值、F 检验值及 都显著,但
在显著性水平 上,查标准正态分布表得临界值 ,由于
,则拒绝原假设 ,说明自回归模型存在一阶自相关,需对模型作进一步修
改。
2R
2*
1
1 29
(1 ) (1 ) ˆ2 2 1 29 ( )
d n
h
nVar
2
h
2
h 0
第十一章
考虑以下凯恩斯收入决定模型:
其中,C=消费支出,I=投资指出,Y=收入,G=政府支出; 和 是前定变量。
(1)导出模型的简化型方程并判定上述方程中哪些是可识别的(恰好或过度)。
(2)你将用什么方法估计过度可识别方程和恰好可识别方程中的参数。
练习题 参考解答:
10 11 1
20 21 22 1 2
t t t
t t t t
t t t t
C Y u
I Y Y u
Y C I G
t
G
1t
Y
10 11 1 20 21 22 1 2
11 21 22 1 1 2
10 20 1 222
1
11 21 11 21 11 21 11 21
10 11 1 12 1
(1)
1
1 1 1 1
t t t t t t t t t t
t t t t t
t t
t t t
t t t
Y C I G Y u Y Y u G
Y Y Y G u u
u u
Y Y G
Y G v
10 20 1 222
10 11 1 1
11 21 11 21 11 21 11 21
10 11 21 11 10 20 11 22
1
11 21 11 21
11 1 211
1
11 21 11 21
10 10 21 11 20
1
1
( )
1 1 1 1
(1 ) ( )
1 1
( )
1 1
1
t t
t t t t
t
t t
t t
u u
C Y G u
Y
u u
G u
11 2 1 21 111 22 11
1
1 21 11 21 11 21 11 21
20 21 1 22 2
1 1 1
t t t
t t
t t t
u u u
Y G
Y G v
由模型的结构型,M=3,K=2。下面只对结构型模型中的第一个方程和第二个方程判断
其识别性。
首先,用阶条件判断。
第一个方程,已知 ,因为
所以该方程有可能为过度识别。
第二个方程,已知 ,因为
所以该方程有可能恰好识别。
第三个方程为定义式,故可不判断其识别性。
其次,用秩条件判断。写出结构型方程组的参数矩阵
对于第一个方程,划去该方程所在的行和该方程中非零系数所在的列,得
由上述矩阵可得到三个非零行列式,根据阶条件,该方程为过度识别。事实上,所得到的
矩阵的秩为 2,则表明该方程是可识别,再结合阶条件,所以该方程为过度识别。同理,可
判断第二个方程为恰好识别。
1 12, 0m k
1 12 0 2 1 2 1 1K k m
2 22, 1m k
2 22 1 1 1 2 1 1K k m
10 11
20 11 22
1 0 0 0
0 1 0
0 1 1 1 0 1
220 0
1 0
1 0 1
B
10 20 1 222
20 21 1
11 21 11 21 11 21 11 21
22 1 2
20 11 21 21 10 20 21 22 21
1
11 21 11 21 11 21
21 1 222
1
11 21 11 21
1
( )
1 1 1 1
(1 ) ( )
1 1 1
( )
1 1
t t
t t t
t t
t t
t t
t
u u
I Y G
Y u
Y G
u u
Y
2
20 20 11 20 21 10 21 20 21 22 21
1
11 21 11 21 11 21
21 1 2 11 222
1
11 21 11 21
30 31 1 32 3
1 1 1
1 1
t
t t
t t t
t
t t t
u
Y G
u u u
Y
Y G v
10 11 1 12 1
20 21 1 22 2
30 31 1 32 3
t t t t
t t t t
t t t t
Y Y G v
C Y G v
I Y G v
(2)根据上述判断的结果,第一个方程可用两段最小二乘法估计参数;第二个方程可
用间接最小二乘法估计参数。
考虑如下结果:
OLS: =
OLS: =
TSLS: =
TSLS: =
其中 、 、 和 分别是收益,价格,进口价格以及劳动生产力的百分率变化(所有百
分率变化,均相对于上一年而言),而 代表未填补的职位空缺率(相对于职工总人数的百
分率)。
试根据上述资料对“由于 OLS 和 TSLS 结果基本相同,故 TSLS 是无意义的。”这一说法
加以评论。
练习题 参考解答:
从两种方法估计的结果看,尽管系数的估计值非常接近,但不能说用 TSLS 方法估计得
到的估计值无意义。原因是用 TSLS 方法能保证参数的估计是一致的,而用 OLS 方法估计
得到的参数估计值在统计上是有偏且非一致。因此,从这个意义上说,运用 TSLS 方法得到
的参数估计值可靠、可信。
考虑如下的货币供求模型:
货币需求:
货币供给:
其中,M=货币,Y=收入,R=利率,P=价格, 为误差项;Y 、R 和 P 是前定变量。
(1) 需求函数可识别吗?
(2) 供给函数可识别吗?
(3) 你会用什么方法去估计可识别的方程中的参数?为什么?
10. 276 0. 258 0. 046 4. 959ˆ t tt tPW P V
2R
12. 693 0. 232 0. 544 0. 247 0. 064ˆ t t tt tW X M MP
2R
10. 272 0. 257 0. 046 4. 966ˆ t tt tPW P V
2R
12. 686 0. 233 0. 544 0. 246 0. 064ˆ t t tt tW X M MP
2R
t
W
t
P
t
M
t
X
t
V
tttt
d
t uPRYM 13210
tt
s
t uYM 210
tt uu 21 ,
(4) 假设我们把供给函数加以修改,多加进两个解释变量 和 ,会出现什么识
别问题?你还会用你在(3)中用的方法吗?为什么?
练习题 参考解答:
(1)首先,用阶条件判断如下:根据模型可知 ,对于需求函数,有
所以,该方程有可能是恰好识别。
其次,用秩条件判断。将结构型模型转化为简化型模型后,写出其系数的矩阵为
对于需求函数,划掉第一行和第一行里零所对应的非零元素以外的元素,得到一个非零元素,
即 1,按照秩条件原理,说明该方程为恰好识别。
(2)根据识别的原理,对于供给函数,运用阶条件有
所以,该方程有可能是过度识别。对于供给函数,按秩条件原理,可得三个非零元素,按照
秩条件的原理,说明该方程为过度识别。
(3)对于货币需求函数在过度识别的情况下,可考虑用间接最小二乘法估计参数;对
于货币供给函数为恰好识别的情况下,可考虑用两段最小二乘法估计参数。
(4)在货币供给函数里再引进变量 和 ,使得函数变为过度识别的情况,这时
对参数的估计就只能用两段最小二乘法。
考虑以下模型:
其中 (货币供给)是外生变量; 为利率, 为 GDP,它们为内生变量。
(1)请说出此模型的合理性。
(2)这些方程可识别吗?
假使把上述模型改变如下:
1t
Y 1tM
2, 3M K
1 13 3 1 1 1 0K k m
0 1 2 3
0 1
1 0
0 1 0 0
2 23 1 2 1 1 1 0K k m
1t
Y 1tM
0 1 2 1
0 1 2
t t t t
t t t
R M Y u
Y R u
t
M
t
R
t
Y
判断此方程组是否可识别,其中 为滞后内生变量。
练习题 参考解答:
(1)在上述第二个函数显然不正确,因为,按照经济学原理,GDP 应该受到投入要素
的影响,而不是货币的价值利率的影响。
(2)根据识别的意义,可知上述模型中第一个方程,包含了模型中的全体变量,所以
为不可识别;根据识别的阶条件,已知 ,对于第一个方程,有
则表明该方程为不可识别。
第二个方程除了 和 外,还有第一个方程没有包含的变量 ,所以该方程为可识别。
从而整个方程组为不可识别。
(3)将模型变为上述第二种形式,从结构的形式看与第一种情况一致,所以方程组的
识别情况没有变化,仍然为不可识别。
设我国的关于价格、消费、工资模型设定为
其中,I 为固定资产投资,W 为国有企业职工年平均工资,C 为居民消费水平指数,P 为价
格指数,C、P 均以上一年为 100%,样本数据见下表 。
表 样本数据
年份 全社会固
定资产投
资总额 I/
亿元
国有企业
在岗职工
平均工资
W/元
居民消费
水平指数
C
价格指数
P
1992 2930
1993 3593
1994 4708
1995 5663
1996 6269
0 1 2 3 1 1
0 1 2
t t t t t
t t t
R M Y Y u
Y R u
1tY
2, 1M K
1 11 1 0 1 2 1 1K k m
t
R
t
Y
t
M
ttttt
tttt
ttt
uCWIP
uWIC
uIW
34321
2321
121
1997 6647
1998 7644
1999 8350
2000 9324
2001 10619
2002 12109
2003 14028
2004 16336
2005 19069
2006 22246
2007 26284
其中C、P均是以上一年为 100。资料来源:国家统计局网站
(1)该方程组是否可识别?
(2)选用适当的方法估计模型的未知参数?。
练习题 参考解答:
(1)由于该方程组为递归模型,而递归模型并非真正意义下的联立方程组模型。因而
淡化它的识别性判断。事实上,该方程组模型中除第一个方程为恰好识别外,其余两个方
程均是不可识别。
(2)直接利用OLS进行估计,结果如下
表中给出了四川省宏观经济统计资料,试判断模型的识别性,再用 TSLS 法估计
如下宏观经济模型
其中, 分别表示消费,投资和收入; 分别表示收入的滞后一期,政府支
出和净出口。
表 四川省宏观经济统计资料 (单位:亿元)
年份 消费 C 投资 I 收入 Y 政府支出
G
净出口 X
1978
1979
ˆ tW I
ˆ t tC I W
ˆ t t tP I W C
ttttt
tttt
ttt
XGICY
uYYI
uYC
21210
110
ttt YIC ,, ttt XGY ,,1
1980
1981
1982
1983 311
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
资料来源:四川省统计局网站
练习题 参考解答:
(1)依题意,方程组中的内生变量个数 M=3,外生变量的个数为 K=3。根据阶条件,
对于第一个方程,有
K-k1=3-0>m1-1=2-1
所以,该方程可能为过度识别。
对于第二个方程,有
K-k2=3-1> m2-1=2-1
所以,该方程仍可能为过度识别。
第三个方程是定义方程,所以不需对其识别性进行判别。
将结构型模型转化为标准型,并写出其系数的矩阵形式
按照秩条件,对于第一个方程,可的如下矩阵
由此可得到三个非零二阶行列式,即表明该方程是过度识别。同理,对于第二个方程有
可得两个非零行列式,因此该方程也是过度识别。
(2)对于第一个方程运用 TSLS 估计得到
对于第二个方程运用 TSLS 估计得到
最后,得该问题的联立方程组模型为
其中, 和 分别为消费函数和投资函数中的残差。
0 1
0 1 2
1 0 0 0 0
0 1 0 0
0 1 1 1 0 1 1
21 0 0
1 0 1 1
1 0 0
1 1 1
ˆ tC Y
1
ˆ t tI Y Y
t tC Y e
1 t t tI Y Y e
t t t t tY C I G X
1te 2te