第三章 多元线性回归模型习题与答案
1、极大似然估计法的基本思想
2、多元线性回归模型的基本假设是什么?试说明在证明最小二乘估计量的无偏性和有效性的过程中,哪些基本假设起了作用?
3、以企业研发支出(R&D)占销售额的比重为被解释变量(Y),以企业销售额(X1)与利润占销售额的比重(X2)为解释变量,一个有32容量的样本企业的估计结果如下:
其中括号中为系数估计值的标准差。
(1)解释log(X1)的系数。如果X1增加10%,估计Y会变化多少个百分点?这在经济上是一个很大的影响吗?
(2)针对R&D强度随销售额的增加而提高这一备择假设,检验它不虽X1而变化的假设。分别在5%和10%的显著性水平上进行这个检验。
(3)利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响?
4、1960-1982年美国对子鸡的需求。为了研究美国每人的子鸡消费量,我们提供如下的数据:
表1 1960-1982年子鸡的消费情况
年份
Y
X2
X3
X4
X5
X6
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
资料来源:Y数据来自城市数据库;X数据来自美国农业部。
注:实际价格是用食品的消费者价格指数去除名义价格得到的。
其中Y=每人的子鸡消费量,磅
X2=每人实际可支配收入,美元
X3=子鸡每磅实际零售价格,美分
X4=猪肉每磅实际零售价格,美分
X5=牛肉每磅实际零售价格,美分
X6=子鸡替代品每磅综合实际价格,美分。这是猪肉和牛肉每磅实际零售价格的加权平均。
其权数是在猪肉和牛肉的总消费量中两者各占的相对消费量。
现考虑下面的需求函数:
lnYt=α1+α2 lnX2t +α3lnX3t+ut
lnYt=r1+r2 lnX2t+r3lnX3t+r4lnX4t+ut
lnYt=λ1+λ2 lnX2t+λ3lnX3t+λ4lnX5t+ut
lnYt=θ1+θ2 lnX2t+θ3lnX3t+θ4lnX4t+θ5lnX5t +ut
lnYt=β1+β2 lnX2t+β3lnX3t+β4lnX6t+ut
由微观经济学得知,对一种商品的需求通常较依赖消费者的实际收入,该商品的实际价格,以及互替和互补商品的实际价格。按照这些思考,回答以下问题。
(1)从这里列举的需求函数中你会选择哪一个并且为什么?
(2)你怎么理解这些模型中的lnX2和lnX3的系数?
(3)模型的设定(2)和(4)有什么不同
(4)如果你采用设定4,你会见到什么问题:(提示:猪肉和牛肉价格都同子鸡价格一道被引进)
(5)因为设定(5)中含有牛肉和猪肉的综合价格,你会认为需求函数5优于函数4?为什么?
(6)猪肉和(或)牛肉是子鸡的竞争或替代产品吗?你怎样知道?
(7)假定函数5是“正确的需求函数。估计此模型的参数。”算出它们的标准误,以及R 2 , 和修正的R 2 解释你的结果
(8)现假设你选那个了“不正确”的模型2,通过考虑和值分别同和 的关系,来评估这一错误设定的后果。
5、某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为:
其中,Y为劳动力受教育年数, 为该劳动力家庭中兄弟姐妹的人数,分别为母亲与父亲受教育的年数,问:是否具有预期的影响?为什么?和 保持不变,为了使预测的受教育水平减少一年,需要增加多少?
(2)请对的系数给予适当的解释。
(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另一个的父母受教育的年数为16年,则两人受教育的年数预期相差多少?
6、下表列出了某地区家庭人均鸡肉年消费量Y与家庭月均收入X,鸡肉价格(元/千克),猪肉价格(元/千克)与牛肉价格(元/千克)的相关数据。
表2 某地区家庭消费肉类情况表
年份
Y/千克
X/元
1980
397
1981
413
1982
439
1983
459
1984
492
1985
528
1986
560
1987
624
1988
666
1989
717
7
1990
768
1991
843
1992
911
1993
931
1994
1021
1995
1165
1996
1349
1997
1449
1998
1575
1999
1759
2000
1994
2001
2258
2002
2478
求出该地区关于家庭鸡肉消费需求的如下模型:
请分析鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。
答案:
1、在极大似然估计中,假定样本是固定的,n个观测值都是独立观测的,这个样本可以有各种不同的总体生成,而每个总体都有自己的参数。那么在可供选择的总体中,哪个总体最可能生成所观测到的n个样本值?为此,需要估计每个可能总体取得这n个观测值联合概率,选择其参数能使观测样本值的联合概率最大的那个总体。
2、多元线性回归模型的基本假设仍然是针对随机干扰项与针对解释变量两大类的假设。针对随机干扰项的假设有:零均值,同方差,无序列相关且服从正态分布。针对解释变量的假设有:解释变量应具有非随机性,如果是随机的,则不能与随机干扰项相关,各解释变量之间不存在(完全)线性相关关系。
在证明最小二乘估计量的无偏性中,利用了解释变量非随机或与随机干扰项不相关的假定;在有效性的证明中,利用了随机干扰项同方差且无序列相关的假定。
3、(1)log(x1)的系数表明在其他条件不变时,log(x1)变化1个单位,Y变化的单位数,即(Y=(log(X1)(((X1/X1)=(100%,换言之,当企业销售X1增长100%时,企业研发支出占销售额的比重Y会增加个百分点。由此,如果X1增加10%,Y会增加个百分点。这在经济上不是一个较大的影响。
(2)针对备择假设H1:,检验原假设H0:。易知计算的t统计量的值为t= 分布的临界值为(单侧),计算的t值小于该临界值,所以不拒绝原假设。意味着R&D强度不随销售额的增加而变化。在10%的显著性水平下,t分布的临界值为,计算的t 值小于该值,拒绝原假设,意味着R&D强度随销售额的增加而增加。
(3)对X2,参数估计值的t统计值为
4、(1)模型五,它包含了所有的经济上相关的变量,而模型四中会产生多重共线性问题,而其他的模型包含的信息不够。
(2)前者是收入弹性系数,后者是价格弹性系数。
(3)模型(2)仅把猪肉作为替代品,模型(4)则把猪肉和牛肉都作为替代品。
(4)多重共线性问题。
(5)是的,多重共线性问题得到消除。
(6)作为一种食物,它们同子鸡相互竞争或替代。
系数值
标准差
t值
R2
(7)
其中交叉价格弹性相关系数统计上与零无异,P=。
(8)估计值可能是有偏的。
5、(1)预期对劳动者受教育的年数有影响。因为在收入及支出预算约束一定的条件下,子女越多的家庭,每个孩子接受教育的时间会越短。根据多元回归模型偏回归系数的含义,前的参数估计值表明,在 其他条件不变的情况下,每增加1个兄弟姐妹,受教育年数会减少年, 因此,要减少1年受教育的时间,兄弟姐妹需增加约11个。
(2) 的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时,母亲每增加1年受教育的机会,其子女作为劳动者就会预期增加年的受教育机会。
(3)首先计算两人受教育的年数分别为
++=
++=
因此,两人的受教育年限的差别为: —=
6、(1)用EViews软件做回归,有如下的回归方程:
() () () () ()
F= RSS=
(2)猪肉的价格与牛肉的价格是否对鸡肉的消费需求有影响可用假设检验的方法。
,对Y关于X,做回归取得如下的回归方程:
() () ()
F= RSS=
为了检验原假设,求F统计量:F=
在5%的显著性水平下,自由度为(2,18)的F分布的临界值为,因此,没有理由拒绝原假设,即该地区猪肉与牛肉的价格确实对家庭的鸡肉消费需求不产生显著影响。