- 1 -
关于陕西省 GDP 影响因素的主成分分析
胡啸兵
西安交通大学经济与金融学院, 西安(710061)
摘 要:本文通过考察和修正 GDP 影响因素模型,对陕西省 GDP 影响因素进行主成分分析后,
得出综合经济发展指标 F, 并进一步在 F的内在构成和其对省 GDP 的拟合回归分析后,认为
产业机构和国民经济支出法核算体系各指标变量对省 GDP 的影响比较均衡,由此给出了具有
现实意义的政策读解和建议。
关键词:陕西省;GDP; 主成分分析
1. 引言
国内生产总值(Gross Domestic Product)是指一定时期(一般为一年)内一个地区或国家
所有经济活动所产生的最终产品的价值总和,是一个地区或国家宏观经济发展的重要度量指
标和经济实力的重要体现,在国民经济核算体系中以支出法计算一般包括投资、消费、财政
支出、净出口以及一个误差项。由于经济发展阶段与产业结构密切相关,GDP 的实际发展
状况在一定程度上也必然受各产业发展的影响,尤其对中国西部地区重要的经济发展重镇和
国家西部大开发战略中的关键省份之一并且正处在经济起飞和转型期的陕西省更是如此。陕
西省的经济发展状况、道路和前途对整个中国顺利完成“十一五规划”任务,继而最终建成全
面小康社会具有不可低估的重要意义。自然的,通过探寻和分析陕西省经济发展的宏观历史
数据,从而发现影响其国内生产总值的核心因素,再据此提出针对性的政策作为建议,就是
十分必要的。
本着此种目的,本文将在对国民经济宏观经济模型理论分析基础上,攫取陕西省经济
发展指标的相关宏观历史数据,对其进行主成分分析,在此基础上对陕西省经济发展的主要
推动因素进行刻画,并据此提出有针对性的政策建议。
2. 文献综述
关于陕西省经济发展的主成分分析文献为数众多,比如王海波(2008)通过对 13 个具
有代表性的经济指标利用主成分分析法研究发现1990—2006年间西安一枝独秀,关中其它地
区为陕西省经济发展的优势区域;陕北地区经济增长快速,综合经济实力位次不断上升;陕南
地区经济综合实力一直很弱。孙妍(2008)运用主成分分析,以陕西为例构建指标体系进行
综合经济发展力的省际比较,得出陕西在资源禀赋上的弱势地位与在现代化程度上的先进程
度并存的悖论状态,并揭示了陕西在引资和技术输入中的巨大潜力。韩申山等运用主成分分
析对陕西省 1981-2005 年的经济发展水平和城乡统筹水平进行了有效刻画和解释。 ]31[ −
然而总体来看,大多都是对陕西省经济发展的一个侧面或局部进行的时段刻画,而对陕
西省建国以来比较全面的纵向宏观整体经济发展主成分分析基本是一个盲区。本文要做的工
作就是在此方面做一番尝试性探索。
3. 宏观经济模型说明
由新古典经济学的宏观经济理论可知一个地区的国内生产总值是受投资、消费、财政收
支和净出口的影响,具体刻画如下:
- 2 -
NXGCIGDP +++= (1)
其中 I 为投资,C 为消费,G 为财政净支出,NX 为净出口。
这是国内生产总值按支出法衡量的基本恒等式。 ]4[
鉴于产业结构组成对转型经济体经济发展的巨大影响力,我们可在上式中引入产业结构
相关变量(在下文讨论中以一二三各产业年度产值为代表),进行计量建模,其基本方程式
如下:
ξ+++++= IntStrucNXGCIGDP (2)
注:IntStruc 表示产业结构对 GDP 的影响, ξ 表示随机扰动项。
以下分析中的指标选取都是基于此种基本计量模型进行的,以期在各个指标中发现对反
映经济发展总体水平和状况的 GDP 影响较大的主要因素,继而对陕西省经济发展在此基础
上提供一些政策建议。
4. 研究方法
本文首先对陕西省宏观经济运行各相关选取变量进行主成分分析,在主成分分析的基础
上选取主要影响因子对 GDP 进行回归模型的刻画。在此基础上结合宏观经济学基本政策理
论对现实政策作为做出建议。
主成分分析(Principal Component Analysis)是一种描述存在多重共线性的几个数值变
量之间关系的多元分析技术,最早由 Pearson 于 1901 年提出,是对原始指标相互关系分析
综合后在保留必要的原始信息的前提下,以互不相关的、较少个数的综合指标(主成分)来
反映原始指标所提供的信息,以达到对被解释的进行更为突出而明了的因素刻画的技术。
主成分分析的数学模型详细刻画如下:用数据矩阵 X 的 p 个指标向量做线性组合,即
综合指标向量为:
{
pppppp
pp
pp
xaxaxaF
xaxaxaF
xaxF
+++=
+++=
+++=
...
...
...xaa
2211
22221122
12211111
(3)
上述方程组要求方程组每单个方程的各系数平方和为 1,且各个 F 分量不相关,且其方
差随其下标序号的增大依次取阶段最大方差。 ]5[
5. 数据来源
本文数据均取自由清华大学朱世武教授创建的锐思金融数据平台()。
本文数据为年度数据,提取时间区间为 1952-2004 年,提取的原始指标除被解释变量陕
西省年度 GDP 外,主要有第一产业_GDP、第二产业_GDP、第三产业_GDP、人均国内生产
总值_GDP、居民消费、政府消费、资本形成总额(绝对值)和货物和服务净出口(绝对值)。
6. 实证分析
本文实证分析平台为 统计软件。 ]76[ −
(1) 除陕西省年度 GDP 以外的各指标的基本统计特征如下:
- 3 -
表 1 基本统计量表
GDPpri GDPsec GDPter GDPpc Hhce
Mean
StD
Govce Gcf Nexgs
Mean
StD
注:除 GDPpc 单位为元外,其余指标单位均为亿元
(2) 对除陕西省年度 GDP 以外的各指标进行标准化,并求解其相关系数矩阵,如下表 2 所
示:
由相关系数矩阵可以看出,各指标变量之间存在严重的线性相关性,所以满足了主成分分析
的有关使用条件。
表 2 相关系数矩阵
GDPpri GDPsec GDPter GDPpc Hhce Govce Gcf Nexg
第一产业_GDPpri
第二产业_GDPsec
第三产业_GDPter
人均国内生产总值_GDPpc
居民消费_Hhce
政府消费_Govce
资本形成总额(绝对值)_Gcf
货物和服务净出口(绝对值) 9524
_Nexgs-.
(3) 对相关系数矩阵求取特征值,如表 3:
表 3 相关系数矩阵特征值表
Eigenvalue Difference Proportion Cumulative
1
2
3
由表可见,第一个特征值的累积贡献率已达 ,而其余特征值贡献率较之第一个特征值
的贡献率来说基本可以忽略。所以取其对应的单位特征向量(模为 1)如下:
第一特征值对应单位特征向量
Prin1
第一产业_GDPpri
第二产业_GDPsec
第三产业_GDPter
人均国内生产总值_GDPpc
居民消费_Hhce
政府消费_Govce
资本形成总额(绝对值)_Gcf
- 4 -
货物和服务净出口(绝对值)_Nexgs
则主成分变量 F 的表达式可以由个原始指标的线性组合给出,如下式:
NexgsGcfvceGHhceGDPGDPGDPGDPF PCTERSECPRI −++++++=
(4)
由上式各系数可见,各原始指标变量对主成分的贡献作用是基本均衡的,我们可以将此成分
变量取名为经济发展综合指标变量 F, 其在方差上其以 %的贡献率概括了所有所讨论
的相关原始变量的方差变动。
(4) 对年度 GDP 的各原始指标变量的线性回归结果如下:
表 4 年度 GDP 的各原始指标变量的线性回归结果
Root MSE R-Square
Dependent Mean 43659 Adj R-Sq
Coeff Var
Parameter Estimates
Parameter Standard
Variable Label DF Estimate Error t Value Pr > |t|
Intercept Intercept 1
GDPpri 第一产业_GDPpri 1
GDPsec 第二产业_GDPsec 1
GDPter 第三产业_GDPter 1
GDPpc 人均国内生产总值_GDPpc 1
Hhce 居民消费_Hhce 1
Govce 政府消费_Govce 1
Gcf 资本形成总额(绝对值)_Gcf 1
Nexgs 货物和服务净出口(绝对值)_Nexgs 1
可见,R-Square =,总体拟合很好,而各个 t Value 都不是很显著,印证了各个解释变量
之间的多重共线性,从而也说明了运用主成分分析的必要性。
(5) 据陕西省年度 GDP 对主成分 F 进行线性回归,结果如表 5,可见可决系数 ,各
变量的 t 统计量和 P-value 均较为显著(在显著水平为 10%时)。
表 5 陕西省年度 GDP 对主成分 F 的线性回归
Variable Coefficient Std. Error t-Statistic Prob.
C
Q
R-squared Mean dependent var
Adjusted R-squared . dependent var
. of regression Akaike info criterion
Sum squared resid +08 Schwarz criterion
Log likelihood F-statistic
Durbin-Watson stat Prob(F-statistic)
- 5 -
7. 结论及政策建议
由以上实证分析可见,对陕西省年度 GDP 的各原始解释指标变量之间存在高度多重共
线性,将之进行主成分分析后综合为一个经济发展综合指标变量 F,对原始变量的方差解释
力为 %,该指标 F 对陕西省年度 GDP 的回归结果较为理想。而 F 的构成中各个原始指
标的贡献由上文特征向量给出,可见除进出口项为负值外,其余皆为正,而且在数值上相当
均衡。这就表明原始变量(通过 F)对年度 GDP 都具有一定的解释力,可以认为本文第 3
部分中的模型设定在通过剔除原始指标的多重共线性后还是基本合理的,即就是针对陕西省
个案而言,国民经济支出法核算体系中的各主要指标设定是合理的,而且本文引入的产业结
构(具体一、二、三产业的规模)对 GDP 水平及方差变动也具有同等的影响。
由此可以得出:对陕西省而言,投资、消费、财政支出、净出口和各产业规模,对 GDP
的规模影响(通过经济发展综合指标变量 F 显示出来)是比较均衡的,所以在具体政策上,
比较理智的做法就是对这几个方面采取措施要均衡,不可偏废某一些方面而过多倚重另一些
方面,这样才能充分发挥各经济刺激手段,推动经济的快速健康发展,这在目前金融海啸余
威未尽经济有待恢复的特定时间背景下,无疑是具有强烈现实意义的。而且在产业结构上各
产业规模综合考察期来看也显示了一定程度的对经济发展的比较均衡的影响,这也说明了陕
西实际上所处的发展阶段还只是工业化初级阶段,还不是处在比较高级的产业结构发展水平
上,政策作为上就要因势利导,积极采取强有力措施,推进产业结构调整和升级。
参考文献
[1] 王海波. 陕西省区域经济差异与协调发展研究[D]. 西北大学硕士学位论文.
[2] 孙 妍. 综合经济发展力的省际比较——以陕西为例[J]. 改革与战略 ,2008
[3] 韩申山,王建兴,邢娟,何伟. 陕西省经济发展与城乡统筹关系实证分析[J]. 地理与地理信息科学.2008 年 9 月
[4] 杰弗里.萨克斯等著,费方域译. 全球视角的宏观经济学[M]. 上海三联书店,上海人民出版社. 2004
[5] 严明义. 多元统计分析方法课件[M]. 西安交通大学经济与金融学院. 2009
[6] 阮桂海. SAS 统计分析大全[M]. 清华大学出版社. 2003
[7] William H. Greene. Econometric Analysis[M]. 1990.
A Principal Component Analysis on Factors contributing to
GDP Growth of Shaanxi Province
Hu Xiaobing
(The School of Ecomomics&Finance of Xi’an Jiaotong University, Xi’an, the .,710061)
Abstract
This paper is centered on studying and modifying the GDP macroeconomic model by the method of
principal component analysis and thereupon reaches the conclusion that the comprehensive factor F
gained in principal component analysis can well explain the variance of GDP of Shaanxi province and
minimize the effect of multilinearality of original factors in accounting and modeling of GDP while the
introduction of industrial structure and scale can also contribute to GDP growth in terms of scale and
some policy suggestions are produced at the last to deepen the discussion above.
Keywords: Shaanxi Province; GDP; Principal Compoment Analysis
作者简介:胡啸兵(1981-),男,陕西蓝田人,西安交通大学金融学硕士研究生,研究方
向包括金融信息化、 计算金融、 金融市场分析等。