基于时间序列模型的 GDP 预测
摘 要
国内生产总值(GDP)是现代国民经济核算体系的核心指标,是衡量一个国家综合国
力的重要指标。国内生产总值(Gross Domestic Product)是指在一定时期内(一个季度或一
年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,它反映国家和
地区的经济发展及人民生活水平,常被公认为衡量国家经济状况的最佳指标。这个指标
把国民经济全部活动的产出成果概括在一个极为简明的统计数字之中,为评价和衡量国
家经济状况、经济增长趋势及社会财富的经济表现提供了一个最为综合的尺度。可以说,
它是影响经济生活乃至社会生活的最重要的经济指标。对其进行分析及时准确的预测具
有重要的理论与现实意义。
时间序列是指同一空间、不同时间某一现象的统计指标数值按时间先后顺序形成的
一组动态序列。时间序列预测方法则是通过时间序列的历史数据揭示现象随时间变化的
规律,将这种规律延伸到未来,从而对该现象的未来做出预测。传统的时间序列分析方
法在经济中的应用,主要是确定性的时间序列分析方法,包括指数平滑法、移动平均法、
时间序列的分解等等。随着社会的发展,许多不确定因素在经济生活中的影响越来越大,
必须引起人们的重视。1970 年,Box 和 Jenkins 提出了以随机理论为基础的时间序列分
析方法,使时间序列分析理论上升到了一个新的高度,预测的精度大大提高。时间序列
分析的基本模型有: 模型和 模型。
本文基于时间序列理论,以我国 1978 年至 2007 年三十年的国内生产总值为基础,
对数据进行平稳化处理、模型识别、参数估计,建立时间序列模型,并对模型进行检验,
确定较适合模型为自回归移动平均模型 。利用 模型对我国
2006—2007 年 GDP 作出预测并与实际值比较,结果表明相对误差均在 3%之内,预测
模型良好,继续利用 模型对我国未来 5 年的国内生产总值做出预测。
关键词:时间序列,国内生产总值, 模型, 模型
ARMA ARIMA
1,2,2ARIMA 1,2,2ARIMA
1,2,2ARIMA
ARMA ARIMA
Time Series Model for Forecasting GDP
ABSTRACT
Gross domestic product (GDP) is the modern heart of the System of National Accounts
indicators,is a measure of a country an important indicator of overall national
is defined as a certain period of time (one quarter or year),a country or region's economy in
the production of all final goods and services of value,it reflects the national and regional
economic development and people's living standards,a measure of a nation is often regarded
as the best indicator of economic indicator in all the activities of the national
economy's output results in a very concise summary of the statistics,and to evaluate and
measure the national economic situation,economic growth trends and the economic
performance of the wealth of society provides a most comprehensive scale,it can be said It is
the impact of economic life and social life as well as the most important economic indicators.
Analysis of timely and accurate forecasts of great theoretical and practical significance.
Time series refers to the same space at different times of the statistical indicators of a
phenomenon of the time sequence of values formed by a group of dynamic
predicting way of time series is achieved by exploring the laws that phenomenal change with
time,in the historical statistics of time series extend the laws to the future so as to
predict the future of a traditional analytical method of time series analysis
applied in economy is mainly the analytical method of time series in a fixed time,such as
Exponential Smoothing method,Moving Average method,Decomposition of the time series
and so the development of society,many uncertain elements impose influences on
economy,which should be attached importance to 1970,Box and Jenkins proposed
an analytical method of time series based on random theory which not only takes the theory of
time series analysis to a new level but also promotes the preciseness of basic
analytical models of time series are model and model.
Based on time series theory to China from 1978 to 2007 the gross domestic product of
three decades, based on the smooth of the data processing, model identification, parameter
estimation, establish a time series model, and model testing, to determine more suitable model
for autoregressive moving average model . Model of China's GDP forecast
for 2006-2007 and compared with the actual values, results showed that the relative error of
3%, the prediction model a good model to continue to forecast the gross domestic product of
China in the next 5 years.
KEY WORDS:Time series,Gross domestic product, model, model
ARMA ARIMA
1,2,2ARIMA
ARMA ARIMA
目 录
摘 要 ...........................................................................................................................................I
ABSTRACT...............................................................................................................................II
1 引言.........................................................................................................................................1
GDP 概述及其分析预测原因..........................................................................................1
时间序列分析法简述 ......................................................................................................2
本文的主要工作 ..............................................................................................................3
2 时间序列分析基本方法.........................................................................................................4
时间序列分析的预处理 ..................................................................................................4
差分运算...............................................................................................................4
平稳性检验...........................................................................................................4
时间序列基本模型 ..........................................................................................................6
自回归模型...........................................................................................................6
移动平均模型.......................................................................................................7
自回归滑动平均模型...........................................................................................7
ARIMA 模型建模步骤 ....................................................................................................8
数据平稳化处理...................................................................................................8
模型识别...............................................................................................................8
参数估计...............................................................................................................9
模型检验...............................................................................................................9
3 基于时间序列模型的 GDP 预测实例分析.........................................................................10
我国 GDP 时间序列分析 ..............................................................................................10
平稳性检查.........................................................................................................10
平稳化处理.........................................................................................................11
时间序列模型的建立 ....................................................................................................13
模型识别.............................................................................................................13
模型参数估计与建立.........................................................................................15
模型检验.............................................................................................................16
我国 GDP 短期预测及分析 ..........................................................................................18
结 论.........................................................................................................................................19
致 谢.........................................................................................................................................20
参 考 文 献.............................................................................................................................21
1 引言
GDP 概述及其分析预测原因
国内生产总值(Gross Domestic Product,简称 GDP)是指在一定时期内(一个季
度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常
被公认为衡量国家经济状况的最佳指标。它不但可反映一个国家的经济表现,更
可以反映一国的国力与财富。
一般来说,国内生产总值共有四个不同的组成部分,其中包括消费、私人投
资、政府支出和净出口额。用公式表示为: 。式中: 为消
费、 为私人投资、 为政府支出、 为净出口额。
一个国家或地区的经济究竟处于增长抑或衰退阶段,从这个数字的变化便可
以观察到。一般而言,GDP 公布的形式不外乎两种,以总额和百分比率为计算单
位。当 GDP 的增长数字处于正数时,即显示该地区经济处于扩张阶段;反之,如
果处于负数,即表示该地区的经济进入衰退时期了。国内生产总值是指一定时间
内所生产的商品与劳务的总量乘以“货币价格”或“市价”而得到的数字,即名义国
内生产总值,而名义国内生产总值增长率等于实际国内生产总值增长率与通货膨
胀率之和。因此,即使总产量没有增加,仅价格水平上升,名义国内生产总值仍
然是会上升的。在价格上涨的情况下,国内生产总值的上升只是一种假象,有实
质性影响的还是实际国内生产总值变化率,所以使用国内生产总值这个指标时,
还必须通过 GDP 缩减指数,对名义国内生产总值做出调整,从而精确地反映产出
的实际变动。因此,一个季度 GDP 缩减指数的增加,便足以表明当季的通货膨胀
状况。如果 GDP 缩减指数大幅度地增加,便会对经济产生负面影响,同时也是货
币供给紧缩、利率上升、进而外汇汇率上升的先兆。
一国的 GDP 大幅增长,反映出该国经济发展蓬勃,国民收入增加,消费能力
也随之增强。在这种情况下,该国中央银行将有可能提高利率,紧缩货币供应,
国家经济表现良好及利率的上升会增加该国货币的吸引力。反过来说,如果一国
的 GDP 出现负增长,显示该国经济处于衰退状态,消费能力减低时,该国中央银
行将可能减息以刺激经济再度增长,利率下降加上经济表现不振,该国货币的吸
引力也就随之而减低了。因此,一般来说,高经济增长率会推动本国货币汇率的
上涨,而低经济增长率则会造成该国货币汇率下跌。例如,1995-1999 年,美国 GDP
的年平均增长率为 %,而欧元区 11 国中除爱尔兰较高外(%),法、德、意等
主要国家的 GDP 增长率仅为 %、%和 %,大大低于美国的水平。这促使
欧元自 1999 年 1 月 1 日启动以来,对美元汇率一路下滑,在不到两年的时间里贬
GDP CA I CB X CA
I CB X
值了 30%。但实际上,经济增长率差异对汇率变动产生的影响是多方面的:
一是一国经济增长率高,意味着收入增加,国内需求水平提高,将增加该国的
进口,从而导致经常项目逆差,这样,会使本国货币汇率下跌。
二是如果该国经济是以出口导向的,经济增长是为了生产更多的出口产品,则
出口的增长会弥补进口的增加,减缓本国货币汇率下跌的压力。
三是一国经济增长率高,意味着劳动生产率提高很快,成本降低改善本国产品
的竞争地位而有利于增加出口,抑制进口,并且经济增长率高使得该国货币在外
汇市场上被看好,因而该国货币汇率会有上升的趋势。
在美国,国内生产总值由商务部负责分析统计,惯例是每季估计及统计一次。
每次在发表初步预估数据 (The Preliminary Estimates)后,还会有两次的修订公布
(The First Revision & The Final Revision),主要发表时间在每个月的第三个星期。
国内生产总值通常用来跟去年同期作比较,如有增加,就代表经济较快,有利其
货币升值;如减少,则表示经济放缓,其货币便有贬值的压力。以美国来说,国
内生产总值能有 3%的增长,便是理想水平,表明经济发展是健康的,高于此水平
表示有通货压力;低于 %的增长,就显示经济放缓和有步入衰退的迹象。
国内生产总值(GDP)是指一个国家或地区所有常住单位在一定时期内生产活动的
最终成果。这个指标把国民经济全部活动的产出成果概括在一个极为简明的统计数字之
中,为评价和衡量国家经济状况、经济增长趋势及社会财富的经济表现提供了一个最为
综合的尺度,可以说,它是影响经济生活乃至社会生活的最重要的经济指标。对其进行
的分析预测具有重要的理论与现实意义。
本文以我国为例,利用时间序列分析方法,建立我国 GDP 时间序列模型,分析经
济增长的内在特征。并对未来五年我国经济发展做出预测,为政府制定经济发展战略提
供依据。
时间序列分析法简述
客观现象都是处在不断发展变化之中,对现象发展变化的规律,不仅要从内部结构、
相互关联去认识,而且还应随时间演变的过程去研究,这就需要运用时间序列分析方法。
时间序列分析是一种广泛应用的数量分析方法,它主要用于描述和探索现象随时间发展
变化的数量规律。
时间序列分析(Time series analysis)是一种动态数据处理的统计方法。该方法基
于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用
于解决实际问题。它包括一般统计分析(如自相关分析,谱分析等),统计模型的建
立与推断,以及关于时间序列的最优预测、控制与滤波等内容。经典的统计分析
都假定数据序列具有独立性,而时间序列分析则侧重研究数据序列的互相依赖关
系。后者实际上是对离散指标的随机过程的统计分析,所以又可看作是随机过程
统计的一个组成部分。
时间序列是按时间顺序的一组数字序列。时间序列分析就是利用这组数列,
应用数理统计方法加以处理,以预测未来事物的发展。时间序列分析是定量预测
方法之一,它的基本原理:一是承认事物发展的延续性。应用过去数据,就能推
测事物的发展趋势。二是考虑到事物发展的随机性。任何事物发展都可能受偶然
因素影响,为此要利用统计分析中加权平均法对历史数据进行处理。该方法简单
易行,便于掌握,但准确性差,一般只适用于短期预测。时间序列预测一般反映
三种实际变化规律:趋势变化、周期性变化、随机性变化。
时间序列预测方法则是通过时间序列的历史数据揭示现象随时间变化的规律,将这
种规律延伸到未来,从而对该现象的未来做出预测。传统的时间序列分析方法在经济中
的应用,主要是确定性的时间序列分析方法,包括指数平滑法、滑动平均法、时间序列
的分解等等。随着社会的发展,许多不确定因素在经济生活中的影响越来越大,必须引
起人们的重视。1970 年,Box 和 Jenkins 提出了以随机理论为基础的时间序列分析方法,
使时间序列分析理论上升到了一个新的高度,预测的精度大大提高。
时间序列分析的基本模型有: 模型和 模型。时间序列分析预测法,首
先将预测目标的历史数据按照时间先后的顺序排列,然后分析它随时间的变化趋势及自
身的统计规律,外推得到预测目标的未来取值。它与回归分析预测法的最大区别在于:
该方法可以根据单个变量的取值对其自身的变动进行预测,无须添加任何的辅助信息。
本文的主要工作
从《中国统计年鉴 2008》中选取我国 1978 年 2007 年共 30 年的 GDP 作为数据,
运用时间序列分析的基本的分析方法随机时序分析,进行模型识别、参数估计和模型检
验,应用选定时间序列方法预测未来 GDP,并讨论此时间序列类型、误差的主要来源。
ARMA ARIMA
2 时间序列分析基本方法[1]
时间序列分析的预处理
差分运算
一阶差分
阶差分
步差分
差分方法是一种非常简便、有效的确定性信息提取方法,Cramer 分解定理在理论上
保证了适当阶数的差分一定可以充分提取确定性信息。差分运算的实质是使用自回归的
方式提取确定性信息:
差分方式的选择: 序列蕴含着显著的线性趋势,一阶差分就可以实现趋势平稳。
序列蕴含着曲线趋势,通常低阶(二阶或三阶)差分就可以提取出曲线趋势的影响。对
于蕴含着固定周期的序列进行步长为周期长度的差分运算,通常可以较好地提取周期信
息。
平稳性检验
平稳性是某些时间序列具有的一种统计特征。对于平稳的序列我们就可以运用已知
的时间序列模型对其进行分析预测。因此对数据进行平稳性检验是时间序列分析法的关
键步骤。平稳时间序列有两种定义,根据限制条件的严格程度,分为严平稳时间序列和
宽平稳时间序列。
对序列的平稳性有两种检验方法,一种是根据时序图和自相关图显示的特征做出判
断的图检验方法;一种是构造检验统计量进行假设检验的方法。通常我们都选用图检验
方法检验序列平稳性并用单位根统计检验法加以辅助。
(1) 自相关图法
自相关函数和偏自相关函数的定义:构成时间序列的每个序列值,
之间的简单相关关系称为自相关。自相关程度由自相关系数 度量,表示时间序列中相
隔 期的观测值之间的相关程度。
(2-1)
其中, 是样本量, 为滞后期, 代表样本数据的算术平均值。自相系数 的取
1t t tX X X
p 1 1 1
p p p
t t tX X X
k k t t kX X
0
1 1
id
dd i
t t d t i
i
X B X C X
1, , ,t t t kX X X L
kr
k
1
2
1
n k
t t k
t
k n
t
t
X X X X
r
X X
n k X kr
值范围是 并且 越小,自相关程度越高。偏自相关是指对于时间序列 ,在给定
的条件下, 与 之间的条件相关关系。其相关程度用偏自相关系
数 度量,有 。
(2-2)
其中 是滞后 期的自相关系数。
如果序列的自相关系数很快地(滞后阶数 大于 2 或 3 时)趋于 0,即落入随机区间,
时间序列是平稳的,反之时间序列是非平稳。若有更多的自相关系数落在随机区间以外,
即与零有显著不同,时间序列就是不平稳的。
自相关图法仅从直观的判断平稳时间序列与非平稳时间序列的区别。也可用以下的
方法在理论上检验。
(2) 单位根检验法
时间序列的平稳性还可以通过单位根检验来判断,单位根检验目前常用的两种方法
是 DF 和 ADF。DF 检验法是 Dickey 和 Fuller 在 70 年代和 80 年代的一系列文章中建立
的。其基本思想是:一阶回归模型 中, 时,序列 是平稳的。若 ,
则序列是非平稳的,存在单位根,通过检验 是否可能为 1,判断序列是否平稳序列。DF
检验的假设是 。
(a) DF 检验
序列有如下三种形式:
不包含常数项和线性时间趋势项
(2-3)
包含常数项
(2-4)
包含常数项和线性时间趋势项
(2-5)
其中, 。检验假设为:
序列存在单位根的零假设下,对参数 估计值进行显著性检验的 t 统计量不服从常
规的 t 分布,DF(Diekey&Fuller)于 1979 年给出了检验用的模拟的临界值,故称检验称
为 DF 检验。一般地,如果序列 在 0 均值上下波动,则应该选择不包含常数和时间趋
势项地检验方程,即(2-3)式;如果序列具有非 0 均值,但没有时间趋势,可选择(2-4)作
1,1 kr tX
1 2 1, , ,t t t kX X X tX t kX
kk 1 1kk
11 1
1
1,
1
1
,
1
, 1, 1, 1
, 2,3,
1
, 1, 2, , 1
k
k k i k i
i
kk k
i i i
i
k i k i kk k i
r
r r
k
r
i k
kr k
k
1t t tX X 1 tX 1
0 1H :
1t t tX X
1t t tX c X
1t t tX c t X
1r p
0 0H : 1 0H :
tY
为检验方程;序列随时间变化有上升或下降趋势,应采用(2-5)的形式。
(b) ADF 检验
在 DF 检验中,对于(2-3)式,常常因为序列存在高阶滞后相关而破坏了随机扰动项
是白噪声的假设,ADF 检验对此做了改进。它假定序列 服从 AR(P)过程。检验分程为
(2-6)
式中的参数 视具体情况而定,一般选择能保证 是白噪声的最小的 值。
与 DF 检验一样,ADF 检验也可以有包含常数项和同时含有常数和线性时间趋势项
两形,只需在(2-6)式右边加上 或 与 。
时间序列基本模型
随机时间序列分析模型分为三种类型:自回归模型(Auto-regressive model,AR)、移
动平均模型(Moving Average model,MA)和自回归移动平均模型(Auto-regressive Moving
Average model,ARMA)。
自回归模型
如果一个随机过程可表达为
其中 , 是自回归参数, 是白噪声过程,则称 为 阶自回归过程,
用 表示。 是由它的 个滞后变量的加权和以及 相加而成。
若用滞后算子表示
其中 称为特征多项式或自回归算子。
与自回归模型常联系在一起的是平稳性问题。对于自回归过程 ,如果其特征
方程:
的所有根的绝对值都大于 1,则 是一个平稳的随机过程。
过程中最常用的是 、 过程,
保持其平稳性的条件是特征方程
根的绝对值必须大于 1,满足| ,也就是: 。
t
tY
1 1 1 2 2 1 1t t t t p t p tX X X X X
p t p
c c t
1 1 2 2t t t p t p tX X X X
i 1,2, ,i p t tX p
AR p tX p t
21 21 Pp t t tL L L X L X
21 21 PpL L L L
AR p
21 2 1 21 1 1 1 0Pp PL L L L G L G L G L
AR p
AR p 1AR 2AR
1 1t t tX X
11 0L
11/ 1 1 1
移动平均模型
如果一个线性随机过程可用下式表达
其中 是回归参数, 为白噪声过程,则上式称为 阶移动平均过程,记为
。之所以称“移动平均”,是因为 是由 个 和 滞后项的加权和构造而成。
“移动”指 的变化,“平均”指加权和。
注意:(1)由定义知任何一个 阶移动平均过程都是由 个白噪声变量的加权
和组成,所以任何一个移动平均过程都是平稳的。(2)与移动平均过程相联系的一个重
要概念是可逆性。移动平均过程具有可逆性的条件是特征方程
的全部根的绝对值必须大于 1。
自回归滑动平均模型
由自回归和移动平均两部分共同构成的随机过程称为自回归移动平均过程,记为
, 其中 , 别表示自回归和移动平均部分的最大阶数。 的
一般表达式是
即
或
其中 和 分别表示 的 , 阶特征多项式。
表 2-1 模型特征
模型 自相关系数 偏自相关系数
拖尾 阶截尾
阶截尾 拖尾
拖尾 拖尾
ARIMA 模型建模步骤
1 1 2 2
2
1 21
t t t t q t q
q
q t t
X
L L L L
1 2, , , q t q
MA q tX 1q t t
t
q 1q
21 21 0qqL L L L
,ARMA p q p q ,ARMA p q
1 1 2 2 1 1 2 2t t t p t p t t t q t qX X X X
2 21 2 1 21 1P qp t q tL L L X L L L
t tL X L
L L L p q
ARMA
AR p p
MA q q
,ARMA p q
数据平稳化处理[2]
首先要对时间序列数据进行平稳性检验。可以通过时间序列的散点图或折线图对序
列进行初步的平稳性判断。一般采用 ADF 单位根检验来精确判断该序列的平稳性。对
非平稳的时间序列,我们可以先对数据进行取对数或进行差分处理,然后判断经处理后
序列的平稳性。重复以上过程,直至成为平稳序列。此时差分的次数即为
模型中的阶数 。从理论上而言,足够多次的差分运算可以充分地提取序列中的非平稳
确定性信息。但应当注意的是,差分运算的阶数并不是越多越好。因为差分运算是一种
对信息的提取、加工过程,每次差分都会有信息的损失,所以在实际应用中差分运算的
阶数要适当,应当避免过度差分,简称过差分的现象。一般差分次数不超过 2 次。
数据平稳化处理后, 模型即转化为 模型。
模型识别
我们引入自相关系数和偏自相关系数这两个统计量来识别 模型的系数
特点和模型的阶数。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可
断定序列适合 模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,
则可断定序列适合 模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则
序列适合 模型。自相关函数成周期规律的序列,可选用季节性乘积模型。自
相关函数规律复杂的序列,可能需要作非线性模型拟合。
在平稳时间序列自相关函数和偏自相关函数上初步识别 模型阶数 和 ,
然后利用 AIC 定则准确定阶。AIC 准则[3]:最小信息准则,同时给出 模型阶数
和参数的最佳估计,适用于样本数据较少的问题。目的是判断预测目标的发展过程与哪
一随机过程最为接近。因为只有当样本量足够大时,样本的自相关函数才非常接近母体
的自相关函数。具体运用时,在规定范围内使模型阶数从低到高,分别计算 AIC 值,最
后确定使其值最小的阶数是模型的合适阶数。关于 模型,AIC 函数定义如
下:
式中: 平稳序列为样本数, 为拟合残差平方和, , 为参数。
AIC 准则定阶方法可写为:
其中: , 为 模型阶数的上限值,一般取为根号 或 。实际应用中
, 一般不超过 2。
参数估计
, ,ARIMA p d q
d
, ,ARIMA p d q ,ARMA p q
,ARMA p q
AR
MA
ARMA
ARMA p q
ARMA
,ARMA p q
2log 2AIC n p q
n 2 p q
,
, min , 0 ,0
k l
AIC p q AIC k l k M l H
M N ARMA n /10n
p q
确定模型阶数后,应对 模型进行参数估计。本文采用最小二乘法 OLS 进行
参数估计,需要注意的是, 模型的参数估计相对困难,应尽量避免使用高阶的移动
平均模型或包含高阶移动平均项的 模型。
模型检验[4]
完成模型的识别与参数估计后,应对估计结果进行诊断与检验,以求发现所选用的
模型是否合适。若不合适,应该知道下一步作何种修改。这一阶段主要检验拟合的模型
是否合理。一是检验模型参数的估计值是否具有显著性;二是检验模型的残差序列是否
为 白 噪 声 。 参 数 估 计 值 的 显 著 性 检 验 是 通 过 t 检 验 完 成 的 Q 检 验 的 零 假 设 是
即模型的误差项是一个白噪声过程。Q 统计量定义为
近似服从 分布,其中 表示样本容量, 表示用残差序列计算的自相关系
数值, 表示自相关系数的个数, 表示模型自回归部分的最大滞后值, 表示移动平
均部分的最大滞后值。用残差序列计算 Q 统计量的值。显然若残差序列不是白噪声,残
差序列中必含有其他成份,自相关系数不等于零。则 值将很大,反之 值将很小。判
别规则是:
若 ,则接受 。
若 ,则拒绝 。
其中 表示检验水平。
3 基于时间序列模型的 GDP 预测实例分析
ARMA
MA
ARMA
0 1 2 kH : 2Q T T
2 k p q T kr
k p q
Q Q
2Q k p q 0H
2Q k p q 0H
国内生产总值(GDP)受经济基础、人口增长、资源、科技文化、环境、体制、发展
战略等诸多因素的影响,这些因素之间又有着错综复杂的关系,因此,运用结构性的因
果模型分析和预测 GDP 往往比较困难。将历年的 GDP 作为时间序列,根据过去的数据
得出其变化规律,建立预测模型,用此来预测未来的发展变化,有着重要的意义。
下面以我国 1978—2007 年国内生产总值数据(见表 3-1)为例,介绍用时间序列分析
法对数据分析的过程,并通过其预测 2006 及 2007 两年的国内生产总值与实际的国内生
产总值比较,选取最为合理的预测方法对未来 5 年我国 GDP 的做出预测。
表 3-1 我国 1978—2007 年国内生产总值[5](单位:亿元)
年份 GDP 年份 GDP 年份 GDP 年份 GDP 年份 GDP
1978 1984 1990 1996 2002
1979 1985 9016 1991 1997 78973 2003
1980 1986 1992 1998 2004
1981 1987 1993 1999 2005
1982 1988 1994 2000 2006
1983 1989 1995 2001 2007
我国 GDP 时间序列分析
在 模型中,时间序列是由一个零均值的平稳随机过程产生,即其过程的随机
性质具有时间上的不变性,在图形上表现为所有样本点都在某一水平线上下随机波动。
对于非平稳时间序列,需要预先对时间序列进行平稳化处理。
平稳性检查
首先我们绘制原始 GDP 的时间序列图, 从图 3-1 可以看出我国 GDP 具有很明显的
上升趋势,可以看出原始序列显然是非平稳的。进一步进行 ADF 单位根检验,从图 3-2
可以看出,检验未能通过,表明原始 GDP 序列是非平稳的。
为了能够对序列进行分析,要使其平稳化。故将选择两种方法:取对数法和差分法,
对序列进行平稳化处理,从而进一步分析预测。
ARMA
图 3-1 原始 GDP 时序图
图 3-2 原始 GDP 序列 ADF 检验
平稳化处理
先对我国 GDP 数据进行对数化处理,绘制 时序图 3-3:
图 3-3 时序图
Ln GDP
Ln GDP
图 3-4 时序 ADF 检验
显然对数处理后序列仍有明显上升趋势,且通过单位根检验后可知此序列非平稳,
通常低阶(二阶或三阶)差分就可以提取出曲线趋势的影响,我们对取对数后数据进行
一、二阶差分,并验证其平稳性:
图 3-5 一阶差分时序图
图 3-6 一阶差分 ADF 检验
检验结果表明 T 统计量均大于 1%、5%、10%下的检验值,且其 值大于 ,所
以我们可以认定差分后的序列是非平稳的[6]。故还要再次进行差分,二阶差分时序图如
图 3-7:
Ln GDP
Ln GDP
Ln GDP
p
图 3-7 二阶差分时序图
由该时序图我们基本可以认为其是平稳的,进一步做单位根检验:
图3-8 二阶差分ADF检验
检验结果显示,二阶差分序列在 1%的显著性水平下拒绝原假设,接受不存在单位
根的结论, 值显著小于 ,所以我们可以确定二阶差分后序列平稳。因此可以确定
序列是 2 阶单整序列[7],即 ~ 。
时间序列模型的建立
我们研究的序列为一元时间序列,建模的目的是利用其历史值和当前及过去的随机
误差项对该变量变化前景进行预测,通常假定不同时刻的随机误差项为统计独立且正态
分布的随机变量。对于时间序列预测,首先要找到与数据拟合最好的预测模型,所以阶
数的确定和参数的估计是预测的关键。
模型识别
模型的识别与定阶可以通过样本的自相关与偏自相关函数的观察获得。
二阶差分后自相关与偏自相关系数如图 3-9:
Ln GDP
Ln GDP
p
Ln GDP Ln GDP 2I
,ARMA p q
Ln GDP
图 3-9 Ln(GDP)二阶差分后自相关图
由图可以看出,二阶差分后序列的自相关系数在滞后二期后呈衰减趋于零,表现为
拖尾性;在偏自相关分析图中,滞后四期的偏自相关系数显著不为零,但之后逐渐衰减
趋于零,也可以认为序列的偏自相关系数也具有拖尾性,因此阶数 可由显著不为零的
偏自相关系数的数目决定[8],观察图可以取 1,也可以取 2。但为了检验所选模型是否合
适,我们可以采用 AIC 定则做最优模型识别:
表 3-2 AIC 定则模型识别定阶表
模型平稳检验
2 2 未通过
0 3 未通过
2 3 通过
1 2 通过
1 3 未通过
0 2 通过
0 1 通过
1 1 通过
2 1 通过
3 2 通过
2 0 通过
1 0 通过
3 1 通过
3 0 通过
由表 3-2 分析可知,在所有 模型中 最优, 次之,
故我们分别选择 和 模型进行参数估计。
p
p q AIC SC
,ARMA p q 2,3ARMA 1,2ARMA
2,2,3ARIMA 1,2,2ARIMA
模型参数估计与建立
下面分别对 和 模型进行参数估计:
图 3-10 模型参数估计
图 3-11 模型参数估计
图3-12及图3-10,3-11参数估计结果显示, 和 模型的滞
后多项式倒数根均落在单位圆内,满足过程的平稳要求[9]。因调整后的 值前
者较后者大,且 和 值前者较后者小,故选择 模型更合适。
2,2,3ARIMA 1,2,2ARIMA
2,2,3ARIMA
1,2,2ARIMA
2,2,3ARIMA 1,2,2ARIMA
2Adjusted R
AIC SC 2,2,3ARIMA
图3-12 和 滞后多项式倒数根的分布图
模型检验
首先画出 模型的残差序列图:
图 3-13 模型的残差图
对模型 做残差序列检验,残差相关系数如下:
图 3-14 模型残差序列检验
2,2,3ARIMA 1,2,2ARIMA
2,2,3ARIMA
2,2,3ARIMA
2,2,3ARIMA
2,2,3ARIMA
结果显示,检验统计量 Q 值均大于对应自由度卡方分布的检验值,且 Prob 列读出
拒 绝 原 假 设 的 概 率 很 小 , 均 小 于 , 所 以 残 差 序 列 为 非 白 噪 声 序 列 [10] , 即
模型检验未通过,故只好做出 模型的残差序列图进行检验,
残差相关系数如图 3-15,图 3-16:
图 3-15 模型的残差图
图 3-16 模型残差序列检验
结果显示,检验统计量 Q 值均小于对应自由度卡方分布的检验值,且 Prob 列读出
拒绝原假设的概率较大,均大于 ,所以残差序列为白噪声序列[10],即
模型通过检验,所以最终选择 模型对我国 GDP 进行分析预测。
因此,从图 3-11 模型参数估计可知, 模型为:
去掉差分形式可得模型为:
将对数形式指数化得最终模型为:
2,2,3ARIMA 1,2,2ARIMA
1,2,2ARIMA
1,2,2ARIMA
1,2,2ARIMA
1,2,2ARIMA
1,2,2ARIMA 1,2,2ARIMA
2 2 1 t tt tLn GDP Ln GDP
1 2
1 23
t t t
t t tt
Ln GDP Ln GDP Ln GDP
Ln GDP
1 21 2 t tt t tLn GDP Ln GDP Ln GDP
tGDP e
我国 GDP 短期预测及分析
我们利用 模型对 2006 年—2007 年 预测:
表 3-3 2006 年—2007 年 预测与实际值比较
年份 预测值(亿元) 实际值(亿元) 相对误差 MAE MAPE
2006 %
2007 %
由此可计算得到我国 2006 年—2007 年 GDP 值如下:
表 3-4 2006 年—2007 年 预测值与实际值比较
年份 预测值(亿元) 实际值(亿元) 相对误差
2006 %
2007 %
由上表可知,预测模型 MAE 和 MAPE 值均很小,表明预测模型较好[11],通过 2006
年—2007 年的数据验证,预测相对误差误差均小于 3%,预测效果良好。
因此,选择最 模型对我国未来 5 年的 GDP 作出预测:
表 3-5 2008 年—2012 年我国 预测值
年份 2008 2009 2010 2011 2012
Ln(GDP)(亿元)
GDP(亿元)
图 3-17 2008-2012 年我国 GDP 预测图
1,2,2ARIMA Ln GDP
Ln GDP
GDP
1,2,2ARIMA
GDP
结 论
本文使用时间序列分析的方法对我国国内生产总值的年度数据序列进行了随机性分
析,并运用 模型预测方法对我国的国内生产总值进行了小规模的预测。 通过模
型识别、比较以及检验,最终选定 模型:
对 2006—2007 年我国 GDP 作出预测并与实际值比较 :
年份 预测值(亿元) 实际值(亿元) 相对误差
2006 %
2007 %
此预测模型 MAE 和 MAPE 值均很小,且预测相对误差误差均小于 3%,预测效果
良好,故继续选择 模型对我国未来 5 年的 GDP 做出预测:
年份 2008 2009 2010 2011 2012
Ln(GDP)(亿元)
GDP(亿元)
从该论文随机性分析的方法对时间序列做出分析和预测的结果中可以看出,取对数
对数据进行处理,然后适当的差分,选择适当的较低的模型阶数,可取得较为理想的预
测结果。
由本文得到的较为满意的拟和结果可知时间序列短期预测精度是比较高的。由此可
见,时间序列预测法是一种重要的预测方法,其模型比较简单,对资料的要求比较单一,
只需变量本身的历史数据,在实际中有着广泛的适用性。在应用中,应该根据所要解决
的问题及问题的特点等方面因素来综合考虑并选择相对最优的模型。
当然国内生产总值是国民经济的核心内容,经济状况几乎要牵涉到经济体系中的所
有,如此复杂的过程并非靠简单的一个或多个变量来决定,权衡的因素繁多。因此,本
文还有许多不足之处,会在以后的学习工作中将其不断完善。
ARIMA
1,2,2ARIMA
1 21 2 t tt t tLn GDP Ln GDP Ln GDP
tGDP e
1,2,2ARIMA
致 谢
谨向我的指导老师肖鹏老师表示衷心的感谢。感谢肖老师在过去的四年中,在我完
成学业和毕业论文的写作过程中,对我的悉心指导和帮助;在生活上,对我的关心和照
顾。当我遇到困难的时候,肖老师总是热心帮助,给我支持和鼓励。我被肖老师诚恳的
待人方式,广博扎实的专业知识,严谨的治学态度,富有启发的思维方式,孜孜不倦的
诲人态度,非凡的人格魅力所折服,使我受益匪浅,令我终生难忘。再次向肖老师深表
谢意!衷心感谢理学院全体老师在我学习道路上对我的培养。难忘各位老师的辛勤付出
和鼓励支持,再次表示感谢。
感谢在我的学习和生活中曾帮助和关心过我的所有数学 05 级的各位同学!
最诚挚地感谢所有辛勤审评的老师和对此文提出宝贵建议的老师和同学们!
参 考 文 献
[1]王燕.应用时间序列分析[M].北京:中国人民大学出版社,2005:1-239.
[2]张树京,齐立心.时间序列分析简明教程[M].北京:清华大学出版社,2003:5-15.
[3]徐国祥.统计预测和决策(第二版)[M].上海:上海财经大学出版社,2005:
148-149.
[4]易丹辉.统计预测 2 方法与应用[M].北京:中国统计出版社,2001:177- 251.
[5]中国统计年鉴 2008,
[6]赵蕾.ARIMA 模型在福建省 GDP 预测中的应用[J],科技和产业,2007.
[7]吴怀宇.时间序列分析与综合[M].武汉大学出版社. 2004:10-98.
[8]易丹辉.数据分析与 Eviews 应用 [M].北京:中国人民大学出版社,2006:
119-127.
[9]张晓峒.EViews 使用指南与案例[M].北京:机械工业出版社,2007:78-89.
[10]武文婕.ARIMA 模型在 GDP 预测中的应用[J].中国科技信息,2007.
[11]高铁梅.计量经济分析方法与建模:EViews 应用及实例[M].北京:清华大学出版
社,2006:85-88.