统计学 第十一章 时间序列分析
目 录
2第十一章 时间序列分析
3第一节 时间序列的有关概念
3一、时间序列的构成因素
4二、时间序列的数学模型
4第二节 时间序列的因素分析
4一、图形描述
5二、长期趋势分析
8三、季节变动分析
12四、循环波动分析
14第三节 随机时间序列分析
14一、平稳随机过程概述
15二、ARMA模型的识别
19三、模型参数的估计
21英文摘要与关键词
21习 题
第十一章 时间序列分析
通过本章的学习,我们应该知道:
时间序列的数学模型及含义
如何进行长期趋势分析
如何进行季节变动分析
如何进行循环变动分析
ARMA模型的识别与参数估计
时间序列分析是一种广泛应用的数量分析方法,主要用于描述和探索现象随时间发展变化的数量规律性。时间序列分析通常分传统的时间序列分析与现代的时间序列分析两种,前者研究各种时间序列因素分解以及长期趋势、季节变动、循环变动三要素的分析;后者则主要研究AR模型、MA模型和ARMA模型。
第一节 时间序列的有关概念
任何事物都处于不断的运动和发展变化中,为探索现象发展变化的规律性,我们需要观察现象随时间变化的数量特征。我们把某种现象发展变化的指标数值按一定时间顺序将排列起来形成的数列,称为时间序列,第二章我们提供的数据集01和数据集04也都属于时间序列。表是从数据集摘录的部分数据。
表中国1992-2002年的四个指标
年份
国内生产总值
(亿元)
人均国内生产总值
(元/人)
年末总人口
(万人)
人均粮食产量
(公斤)
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2287
2939
3923
4854
5576
6054
6038
6551
7086
7651
8184
117171
118517
119850
121121
122389
123626
124761
125786
126743
127627
128453
可见构成时间数列包含两个基本要素:现象所属的时间及与时间所对应的指标值。
一、时间序列的构成因素
事物的发展受多种因素的影响,时间序列的形成也是多种因素共同作用的结果,在一个时间序列中,有长期的起决定性作用的因素,也有临时的起非决定性作用的因素;有可以预知和控制的因素,也有不可预知和不可控制的因素,这些因素相互作用和影响,从而使时间序列变化趋势呈现不同的特点。影响时间序列的因素大致可分为四种:长期趋势、季节变动、循环变动及不规则变动。
1. 长期趋势(Trend)
长期趋势是指现象在相当长的一段时期内,受某种长期的、决定性的因素影响而呈现出的持续上升或持续下降的趋势,通常以T表示。如中国改革开放以来国内生产总值持续上升。
2. 季节变动(Seasonal variation)
季节变动是指现象在一年内,由于受到自然条件或社会条件的影响而形成的以一定时期为周期(通常指一个月或季)的有规则的重复变动,通常以S表示。如时令商品的产量与销售量,旅行社的旅游收入等都会受到季节的影响。应注意的是在这里提到的“季节”并非通常意义上的“四季”,季节变动中所提及的主要指广义的概念,可以理解为一年中的某个时间段,如一个月,一个季度,或任何一个周期。
3. 循环变动(Cyclical variation)
循环变动是指现象持续若干年的周期变动,通常以C表示。循环变动的周期长短不一,没有规律,而且通常周期较长,不像季节变动有明显的变动周期(小于一年)。循环变动不是单一方向的持续变动,而是涨落相间的交替波动。如经济周期。
4. 不规则变动(Irregular Random variation)
不规则变动是指现象由于受偶然性因素而引起的无规律、不规则的变动,如受到自然灾害等不可抗力的影响,通常以I表示,这种变动一般无法作出解释。
二、时间序列的数学模型
时间序列各影响因素之间的关系用一定的数学关系式表示出来,就构成时间序列的分解模型,我们可以从时间序列的分解模型中将各因素分离出来并进行测定,了解各因素的具体作用如何。
通常我们采用加法模型和乘法模型来描述时间序列的构成。加法模型的表达式为:Y=T+S+C+I,式中Y表示时间序列的指标数值,T、S、C、I分别表示长期趋势、季节变动、循环变动、不规则变动,使用加法模型的基本假设前提是各个影响因素对时间序列的影响是可加的,并且是相互独立的。而乘法模型的表达式为:Y=T×S×C×I,使用乘法模型的基本假设前提是各影响因素对时间序列的影响是相互不独立的。
第二节 时间序列的因素分析
时间序列的形成受到多个因素的影响,影响因素可以归纳为四个方面:长期趋势、季节变动、循环变动和不规则变动。本节主要介绍前三种影响因素的测定分析方法。首先我们可以通过图形对序列的特点作初步的认识,识别其简单的统计规律
一、图形描述
作图是显示统计数据基本变动规律最简单、最直观的方法,下面我们先介绍几种常见的时间序列图形。
1. 平稳时间序列与非平稳时间序列
时间序列的平稳性是我们建模的重要前提,在检验时间序列的平稳性时,必须要考虑其均值和方差,如果一个序列的统计特性不随时间的变化而变化,即均值和协方差不随时间的平移而变化,那么这个时间序列为平稳时间序列,如图所示。
图 化学反应产出量
不具有平稳性即序列均值或协方差与时间有关的序列称之为非平稳序列,如图所示。
图 美国电冰箱月度需求
2. 仅包含长期趋势
下图是我国1992-2002年间GDP的发展趋势,图形呈现持续上升趋势。
图 我国GDP发展趋势
3. 既包括长期趋势,又包括季节变动
图是根据某地区农业生产资料的季度销售额作出的,图中既有缓慢地上升趋势,又有季节的波动。
图 某地区农业生产资料季度销售额的波动
二、长期趋势分析
长期趋势是时间序列中主要的构成因素,它是指现象在一段时期内持续上升或下降的发展趋势。研究长期趋势的意义主要体现在三方面:(1)有利于认识现象随时间变化的趋势,掌握现象活动的规律;(2)有利于对现象未来的发展作出预测;(3)有利于从时间序列中剔除它的影响,进而更好地分析其他因素的影响。时间序列的长期趋势可表现为线性趋势和非线性趋势,非线性趋势可以理解为无数线性趋势的组合,在研究方法上基于线性趋势分析方法。因此本部分我们仅研究最简单、最基础的线性趋势。测定长期趋势的方法很多,常用的有移动平均法和趋势线法。
(一)移动平均法(Moving Average Method)
移动平均法是通过逐期移动时间序列,并计算一系列扩大时间间隔后的序时平均数,最终形成一个新时间序列的方法。由于序列平均数有抽象数量差异的作用,所以经过移动平均后得到的新序列相比原时间序列来说,由其它因素而引起的变动影响被削弱了,对原序列起到了修匀的作用,从而更清晰地呈现出现象的变动趋势。通过移动平均法的定义易见其核心是扩大时间间隔计算序时平均数,我们有必要更进一步的认识时间间隔的选取及新数列的形成问题。
1. 时间间隔的选取应根据现象的特点和资料的情况来决定。一般来说,如果现象发展的资料呈现出一定的周期性,应以周期的长度作为移动间隔的长度;如果是季节资料,应采用4项移动平均;如果是月份资料,应采用12项移动平均,只有这样才能削弱周期或季节的影响。
2. 新数列中每一数值应有与之对应的时间。如果进行的是奇数项移动平均,计算的序时平均数应放在中间时期所对应的位置上,边移动边平均,每一项序时平均数都有与之对应的时间;如果进行是偶数项移动平均(如4项或12项),序时平均数同样也应放在中间时期所对应的位置上,但由于时间间隔为偶数,序时平均数所对应的时期应介于两个时间之间,不能构成时间序列,所以我们需要对相邻的序时平均数再进行一次平均。移动平均后得到的时间序列值又称趋势值。
【例】我国1990—1999年粮食产量序列见表,对其进行3、4、5年的移动平均,并作图观察。
【解】
表 移动平均数计算表
年份
粮食产量
(万吨)
3年移动平均
4年移动平均
5年移动平均
一次平均
二次平均
1990
—
—
—
—
1991
—
—
1992
1993
1994
1995
1996
1997
1998
—
—
—
1999
—
—
—
—
作图如下:
图 3、4、5年的移动平均图示
通过以上例题,我们可以发现:(1)移动平均项数越多,平均的结果越平滑;(2)新数列的项数比原数列要少。
教师:Excel的“数据分析”功能中有“移动平均”,但其实使用函数更为方便。无论是用手工计算还是用“移动平均”工具对于偶数项的移动平均都要进行二次平均,好烦吧?你能不能想个办法一次解决问题?
(二)趋势线法
趋势线法是选择合适的趋势线,并利用回归分析的方法建立趋势方程来拟合时间序列的方法。线性趋势方程的一般公式为:
()
式中:表示时间序列y的长期趋势值;t为时间标号;a、b为待定参数
两个待定参数可以通过最小二乘法求出。根据最小二乘原理,对时间序列配合一条趋势线,使之满足:。由此条件,我们可以推导出a、b的计算公式:
解得:
()
教师:这个公式是否觉得面熟?它和我们第九章中的公式()其实是一回事,只不过那里的x,这里变成了t。最小二乘法可用来建立线性趋势方程,也可用来建立非线性趋势方程。
【例】利用例的数据,建立时间序列的直线趋势方程,并画出效果图。
表 直线趋势方程计算表
年份
时间标号t
粮食产量(万吨)y
ty
趋势值
1990
1
1
44624
1991
2
4
87058
1992
3
9
1993
4
16
1994
5
25
1995
6
36
1996
7
49
1997
8
64
1998
9
81
1999
10
100
508386
总计
55
385
2667559
—
【解】根据公式()计算得:
作图如下:
图 实际值与预测值的对比图示
时间标号t 的设定比较灵活,可以顺序设为1,2,…;也可使时间数列的中间时期为原点,使,从而方便计算,在使用这种方法时需注意:当时间序列有奇数项数值时,t的取值为:…-3,-2,-1,0,1,2,3…,当时间序列含有偶数项数值时,t的取值为:…,-5,-3,-1,1,3,5…
教师:如果大家用Excel中的分析工具中“回归”来做趋势线就不需要这么麻烦了,把年份当t就可以了。
三、季节变动分析
季节变动是指现象在一定时期内形成的有规律的周期性变动,这种变动各年强度大体相同且重复出现。测定季节变动的目的在于了解现象季节变动的规律,能进行预测。
季节变动的测定主要是计算一系列季节指数,又称季节比率,其设计思想是:以总平均水平为对照物,用各季节的平均数与之比较,来反映季节变动高低程度。季节指数是各季(月)平均数与全时期总平均数的比率,它由一系列数值组成,个数由资料的时间间隔决定,且季节指数之和也与所掌握资料有关。如掌握资料为月份资料,则有12个季节指数,季节指数之和为1200%,如为季度资料,则有4个季节指数,季节指数之和为400%。
下面我们从时间序列是否包含长期趋势方面来介绍测定季节变动的方法。
(一)不包含长期趋势的时间序列—按季(月)平均法
若时间序列中不包含长期趋势和循环变动,则直接利用原序列进行同期平均和总平均,消除不规则变动,计算出季节指数,常用按季(月)平均法。基本步骤如下:
1. 计算同月(或同季)的平均数
2. 计算全部数据的总月(总季)平均数
3. 计算季节指数(S)
【例】美国Magnavox牌彩电1976年至1983年月度销售量资料如下:
表 按季(月)平均法计算表
年份
一月
二月
三月
四月
五月
六月
七月
八月
九月
十月
十一月
十二月
合计
1976
1977
1978
1979
1980
1981
1982
1983
合计
季节平均数
19
季节指数(%)
95
1200
【解】
(1)计算同月的平均数,计算结果见上表“季节平均数”一栏
(2)计算全部数据的总月平均数,即
(3)计算季节指数(S),即 ,计算结果见上表“季节指数”一栏
从季节指数上可以判断该彩电在九、十、十一、十二月份是销售旺季,尤其在后三个月,而六月份是销售淡季。需要注意的是,如果季节指数之和不等于400%或1200%,就需要调整,调整的方法是首先计算调整系数,然后用调整系数分别乘以各月(季)季节指数,即得调整后的季节指数。调整系数的公式为:
(二)包含长期趋势的时间序列—趋势剔除法
当时间序列包含长期趋势和循环变动时,用按季平均法计算季节指数就不够准确,应采用趋势剔除法。假定时间序列各影响因素以乘法模型形式存在,趋势剔除法的基本步骤如下:
1. 用移动平均法、趋势线法等方法消除季节变动(S)和不规则(I)变动,计算出长期趋势和循环变动值(T×C);
2. 再从乘法模型中剔除(T×C),从而得到不存在长期趋势的(S×I),即
3. 再用按季(月)平均法消除I,得到季节指数。
【例】我国某地区1998-2003年各季度的农业生产资料零售额(单位:万元)资料如表,试用趋势剔除法求季节指数。
表 趋势剔除法求季节指数计算表
时间
农业生产资料零售额Y
趋势值T
Y/T
—
—
—
—
—
—
—
—
【解】首先利用四项移动平均法求得该序列的长期趋势值T,并将长期趋势从时间序列中剔除,求得Y/T,计算结果见表;其次将表中Y/ T重新排列,利用按季平均法求得季节指数:
表 趋势剔除法求季节指数计算表
一
二
三
四
合计
1998
—
—
1999
2000
2001
2002
2003
—
-
合计
季节平均数
季节指数(%)
400
从季节指数上判断该地区每年二季度、三季度零售额高于一、四季度。
学生:如果我有六年的月度资料,要计算季节指数,应该用后一种方法比较好吧?复杂的计算应该能得到更精确的结果,对吧?
教师:不对。上述两种方法的差别不在于结果获得的精确度,而在于它们的应用条件。如果你的资料没有长期趋势,就一定用第一种方法;如果有长期趋势,就一定用第二种方法。一组数据只能有一种适用方法。需要先判断哦。
下面我们来解决前面提出的问题,一次性解决偶数移动问题。
Excel解决方案
① 将例数据输入工作表中
② 在单元格C4中输入公式“(B2+2*(SUM(B3:B5))+B6)/8”,这样就得到了趋势值T
(想一想,为什么?这就体现出函数的优越性了。)
③ 将趋势从原始数据中剔除。在D4单元格键入公式“=B4/C4”,并将该公式下拉至D24④ 在E4单元格中键入公式“=(D4+D8+D12+D16+D20)/5”,并将该公式下拉至D7,即得同季平均值
⑤在F4单元格中键入公式“=average(E4:E7)”,即得到总平均值
⑥在G4单元格中键入公式“=E4/$F$4”,并将该公式下拉G7单元格,即得到季节指数,具体结果见图
图 趋势剔除法的计算结果
四、循环波动分析
循环波动是指现象在一个较长时期内涨落起伏的波动。测定循环变动的目的在于发现循环变动的规律,为预测提供依据。测定循环波动的思路与前基本一致,先将S、T、I从原始数据Y中剔除,剩余的部分作为循环波动的估计值,常用的方法是剩余法。
仍然假定时间序列各影响因素满足乘法模型Y=T×S×C×I,剩余法的基本步骤如下:
1. 计算季节指数(S),用Y除以季节指数S,得无季节变动数据T×C×I;
2. 求长期趋势T;
3. 用(T×C×I)除以T,得无季节无长期趋势的数据(C×I)
4. 利用移动平均法来消除I,得循环变动C。
【例】根据表的数据进行循环波动分析。
表 循环变动计算表
时间
标号t
零售额Y
季节指数S%
Y/S(%)
趋势值T
C×I(%)
C(%)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
【解】
1. 先消去季节变动,得无季节变动资料。见表中“Y/S”栏
2. 利用原始资料建立的趋势方程: 将t=1,2,…,24代入方程得“趋势值T”
3. 将前两项结果相除即得无季节无趋势资料,见表中“C×I”栏
4. 最后通过移动平均消除不规则变动,得循环波动值,即表中的最后一栏
将循环波动值绘图如下:
图 循环波动值图示
教师:若要利用Excel进行循环波动分析,可以依照例的操作过程进行。
第三节 随机时间序列分析
前面讨论了确定性时间序列模型的建立,事实上,许多现实经济现象都是通过随机时间序列模型来刻画的,本节主要介绍一系列常用的时间序列模型:AR模型,MA模型以及ARMA模型,这类模型的建立需要较多的历史数据和较深的数学知识,实际操作必须借助计算机来完成,但是该模型在短期预测中具有较高的精度,因此在实际中得到了广泛的应用。
一、平稳随机过程概述
所谓平稳随机序列,指如果序列二阶矩有限, 且满足如下条件:
对任意整数为常数;
对任意整数 自协方差函数仅与时间间隔有关,和起止时刻无关。即
则称序列为宽平稳(或协方差平稳,二阶矩平稳)序列
最简单的宽平稳过程是白噪声序列,它是构成经济序列许多复杂过程的基石,一般白噪声过程的定义如下:
对所有
其中常见的平稳序列模型包括如下几类:自回归 (AR)模型, 滑动平均(MA)模型, 自回归滑动平均 (ARMA) 模型.
自回归(AR)模型
零均值平稳随机序列满足如下形式
其中,称为自回归系数,满足平稳性条件,为白噪声序列
上式称为是阶自回归模型,简记为AR().
滑动平均(MA)模型
一般MA模型的数学形式为
其中,称为滑动平均系数, 为白噪声序列。
上式称为是阶滑动平均模型,简记为MA().
自回归滑动平均(ARMA)模型
一般ARMA模型的数学形式为
其中,称为自回归系数,满足平稳性条件,称为滑动平均系数,为白噪声序列,上式称为是阶自回归-阶滑动平均模型,简记为ARMA().
从以上定义中可以看出,AR模型和MA模型即为ARMA模型的特例:
当ARMA()——MA().
当ARMA()——AR().
二、ARMA模型的识别
采用ARMA模型对现有的数据进行建模,首要的问题是确定模型的阶数,即相应的值,对于ARMA模型的识别主要是通过序列的自相关函数已经偏自相关函数进行的。
序列的自相关函数度量了与之间的线性相关程度,用表示,定义如下
其中,,表示序列的方差
自相关函数刻画的是与之间的线性相关程度,而有时候与之间之所以存在相关关系,可能是因为和分别与它们的中间部分之间存在关系,如果在给定的前提下,对和之间的条件相关关系进行刻画,则要通过偏自相关函数进行,所谓偏自相关函数的可由下面的递推公式得到:
对于三类模型AR, MA, ARMA,它们各自的自相关函数以及偏自相关函数特点如下表所示(具体推导可参阅相关时间序列分析书籍)
模型
系数
AR()
MA()
ARMA()
自相关函数
拖尾
步截尾
()
拖尾
偏自相关函数
步截尾
()
拖尾
拖尾
这里的拖尾指模型自相关函数或偏自相关函数随着时滞的增加呈现指数衰减并趋于零,而截尾则是指模型的自相关函数或偏自相关函数在某步之后全部为零。序列的自相关函数和偏自相关函数所呈现出的这些性质可用于模型的识别。
(一)基于自相关函数和偏自相关函数的定阶方法
理论上讲,对于AR()序列的偏自相关函数是步截尾的,但实际中我们所接触到的往往是来自序列的一组样本,我们所计算的也只能是样本的偏自相关函数,由于样本的随机性,此时计算所得的样本偏自相关函数不可能是步截尾的,而是呈现在零附近波动,所以要考虑的是样本偏自相关函数的统计性质,对于MA()序列的样本自相关函数同样应该考虑其统计性质。关于样本自相关函数 的估计方法很多,最常用的是如下的估计方法(关于样本偏自相关函数在后面给出)
其中为样本均值,称为样本自协方差函数
【例】有长度为10的一个样本47,64,23,71,38,64,55,41,59,48试计算样本自相关函数
【解】样本均值
所有数据减去均值
-4,13,-28,20,-13,4,-10,8,-3
实际计算中需要至少50个观测值,一般取.下面给出有关样本偏自相关函数和样本自相关函数的统计性质。
可以证明,当时,MA()序列的样本自相关函数渐近服从的正态分布。
当时,AR()序列的样本偏自相关函数渐近服从 的正态分布。
这里,表示样本容量
所以,根据正态分布的性质,当充分大时,有
对于某个,计算中,或者的个数是否占的%或%. 如果满足以上条件,则可认为在%%的显著性水平下是步截尾的,即所研究的序列可能来自MA()模型
类似地,当充分大时,有
对于某个,计算中,或者的个数是否占的%或%.如果满足以上条件,则可认为在%或%的显著性水平下是步截尾的,即所研究的序列可能来自AR()模型。
【例】设某平稳时间序列的样本容量为50,其样本自相关函数依次为
根据样本自相关函数的定阶法则判断序列来自何种模型(给定显著性水平为%)
【解】
当时,,在样本自相关函数
中满足的个数占到了100%,在%的显著性水平下可认为自相关函数是截尾的,此时间序列符合MA()模型。
【例】设某平稳时间序列的样本容量为50,其样本偏自相关函数依次为
根据样本偏自相关函数的定阶法则判断序列来自何种模型(给定显著性水平为%)
【解】
当时,,在样本偏自相关函数
中满足的个数占到了,
当时,,在样本偏自相关函数
中满足的个数占到了,
在%的显著性水平下可认为自相关函数是截尾的,此时间序列符合AR()模型。
(二)利用信息准则法定阶
信息准则法在模型选择中起到很重要的作用,关于
的定阶问题,实际上也是模型选择问题,这里我们给出两种准则
1. AIC
AIC准则英文全称是Akaike’s Information Criterion译为赤池信息准则,是由Akaike在1973年提出的,该准则既考虑拟合模型对数据底接近程度,也考虑模型中所含待定参数的个数。关于ARMA(),对其定义的AIC函数如下:
AIC
其中,是拟合ARMA()模型时残差的方差,它是()的函数。如果模型中含有常数项,则被代替。AIC定阶的方法就是选择AIC ()最小的()作为相应的模型阶数。
2. BIC
Akaike在1976年改进了AIC准则,提出BIC准则。这样避免了在大样本情况下,AIC准则在选择阶数是收敛性不好的缺点。关于ARMA(),对其定义的BIC函数如下:
AIC
BIC定阶的方法就是选择AIC ()最小的()作为相应的模型阶数。
利用AIC准则和BIC准则确定出来的ARMA模型可能不一致,一般说来,用BIC准则选择出来的ARMA模型的阶数较AIC准则选择的低。
【例】假设计算AIC和BIC结果如下,用AIC和BIC准则确定滞后阶数
AIC
q
p
0
1
2
3
0
1
2
在这里,最小的AIC值为,所对应的阶数,故据AIC准则所选的最好模型为
MA(1)。
BIC
q
p
0
1
2
3
0
1
2
根据BIC准则,所选的最好的模型为白噪声,即对应的阶数均为0。
三、模型参数的估计
模型的阶数确定之后,就可以估计模型了。主要有三种估计方法:矩估计,极大似然估计和最小二乘估计。最小二乘估计和极大似然估计的精度较高,因而一般称之为模型参数的精估计。最小二乘估计在一般的数理统计教材中都有全面的介绍,本书不再重述。而极大似然估计计算方法较为复杂,最后求解的方程皆为非线性方程,很难求解,所以实际中采用数值算法。思路是任意给出参数的一组数值,初步估计得到的结果,计算出一个似然函数值;然后,根据一定的法则,再给出参数的一组数值,又计算出一个似然函数值;依此类推,比较似然函数值,选择使似然函数值最大的那组参数。本节主要介绍矩估计法,以AR模型为例说明方法,MA和ARMA模型思路相同,只是步骤更复杂一些,MA和ARMA的矩估计再详细介绍。
下面是一零均值的AR()模型
需要估计的参数是
在模型两边同乘以,可得
两边取期望,得
由于 与不相关,所以,因此
其中是序列的自协方差函数,易知序列的自相关函数也满足上述关系式,即
把自相关函数展成个方程
上述个方程,表示了平稳序列的自相关函数与模型未知参数的关系,被称为Yule-Walker方程。
自相关函数可以用样本自相关函数代替,所以此时的Yule-Walker方程只有个未知数,解方程可以得到的估计值,用矩阵表示
对于二阶自回归模型AR(),根据上述结果可知
对于二阶自回归模型AR(),根据上述结果可知
样本自相关函数和自协方差函数除了定阶外,还可以用来估计。矩估计也被称为初估计,矩估计方法简单但精度不高。
英文摘要与关键词
Time series analysis is a widely used analytical method of quantity. The method is predominately used to depict and study the rule of phenomenon as time varying. Usually, time series analysis is classified as traditional and modern time series analysis. The former is didided into the decomposition of series, the analysis of long trend, seasonal variation and cyclical variation; while the later focuses on three kinds of models: AR(autoregressive model), MA(moving average model )and ARMA(autoregressive moving average model). In the chapter, we introduce the contents above.
The original use of time series analysis was primarily an aid to forecasting. As such, a methodology was developed to decompose a series into a trend, seasonal , cyclical , and irregular component. Uncovering the dynamic path of a series improves forecast accuracy since each of the predictable components can be extrapolated into the future. The contents above belong to traditional time series. In fact , we prefer to explore suitable models to fit a data generating process, a type of process named stationary time series is widely used in reality, especially linear stationary time series. The main models used to illustrate such series are called autoregressive moving average(ARMA) time series models. In the analysis of such models, the key instrument is the autocorrelation function (ACF) and partial autocorrelation function (PACF). In model estimation, the Box-Jenkins modeling philosophy is usually used. The first step is how to choose the values of p and q for ARMA(p,q). The ACF and PACF are used in model estimation, and show different characteristics for each model. In the autoregressive model (AR(p)), the ACF exponentially decays while PACF . In the moving average model (MA(q)), the ACF while PACF decay directly or oscillatory, and in the autoregressive moving average model(ARMA), both the ACF and PACF decay either directly or oscillatory. Of course we cannot get the real values for p and q, we can only choose a few values to test. Information criteria is also a method to select values for p and q.
Key words: time series, trend, seasonal, cyclical, ARMA, autocorrelation function
习 题
一、单项选择题
1.如果采用三项移动平均修匀时间序列,那么所得修匀序列比原序列首尾各少( )。
A.一项数值 B.二项数值 C.三项数值 D.四项数值
2.对某公司历年利润额(万元)资料拟合的方程为(原点在2000年),这意味着该公司利润额每年平均增加( )。
A.110万元 B.10万元 C.100万元 D.10%
3.在用移动平均趋势剔除法测定季节变动时,剔除长期趋势的方法是( )。
A.按月资料移动平均 B.按季资料移动平均 C.将实际值除以趋势值 D.将实际值乘以趋势值
4.二阶滑动平均模型MA(2), 其自相关函数有如下特点( )。
A. 2步之后是截尾的 B. 具有拖尾性 C. =0,任意 D. 无显著特点
5.如果时间序列的自相关函数和偏自相关函数都是拖尾的,则可以判断此序列适合( )模型。
A. MA B. AR C. ARMA D. 线性
6.AR(2)模型的偏自相关函数( )。
A. B. C. 0 D.
7. MA(2)模型的自相关函数( )。
A. B. 0 C. D.
二、多项选择题
1.长期趋势有以下几种情形( )( )( )( )( )。
A.呈稳定的水平趋势 B.向上发展变化趋势 C.向下发展变化趋势 D.等比上升趋势 E.等差上升趋
2. 直线趋势方程中的参数b表示( )( )( )( )( )。
A.趋势线的截距 B.当的数值 C.趋势值或理论值
D.趋势线的斜率 E.当t每变动一个单位时,的平均增减数量
3.反映季节变动的指标有( )( )( )( )( )。
A.平均发展速度 B.季节比率 C.平均增长速度 D.季节指数 E.平均增长量
4.用趋势剔除法测定季节变动( )( )( )( )( )。
A. 考虑了现象发展中长期趋势的影响 B. 所得季节比率之和正好等于零
C. 要求具备连续三年以上的分月(季)资料 D. 各季季节比率之和调整后等于400%
适用于没有长期趋势的时间序列
三、计算题
1. 某地历年粮食产量(单位:万吨)资料如下:
年份
1996
1997
1998
1999
2000
2001
2002
产量
241
246
252
257
262
276
281
要求: (1)用最小平方法拟合直线趋势方程;
(2)预测2005年的粮食产量。
2.某企业1988-1997各年份销售额资料如下
年份
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
产量
61
80
85
要求: (1)测定长期趋势线性方程,时刻序列t为定义1,2,3,4…;
(2)预测1998年的销售额。
3. 江苏省1985-1989年汗衫背心国内纯销售情况如下表(单位:百件),计算各季度的季节比率。
月份
1985
1986
1987
1988
1989
一月
1875
1274
1277
1508
1596
二月
1180
2009
3874
1580
2194
三月
15470
16337
15338
14035
18493
四月
36643
30307
26773
36490
33787
五月
107340
94374
82899
80106
58400
六月
79211
77949
79660
81151
74733
七月
91185
74723
85034
68282
67026
八月
36624
34538
39475
26630
28737
九月
11724
9630
14577
9933
9494
十月
3077
2951
3951
3413
4465
十一月
1030
1240
1651
1552
1587
十二月
745
1267
1366
1508
1475
四、操作题
1. Ex11_1是某企业商品销售量的资料。
(1)分析数据是否存在季节变动,是否存在长期趋势?( )
A. 存在, 不存在 B. 不存在,存在 C.存在,存在 D.不存在,不存在
(2)如果存在季节变动,对数据进行季节调整,并对调整后的数据进行趋势测定,趋势方程中的系数分别为a( ),b( ). 时刻序列t为定义1,2,3,4…..(四舍五入保留两位小数)
A. a=,b= B. a=,b=
C. a=,b= D. a=,b=
第 PAGE 21 页