实验一 ARIMA 模型建立与应用
一、实验项目:ARIMA 模型建立与预测。
二、实验目的
1、准确掌握 ARIMA(p,d,q)模型各种形式和基本原理;
2、熟练识别 ARIMA(p,d,q)模型中的阶数 p,d,q 的方法;
3、学会建立及检验 ARIMA(p,d,q)模型的方法;
4、熟练掌握运用 ARIMA(p,d,q)模型对样本序列进行拟合和预测;
三、预备知识
(一)模型
1、AR(p)(p 阶自回归模型)
其中 ut 白噪声序列,δ是常数(表示序列数据没有 0 均值化)
AR(p)等价于
AR(p)的特征方程是:
AR(p)平稳的充要条件是特征根都在单位圆之外。
2、MA(q)(q 阶移动平均模型)
其中{ut}是白噪声过程。
MA(q)平稳性
MA(q)是由 ut 本身和 q 个 ut 的滞后项加权平均构造出来的,因此它是平
稳的。
MA(q)可逆性(用自回归序列表示 ut)
可逆条件:即 收敛的条件。即Θ(L)每个特征根绝对值大于 1,即
全部特征根在单位圆之外。
3、ARMA(p,q)(自回归移动平均过程)
ARMA(p,q)平稳性的条件是方程Φ(L)=0 的根都在单位圆外;可逆性
条件是方程Θ(L)=0 的根全部在单位圆外。
tptpttt uxxxx 2211
tt
p
p uxLLL )1(
2
21
01)( 221
p
p LLLL
qtqtttt uuuux 2211
tt
q
qt uLuLLLx )()1(
2
21
tt xLu
1)]([
1)]([ L
qtqtttptpttt uuuuxxxx 22112211
tt
q
q
t
p
pt
uLuLLL
xLLLxL
)()1(
)1()(
2
21
2
21
tt uLxL )()(
4、ARIMA(p,d,q)(单整自回归移动平均模型)
差分算子:
对 d 阶单整序列 xt~I(d)
则 wt 是平稳序列,于是可对 wt 建立 ARMA(p,q)模型,所得到的模型
称为 xt~ARIMA(p,d,q),模型形式是
由此可转化为 ARMA 模型。
(二)模型识别
要建立模型 ARIMA(p,d,q),首先要确定 p,d,q,步骤是:一是用单
位根检验法,确定 xt~I(d)的 d;二是确定 xt~ AR(p)中的 p;三是确定 xt~ MA
(q)中的 q。平稳序列自相关函数
ρ0=1,ρ-k=ρk(对称)
1、平稳 AR(p)的自相关系数和偏自相关系数
(1)平稳 AR(p)的自相关系数
|φi|<1,i=1,2,…,p,E(ut)=0
,k>0
,k>0
平稳 AR(p)的自相关系数是
,k>0
(2)k 阶平稳自回归过程 AR(k)的偏自相关系数
两边同除以γ0
t
d
t
d
tttttt
tttttt
xLx
xLxLxLxxx
xLLxxxxx
)1(
)1()1()1(
)1(
2
11
2
1
t
d
t
d
t xLxw )1(
qtqtttptpttt uuuuwwww 22112211
tt
d uLxL )()(
000
0
)var()var(
),cov(
)var()var(
),cov(
r
r
xx
xx
xx
xx kk
ktt
ktt
k
tptpttt uxxxx 2211
tktptktptkttkttkt uxxxxxxxxx 2211
pkpkkk 2211
pkpkkk 2211
tktkktktkt uxxxx 2211
jttjtktkkjttkjttkjtt xuxxxxxxxx 2211
kjkkjkjkj 2211
对任意 j>0 都成立。根据 和对称性 ,得到 Yule-Walker 方程
组
对于给定的 k,ρ1,ρ2,…,ρk 已知,每个方程组最后一个解就是相应的偏自相
关系数:φ11,φ22 的,…,φkk。
ρ3 是 k=3 的自相关系数,意义:度量平稳序列 xt 与 xt-3 的相关系数,至于
中间 xt-1,xt-2 起什么作用无法顾及。
φ33 的 k=3 的偏自相关系数。意义:剔除中间变量 xt-1,xt-2 的影响后,度
量 xt 与 xt-3 的相关程度。
2、平稳 MA(q)的自相关系数和偏自相关系数
(1)MA(q)自相关系数
当 k>q 时,ρk=0,xt 与 xt+k 不相关,这种现象称为截尾,因此可根据自相
关系数是否从某一点开始一直为 0 来判断 MA(q)模型的阶数 q。
(2)MA(q)偏自相关系数
MA(q)模型对应一个 AR(∞),通过 AR(∞)来解决
3、ARMA(p,q)有拖尾特征,p 和 q 的识别通过从低阶逐步试探直到合
适的模型为止。
(三)模型估计
用 Eviews 软件进行估计
(四)模型检验
1、用 t 统计量检验模型参数显著性;
2、为保证 ARMA(p,q)的平稳性和可逆性,模型特征根皆应在单位圆以
外,或倒数在单位圆内;
3、用 Q 统计量对残差进行白噪声检验。
原假设和备择假设
(序列不存在自相关,是白噪声)
kjkkjkjkj 2211
10 jj
kkkkkkk
kkkkk
kkkkk
2211
22112
11211
qtqtttt uuuux 2211
qk
qk
k
xxE qqkkk
q
kttk
,0
0),(
0),1(
)( 11
2
22
2
2
1
2
qk
qk
k
r
r
qqqkkk
k
k
,0
0),1/()(
0,1
22
2
2
111
0
0: 211 KH
不全为 0(序列存在自相关,不是白噪声)
统计量
其中上述 r 是样本相关系数,T 是样本容量,分布是极限分布。K 是自相关
系数的个数,即最大滞后期。若样本较大,则 K=[T/10]或 T 的平方根;若样本
较小,则 K=[T/4]。
判别规则是:
接受原假设,
拒绝原假设。
(五)模型外推预测
已有 ARMA(p,q)模型
和观察值 Xt,Xt-1,Xt-2,…,X1。把观察值代入,在 t+1 时刻有
上式中,观察值已知,只有误差处理问题。
下标大于 t 的误差项,由于未来的误差未知,因此用期望值 0 代替未来的误
差。下标从 1 到 t 的误差项,可用残差估计值(要建模时可找到)代替。于是
1 步预测公式:
类似地,2 步预测公式和 l 步预测公式分别是:
其中,h-p<=0 时, ;h-q>0 时,
四、实验内容
1、ARIMA(p,d,q)模型阶数识别;
2、ARIMA(p,d,q)模型估计与检验;
3、ARIMA(p,d,q)模型外推预测。
五、实验软件环景:Eviews 软件。
六、实验步骤:按、以美元对欧元汇率 到 的月均价数据为例进行
实验。
(一)创建 Eviews 工作文件(Workfile)
从 Eviews 主选单中选“File/New\ Workfile”,选择“monthly”选项,输入“Start
date:1993:01End date:2007:12”。
KH ,,,: 210
)(~)1( 2
1
2
K
KT
r
TTQ
K
k
k
)(2 KQ
)(2 KQ
qtqtttptpttt uuuuxxxx 22112211
1121111211 qtqtttptpttt uuuuXXXX
11211121 0)1(
qtqttptpttt uuuXXXX
21322221 00)1()2(
qtqttptpttt uuuXXXX
hqtqththtpttt uuuphXhXhXhX
1121 )()2()1()(
phtt XphX
)( 0
hqtu
(二)录入数据,并对序列进行初步分析
1、导入数据
Quick/Empty Group
在 Ser01 输入数据;改变量名:点击 Ser01 全选第一列,在命令栏输入 EURO。
将文件保存命名,注意存放地址。
2、序列初步分析
选定变量 EURO,双击它,View\Graph\Line,输出 EURO 的曲线
从图形看到美元对欧元汇率在 2001 年左右处于高位,2002 年以后一直处于
下跌态势。数据总体上类似于随机游走过程形式,应该是非平稳的。
(三)ARIMA(p,d,q)模型阶数识别
1、确定单整阶数 d
(1)用不含时间趋势项、解释变量中不含差分项的模型,即对模型
进行单位检验(Unit Root Test)。假设 ;备择
假设 。
在工作文件窗口,选定变量EURO,双击它,在EURO页面上,点击View\Unit Root
Test\ADF,表示已经进入扩展的DF检验。选择Level(对水平变量进行单位根检验,
检验系数对应的项EUROt-1)\Intercept(不含时间趋势变量)\Automatic selecttion
(解释变量不含EUROt-1的差分),并且在maximum中选择0(表示差分滞后项数
取0,即不含EUROt-1的差分)
ttt euroeuro 1 0:0 H
0:1 H
Null Hypothesis: EURO has a unit root
Exogenous: Constant
Lag Length: 0 (Automatic based on SIC, MAXLAG=0)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic
Test critical values: 1% level
5% level
10% level
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(EURO)
Method: Least Squares
Date: 04/11/11 Time: 08:24
Sample (adjusted): 1993M02 2007M12
Included observations: 179 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
EURO(-1)
C
R-squared Mean dependent var
Adjusted R-squared . dependent var
. of regression Akaike info criterion
Sum squared resid Schwarz criterion
Log likelihood F-statistic
Durbin-Watson stat Prob(F-statistic)
得到结果
t=()()
p=() ()
要确定差分方程的样本容量 T,原有的样本容量是 180,差分后样本容量是
T=179;取α=5%,查附表 2,得临界值τ=;统计量观察值为 t=>τ=,
所以接受假设 (从概率值大于 也得到接受的结论 ),即认为汇率序列
(EURO)是非平稳的。
( 2 ) 对 模 型 , 作 假 设 ; 备 择 假 设
。
在工作文件窗口,选定变量 euro,双击,在 euro 页面上,点击 View\Unit Root
Test\ADF,表示已经进入扩展的 DF 检验。选择 1st different(对 1 阶差分进行单
位根检验,检验系数对应的项是Δeurot-1)\Intercept(不含时间趋势变量 )\User
specifi 取 0(解释变量不含Δeurot-1 的差分)。得到结果
Null Hypothesis: D(EURO) has a unit root
Exogenous: Constant
Lag Length: 0 (Automatic based on SIC, MAXLAG=0)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic
Test critical values: 1% level
tt euroeuro
ttt euroeuro 1
2 0:0 H
0:1 H
5% level
10% level
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(EURO,2)
Method: Least Squares
Date: 04/11/11 Time: 08:36
Sample (adjusted): 1993M03 2007M12
Included observations: 178 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
D(EURO(-1))
C
R-squared Mean dependent var -05
Adjusted R-squared . dependent var
. of regression Akaike info criterion
Sum squared resid Schwarz criterion
Log likelihood F-statistic
Durbin-Watson stat Prob(F-statistic)
由软件输出结果得到回归模型
t=()()
p=() ()
取α=5%,求样本容量 T,原来样本容量是 180,2 阶差分分后 T=178,查附
表 2,得 DF 检验的临界值为τ=,
对Δeuro 平稳性检验的统计量观察值为 t=<τ=,所以拒绝假设,
即认为个人可支配收入一阶差分时间序列(Δeuro)是平稳的。
即Δeuro~I(0),因此 euro~I(1),即 euro 是一阶单整的,从而 d=1。
2、确定自回归阶数 p 和移动平均阶数 q
因为 d=1,所以用 euro1 阶差分Δeuro 的自相关函数(ACF)和偏自相关函
数(PACF)判断 p 和 q 值。
生成Δeuro
GENR deuro=euro-euro(-1)
(也可以在 1st different 实现)
1
2
tt euroeuro
在 deuro 页面上,选 View\Correlogram\Level
Deuro 的偏自相关函数(PACF)系数在 1 为 ,2 处为期不远 ,但
是从 3 以后明显接近 0,所以取 p=2。
Deuro 的自相关函数(ACF)在 1 为 ,但是从 2 以后明显接近 0,所以
取 q=1。
至于 p 和 q 的最终确定还要从低开始试探,直到定出合适的模型为止。初步
适合 EURO 的模型有:
ARIMA(1,1,0)、ARIMA(2,1,0)、ARIMA(0,1,1)、ARIMA(1,1,
1)、ARIMA(2,1,1)。
(四)ARIMA(p,d,q)模型估计与检验
(1)ARIMA(1,1,0) 模型估计与检验
Quick\Estimate\LS(NLS and ARMA)
在对话框输入 d(euro) c ar(1)
常数 c 的概率太大(),接受 c=0 的假设,所以模型应该去掉常数。
Quick\Estimate\LS(NLS and ARMA)
在对话框输入 d(euro) ar(1)
模型为:
t=()
p=()
tt ww
ttt xLxw )1(
从 p 值看,系数是显著的。从 Inverted AR Roots(自回归特征方程根的倒数)
是 ,在单位圆之内,说明模型是平稳的。但还要对残差进行白噪声检验:
在 Quick\Estimate\LS(NLS and ARMA)
在对话框输入 d(euro) ar(1)
OK 出结果的页面上
View\Residual Tests\Correlogram-Q-statistics
选 K=13(由[178/10]或 178 平方根来)
Date: 04/11/11 Time: 10:51
Sample: 1993M03 2007M12
Included observations: 178
Q-statistic probabilities
adjusted for 1 ARMA
term(s)
Autocorrelation Partial Correlation AC PAC Q-Stat Prob
.|. | .|. | 1
*|. | *|. | 2
*|. | *|. | 3
.|. | .|. | 4
.|* | .|. | 5
.|. | .|. | 6
.|. | .|. | 7
.|* | .|* | 8
.|. | .|. | 9
.|* | .|* | 10
.|. | .|. | 11
.|. | .|. | 12
.|. | .|. | 13
从 K=13 一行找到 Q 统计量值为 ,相伴概率(记为 p-Q)为 >,
接受序列不相关的假设,即认为残差序列是白噪声。
类似地,对模型 ARIMA(2,1,0)、ARIMA(0,1,1)、ARIMA(1,1,1)、
ARIMA(2,1,1)进行估计与检验。
ARIMA(1,1,0),ARIMA(2,1,0)、ARIMA(0,1,1)三个检验都通过参
数显著性检验,模型平稳性和可逆性检验,残差序列白噪声检验。
但是模型 ARIMA(1,1,1)、ARIMA(2,1,1)没有通过检验。
模型评价与比较
模型 Φ1 Φ1 Φ1 R^2 p-Q
ARIMA(1,1,
0)
ARIMA(2,1,
0)
ARIMA(0,1,
1)
R^2 和 p-Q 两指标越大越好,ARIMA(1,1,0)不好,在一样好的两模型
ARIMA(2,1,0)和 ARIMA(0,1,1)中,ARIMA(2,1,0)用自回归信息预测,
所以在预测方面 ARIMA(2,1,0)明显好。最终选择 ARIMA(2,1,0):
即
(五)模型外推应用
已知 2007:12,2007:11,2007:10 的汇率分别是:,,
,利用 ARIMA(2,1,0)模型对 2008 年 1 月美元对欧元汇率进行预测。
21 ttt www
ttt xLxw )1(
21 )1()1()1( ttt xLxLxL
321 tttt xxxx
1211
ttttt uxxxx