MBA智库文档行业 IT互联网实验一 ARIMA模型建立与应用.doc

实验一 ARIMA模型建立与应用.doc

下载

用户#54502

16页 | 278KB | 0次下载 |

0.0

(0人评价)

我要评价：

投诉举报

用手机看文档

扫一扫,手机看文档

下载

开通VIP

实验一 ARIMA 模型建立与应用一、实验项目：ARIMA 模型建立与预测。二、实验目的 1、准确掌握 ARIMA(p,d,q)模型各种形式和基本原理； 2、熟练识别 ARIMA(p,d,q)模型中的阶数 p,d,q 的方法； 3、学会建立及检验 ARIMA(p,d,q)模型的方法； 4、熟练掌握运用 ARIMA(p,d,q)模型对样本序列进行拟合和预测；三、预备知识（一）模型 1、AR（p）(p 阶自回归模型）其中 ut 白噪声序列，δ是常数（表示序列数据没有 0 均值化） AR（p）等价于 AR（p）的特征方程是： AR（p）平稳的充要条件是特征根都在单位圆之外。 2、MA（q）（q 阶移动平均模型）其中{ut}是白噪声过程。 MA（q）平稳性 MA（q）是由 ut 本身和 q 个 ut 的滞后项加权平均构造出来的，因此它是平稳的。 MA（q）可逆性（用自回归序列表示 ut）可逆条件：即收敛的条件。即Θ（L）每个特征根绝对值大于 1，即全部特征根在单位圆之外。 3、ARMA（p，q）（自回归移动平均过程） ARMA（p，q）平稳性的条件是方程Φ（L）=0 的根都在单位圆外；可逆性条件是方程Θ（L）=0 的根全部在单位圆外。 tptpttt uxxxx    2211 tt p p uxLLL   )1( 2 21  01)( 221  p p LLLL   qtqtttt uuuux    2211 tt q qt uLuLLLx )()1( 2 21    tt xLu 1)]([  1)]([  L qtqtttptpttt uuuuxxxx     22112211 tt q q t p pt uLuLLL xLLLxL )()1( )1()( 2 21 2 21       tt uLxL )()(   4、ARIMA（p，d，q）（单整自回归移动平均模型）差分算子：对 d 阶单整序列 xt~I(d) 则 wt 是平稳序列，于是可对 wt 建立 ARMA（p，q）模型，所得到的模型称为 xt~ARIMA（p，d，q），模型形式是由此可转化为 ARMA 模型。（二）模型识别要建立模型 ARIMA（p，d，q），首先要确定 p，d，q，步骤是：一是用单位根检验法，确定 xt~I（d）的 d；二是确定 xt~ AR（p）中的 p；三是确定 xt~ MA （q）中的 q。平稳序列自相关函数 ρ0=1，ρ-k=ρk（对称） 1、平稳 AR(p)的自相关系数和偏自相关系数（1）平稳 AR(p)的自相关系数｜φi｜<1，i=1,2,…,p，E(ut)=0 ，k>0 ，k>0 平稳 AR(p)的自相关系数是，k>0 （2）k 阶平稳自回归过程 AR(k)的偏自相关系数两边同除以γ0 t d t d tttttt tttttt xLx xLxLxLxxx xLLxxxxx )1( )1()1()1( )1( 2 11 2 1      t d t d t xLxw )1(  qtqtttptpttt uuuuwwww     22112211 tt d uLxL )()(   000 0 )var()var( ),cov( )var()var( ),cov( r r xx xx xx xx kk ktt ktt k    tptpttt uxxxx    2211 tktptktptkttkttkt uxxxxxxxxx    2211 pkpkkk    2211 pkpkkk    2211 tktkktktkt uxxxx    2211 jttjtktkkjttkjttkjtt xuxxxxxxxx    2211 kjkkjkjkj    2211 对任意 j>0 都成立。根据和对称性，得到 Yule-Walker 方程组对于给定的 k，ρ1,ρ2,…,ρk 已知，每个方程组最后一个解就是相应的偏自相关系数：φ11，φ22 的,…,φkk。 ρ3 是 k=3 的自相关系数，意义：度量平稳序列 xt 与 xt-3 的相关系数，至于中间 xt-1，xt-2 起什么作用无法顾及。 φ33 的 k=3 的偏自相关系数。意义：剔除中间变量 xt-1，xt-2 的影响后，度量 xt 与 xt-3 的相关程度。 2、平稳 MA(q)的自相关系数和偏自相关系数（1）MA(q)自相关系数当 k>q 时，ρk=0，xt 与 xt+k 不相关，这种现象称为截尾，因此可根据自相关系数是否从某一点开始一直为 0 来判断 MA(q)模型的阶数 q。（2）MA(q)偏自相关系数 MA(q)模型对应一个 AR（∞），通过 AR（∞）来解决 3、ARMA（p，q）有拖尾特征，p 和 q 的识别通过从低阶逐步试探直到合适的模型为止。（三）模型估计用 Eviews 软件进行估计（四）模型检验 1、用 t 统计量检验模型参数显著性； 2、为保证 ARMA（p，q）的平稳性和可逆性，模型特征根皆应在单位圆以外，或倒数在单位圆内； 3、用 Q 统计量对残差进行白噪声检验。原假设和备择假设（序列不存在自相关，是白噪声） kjkkjkjkj    2211 10  jj   kkkkkkk kkkkk kkkkk              2211 22112 11211 qtqtttt uuuux    2211           qk qk k xxE qqkkk q kttk ,0 0),( 0),1( )( 11 2 22 2 2 1 2                qk qk k r r qqqkkk k k ,0 0),1/()( 0,1 22 2 2 111 0   0: 211  KH   不全为 0（序列存在自相关，不是白噪声）统计量其中上述 r 是样本相关系数，T 是样本容量，分布是极限分布。K 是自相关系数的个数，即最大滞后期。若样本较大，则 K=[T/10]或 T 的平方根；若样本较小，则 K=[T/4]。判别规则是：接受原假设，拒绝原假设。（五）模型外推预测已有 ARMA（p，q）模型和观察值 Xt，Xt-1，Xt-2，…，X1。把观察值代入，在 t+1 时刻有上式中，观察值已知，只有误差处理问题。下标大于 t 的误差项，由于未来的误差未知，因此用期望值 0 代替未来的误差。下标从 1 到 t 的误差项，可用残差估计值（要建模时可找到）代替。于是 1 步预测公式：类似地，2 步预测公式和 l 步预测公式分别是：其中，h-p<=0 时，；h-q>0 时，四、实验内容 1、ARIMA(p，d，q)模型阶数识别； 2、ARIMA(p，d，q)模型估计与检验； 3、ARIMA(p，d，q)模型外推预测。五、实验软件环景：Eviews 软件。六、实验步骤：按、以美元对欧元汇率到的月均价数据为例进行实验。（一）创建 Eviews 工作文件（Workfile）从 Eviews 主选单中选“File/New\ Workfile”，选择“monthly”选项，输入“Start date:1993:01End date:2007:12”。 KH  ,,,: 210  )(~)1( 2 1 2 K KT r TTQ K k k     )(2 KQ  )(2 KQ  qtqtttptpttt uuuuxxxx     22112211 1121111211   qtqtttptpttt uuuuXXXX   11211121 0)1(        qtqttptpttt uuuXXXX   21322221 00)1()2(        qtqttptpttt uuuXXXX   hqtqththtpttt uuuphXhXhXhX          1121 )()2()1()( phtt XphX    )( 0  hqtu （二）录入数据，并对序列进行初步分析 1、导入数据 Quick/Empty Group 在 Ser01 输入数据；改变量名：点击 Ser01 全选第一列，在命令栏输入 EURO。将文件保存命名，注意存放地址。 2、序列初步分析选定变量 EURO，双击它，View\Graph\Line，输出 EURO 的曲线从图形看到美元对欧元汇率在 2001 年左右处于高位，2002 年以后一直处于下跌态势。数据总体上类似于随机游走过程形式，应该是非平稳的。（三）ARIMA(p，d，q)模型阶数识别 1、确定单整阶数 d （1）用不含时间趋势项、解释变量中不含差分项的模型，即对模型进行单位检验（Unit Root Test）。假设；备择假设。在工作文件窗口，选定变量EURO，双击它，在EURO页面上，点击View\Unit Root Test\ADF，表示已经进入扩展的DF检验。选择Level(对水平变量进行单位根检验，检验系数对应的项EUROt-1)\Intercept(不含时间趋势变量)\Automatic selecttion （解释变量不含EUROt-1的差分），并且在maximum中选择0（表示差分滞后项数取0，即不含EUROt-1的差分） ttt euroeuro   1 0:0 H 0:1 H Null Hypothesis: EURO has a unit root Exogenous: Constant Lag Length: 0 (Automatic based on SIC, MAXLAG=0) t-Statistic Prob.* Augmented Dickey-Fuller test statistic Test critical values: 1% level 5% level 10% level *MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Dependent Variable: D(EURO) Method: Least Squares Date: 04/11/11 Time: 08:24 Sample (adjusted): 1993M02 2007M12 Included observations: 179 after adjustments Variable Coefficient Std. Error t-Statistic Prob. EURO(-1) C R-squared Mean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) 得到结果 t=（）（） p=（）（）要确定差分方程的样本容量 T，原有的样本容量是 180，差分后样本容量是 T=179；取α=5%，查附表 2，得临界值τ=；统计量观察值为 t=>τ=，所以接受假设 (从概率值大于也得到接受的结论 )，即认为汇率序列（EURO）是非平稳的。（ 2 ）对模型，作假设；备择假设。在工作文件窗口，选定变量 euro，双击，在 euro 页面上，点击 View\Unit Root Test\ADF，表示已经进入扩展的 DF 检验。选择 1st different(对 1 阶差分进行单位根检验，检验系数对应的项是Δeurot-1)\Intercept(不含时间趋势变量 )\User specifi 取 0（解释变量不含Δeurot-1 的差分）。得到结果 Null Hypothesis: D(EURO) has a unit root Exogenous: Constant Lag Length: 0 (Automatic based on SIC, MAXLAG=0) t-Statistic Prob.* Augmented Dickey-Fuller test statistic Test critical values: 1% level    tt euroeuro ttt euroeuro   1 2 0:0 H 0:1 H 5% level 10% level *MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Dependent Variable: D(EURO,2) Method: Least Squares Date: 04/11/11 Time: 08:36 Sample (adjusted): 1993M03 2007M12 Included observations: 178 after adjustments Variable Coefficient Std. Error t-Statistic Prob. D(EURO(-1)) C R-squared Mean dependent var -05 Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) 由软件输出结果得到回归模型 t=（）（） p=（）（）取α=5%，求样本容量 T，原来样本容量是 180，2 阶差分分后 T=178，查附表 2，得 DF 检验的临界值为τ=，对Δeuro 平稳性检验的统计量观察值为 t=<τ=，所以拒绝假设，即认为个人可支配收入一阶差分时间序列（Δeuro）是平稳的。即Δeuro~I（0），因此 euro~I（1），即 euro 是一阶单整的，从而 d=1。 2、确定自回归阶数 p 和移动平均阶数 q 因为 d=1，所以用 euro1 阶差分Δeuro 的自相关函数（ACF）和偏自相关函数（PACF）判断 p 和 q 值。生成Δeuro GENR deuro=euro-euro(-1) （也可以在 1st different 实现） 1 2    tt euroeuro 在 deuro 页面上，选 View\Correlogram\Level Deuro 的偏自相关函数（PACF）系数在 1 为，2 处为期不远，但是从 3 以后明显接近 0，所以取 p=2。 Deuro 的自相关函数（ACF）在 1 为，但是从 2 以后明显接近 0，所以取 q=1。至于 p 和 q 的最终确定还要从低开始试探，直到定出合适的模型为止。初步适合 EURO 的模型有： ARIMA(1，1，0)、ARIMA(2，1，0)、ARIMA(0，1，1)、ARIMA(1，1， 1)、ARIMA(2，1，1)。（四）ARIMA(p，d，q)模型估计与检验（1）ARIMA(1，1，0) 模型估计与检验 Quick\Estimate\LS(NLS and ARMA) 在对话框输入 d(euro) c ar(1) 常数 c 的概率太大（），接受 c=0 的假设，所以模型应该去掉常数。 Quick\Estimate\LS(NLS and ARMA) 在对话框输入 d(euro) ar(1) 模型为： t=() p=()  tt ww ttt xLxw )1(  从 p 值看，系数是显著的。从 Inverted AR Roots（自回归特征方程根的倒数）是，在单位圆之内，说明模型是平稳的。但还要对残差进行白噪声检验：在 Quick\Estimate\LS(NLS and ARMA) 在对话框输入 d(euro) ar(1) OK 出结果的页面上 View\Residual Tests\Correlogram-Q-statistics 选 K=13（由[178/10]或 178 平方根来） Date: 04/11/11 Time: 10:51 Sample: 1993M03 2007M12 Included observations: 178 Q-statistic probabilities adjusted for 1 ARMA term(s) Autocorrelation Partial Correlation AC PAC Q-Stat Prob .|. | .|. | 1 *|. | *|. | 2 *|. | *|. | 3 .|. | .|. | 4 .|* | .|. | 5 .|. | .|. | 6 .|. | .|. | 7 .|* | .|* | 8 .|. | .|. | 9 .|* | .|* | 10 .|. | .|. | 11 .|. | .|. | 12 .|. | .|. | 13 从 K=13 一行找到 Q 统计量值为，相伴概率(记为 p-Q)为 >，接受序列不相关的假设，即认为残差序列是白噪声。类似地，对模型 ARIMA(2，1，0)、ARIMA(0，1，1)、ARIMA(1，1，1)、 ARIMA(2，1，1)进行估计与检验。 ARIMA(1，1，0)，ARIMA(2，1，0)、ARIMA(0，1，1)三个检验都通过参数显著性检验，模型平稳性和可逆性检验，残差序列白噪声检验。但是模型 ARIMA(1，1，1)、ARIMA(2，1，1)没有通过检验。模型评价与比较模型 Φ1 Φ1 Φ1 R^2 p-Q ARIMA(1，1， 0) ARIMA(2，1， 0) ARIMA(0，1， 1) R^2 和 p-Q 两指标越大越好，ARIMA(1，1，0)不好，在一样好的两模型 ARIMA(2，1，0)和 ARIMA(0，1，1)中，ARIMA(2，1，0)用自回归信息预测，所以在预测方面 ARIMA(2，1，0)明显好。最终选择 ARIMA(2，1，0)：即（五）模型外推应用已知 2007：12，2007：11，2007：10 的汇率分别是：，，，利用 ARIMA(2，1，0)模型对 2008 年 1 月美元对欧元汇率进行预测。 21   ttt www ttt xLxw )1(  21 )1()1()1(   ttt xLxLxL 321   tttt xxxx 1211     ttttt uxxxx

联系我们

智库文档公众号

客服微信

实验一 ARIMA模型建立与应用.doc

下载

标签

相关文档

相关专题更多

联系我们

意见反馈

标签

相关文档

相关专题 更多

联系我们

意见反馈

相关专题更多