基于时间序列的矿井瓦斯涌出量预测方法
孟海东 ,孙搏,司子稳,王瑞智,施兰兰
(内蒙古科技大学矿业工程学院,内蒙古 包头 014010)
摘要:由于矿井瓦斯浓度的变化受多种因素共同影响, 矿井瓦斯涌出量预测经常出现无法获得一部分
变量的情况。针对该问题,提出了一种基于时间序列的矿井瓦斯涌出量预测方法,详细介绍了采用时间序
列 AR 模型对矿井瓦斯涌出量进行预测的具体实现。实验结果表明,该方法能准确预测矿井瓦斯涌出量。
关键词:矿井;瓦斯涌出量;预测;时间序列;参数估计;AR 模型
A
Prediction Method of Gas Emission of Mine Based on Time Series
MENG Hai-dong,SUN Bo,SI Zi-wen ,WANG Rui-zhi,SHI Lan-lan
(School of Mining Engineering of Inner Mongolia University of Science and Technology,
Baotou 014010, China)
Abstract: Because the change of gas concentration of mine is influenced by various factors, so prediction of
gas emission of mine can’t get some variables. In view of the problem, the paper proposed a prediction method of
gas emission of mine based on time series. It introduced implementation of using AR model of time series to
predict gas emission of mine. The experiment result showed that the method can predict gas emission of mine
accurately.
Key words: mine, gas emission, prediction, time series, parameter estimation, AR model
0 引言
我国煤矿瓦斯事故已占到煤矿生产过程所发生事故的 80%以上,造成的伤亡占特大事故伤亡人数的
90%[1]。因此,必须采取有效的防治措施,而防治工作的关键在于瓦斯涌出量预测。矿井瓦斯涌出量是一
个动态过程,瓦斯浓度的变化受多种因素共同影响, 矿井瓦斯涌出量预测经常出现无法获得一部分变量的情
况。而时间序列分析法是根据客观事物发展的连续规律性,运用过去的历史数据,通过统计分析,进一步推测
未来发展趋势的一种方法,由于该时间序列取自某一个随机过程,而该过程的随机特征不随时间的变化而
变化,所以又称平稳时间序列分析法。时间序列分析法可通过建立一个描述瓦斯涌出量在一定时间和空间
内变化发展的动态模型,反映瓦斯涌出量的变化规律,预测瓦斯涌出量的趋势,对实际的瓦斯预测有一定的指
导意义。
收稿日期:2010――
作者简介:孟海东(1958―),男,内蒙古托克托县人,教授,博士,硕士研究生导师,主要从事矿产
资源数据挖掘方面的研究工作。E-mail:51428554@
mailto:51428554@
1 时间序列分析法
时间序列分析法就是通过编制和分析时间序列,根据时间序列所反映出来的发展过程、方向和趋势,
进行类推或延伸,借以预测下一段时间可能达到的水平。其内容包括:收集与整理历史资料;对这些资料
进行检查鉴别,排成数列;分析时间数列,从中寻找随时间变化变化的规律,得出一定的模式;以该模式
预测将来的情况。常见的时间序列模型有自回归(AR)模型、滑动平均(MA)模型和自回归滑动平均(ARMA)
模型。由于 AR 模型能够更好地反映系统的本质特征,并且 AR 模型是无偏估计。因此,本文采用 AR 模
型进行建模,其形式为
(1)
式中: 为模型参数; 为白噪声序列,它反映所有其它因素干扰。
式(1)表明, 是自身过去的观察值 的线性组合,常记为 AR(p),其中 p 为模
型的阶次。若记
(2)
则式(1)可以改成算子形式:
(3)
式 中 : B 为 移 位 算 子 , 称 为 模 型 AR ( p ) 的 特 征 方 程 , 特 征 方 程 的 p 个 根
,称为 AR 模型的特征根。如果 p 个特征根都在单位圆外,即
(4)
则称 AR 模型是稳定的,式(4)又称平稳条件。
2 AR(p)模型建模过程
在建模之前应先对时间序列的均值进行检验,如果样本均值的绝对值小于样本标准差 2 倍,则序列
可看成零均值序列,否则,应对序列进行零均值化处理。然后按照如下步骤建模。
(1)模型定阶
模型定阶就是 AR 模型中阶数 p 的确定,一般来说 AR 模型中阶数 p 是未知的,若应用模型进行仿真
预测,就应该首先确定 p 的值。其确定方法主要有 AIC 准则估计法和 BIC 准则估计法等等。
AIC 准则是 1971 年日本学者赤池(Akaike)给出的一种适用面非常广泛的统计模型选择准则,称为最小
信息准则(Akaike Information Criterion),运用这一准则,可以在 AR 模型参数估计的基础上估计阶数 p,其
作法是首先引入以下的 AIC 准则函数:
(5)
其中 为 p=k(1≤k≤P)时 的估计,而 p=0 时 ,P 为 p 的估计上界,一般 P 的取值由
实际情况由经验而定,取 满足:
1 1 2 2 ( )t t t p t py y y y e t L
1 2, p L ( )e t
ty 1 2, ,t t t py y y L
2
1 21 0
p
pB B B L
( ) ( )p tB y e t
( ) 0p B
, 1, 2,3,i i p L
| | 1, 1, 2,3,i i p L
2 2( ) ln ( ) 0,1,
k
AIC k k k P
m
L L
2 ( )k% 2 2 (0)r %
p%
(6)
则此 为模型阶数 p 的 AIC 准则估计[3]。
(2)参数估计
AR(p)模型的参数估计方法较多,AR 模型参数估计的方法有很多,主要包括最小二乘法、解
Yule-Walker 方程法、极大似然估计法和 Burg 算法等。上述方法中,最小二乘法进行参数估计比较简单,
参数估计无偏,精度高,本文选用此种方法进行估计。已知样本序列 X={x1,x2,…,xn}将式(1)写成矩阵
形式,有
(7)
其中 , ,估计算法如下:
令
(8)
求 ,使 ,称此时的 为最小二乘估计,由最小二乘估计的运算方法可得
与 的最小二乘估计为:
(9)
(10)
(3)模型检验
由于 AR(p)模型的识别与估计是在假设随机扰动项是一白噪声的基础上进行的,因此,如果估计的模
型确认正确的话,残差应代表白噪声序列;如果残差不代表白噪声序列,则说明模型的识别与估计有误,
需重新进行识别与估计。
(4)预测及评价
对未来的数据进行预测,计算出相对误差及平均误差率(平均误差率的大小从一定程度上反应预测的
精度):
(11)
式中:X 表示相对误差,其平均值即为误差平均率;qs 为统计值;qr 为统计预测值。
3 实例分析
本文以某矿某月 01—15 日实际检测的瓦斯涌出量(见表 1)为例,实现对未来三天瓦斯涌出量的预测。
1
( ) ( )min
k P
AIC p AIC k
%
p%
y X e
1
2
p
p
m
x
x
y
x
M
1 1
2 2,
p
p
p m
e
e
e
e
M M
2
2
1 1 2 2
1 1
( ) ( )
m m
n n n p n p
p p
S x x x x e n
L
̂ ˆ( ) min ( )S S ̂ k
2
1ˆ ( ' ) 'X X X y
2 2
1
1 1ˆ ˆ( ) ( )
m
p
S e n
m p m p
100%s r
r
q q
X
q
表 1 某月实际检测的瓦斯涌出量 (m3•min-1)
日期 瓦斯涌出量 日期 瓦斯涌出量 日期 瓦斯涌出量
1 日 7 日 13 日
2 日 8 日 14 日
3 日 9 日 15 日
4 日 10 日 16 日
5 日 11 日 17 日
6 日 12 日 18 日
设表 1 所示的样本序列为 Yt={y1,y2, …, yt},样本长度 t=15,步长为 1 d。
(1)将样本序列零均值化。从表 1 可看出,1—7 日瓦斯涌出量在逐渐减少,8—15 日趋向平稳,样
本均值显著非零。用 Yt 表示时间序列, 表示样本均值,则
(12)
令 ,可得到时间序列零均值{Xt},如表 2 所示。
表 2 时间序列零均值
t Xt t Xt t Xt
1 7 7 3 13 3
2 7 8 3 14 3
3 7 9 3 15 3
4 7 10 3
5 7 11 3
6 3 12 3
(2)计算自相关函数 和偏自相关函数 。
在 AR(p)模型中:
(13)
式(13)写成矩阵形式为
Y
15
1
1
15 ti
Y y
t tX Y Y
ˆt ˆkj
1 1 2 1 1
2 1 1 2 2
1 1 2
p p
p p
p p p p
L
L
L L
L
(14)
(15)
利用公式(15)、(16)计算 AR 模型的自相关函数与偏自相关函数并绘制成曲线,如图 2、图 3 所示。
图 2 自相关函数 曲线 图 3 偏自相关函数 曲线
(3)建立模型
从图 2、图 3 可看出, 随着 t 的增大而衰减,可认为是拖尾的;而偏自相关函数 在零附近波动,
可认为是截尾的。由自相关函数与偏自相关函数分别具有拖尾性和截尾性,可初步认定选用 AR(p)模型
是合适的,然后确定 p 的值以及模型的参数。
根据公式(5)(6),在 AR(p)模型中,选取不同的 p 值,所得到的 AIC 值不同,当使 AIC 值最小
时的 p 值即为模型的阶数,本文利用 Matlab 工具箱中的信号处理中的 Levinson 函数对 AR 模型进行仿真
[5],使阶数 p=0 开始依次递增,当 AR(p)模型与原始序列较为一致时,即满足仿真要求,确定 p 的值。
图 4 3 阶 LPC 估计值与原始信号比较及预报误差自相关函数曲线
从图 4 可看出,阶数为 3 时,能仿真与原始序列比较一致的模拟序列,即得到 AR(3)模型参数比
0 5 10 15
0
1
0 5 10 15
-1
0
1
0 5 10 15
34
36
38
40
42
44
46
48
50
52
原 始 信 号
采 样 点
幅
度
原 始 信 号
LPC估 计
-20 -10 0 10 20
0
1
预 报 误 差 的 自 相 关 函 数
延 迟
归
一
化
值
1 2 11 1
1 1 22 2
2 1 33 3
1 2 3
1
1
1
1
p
p
p
p p pp p
L
L
L
M M M M MM M
L
1,2,3, ,
ˆ
0 1,
j
kj
j p
j p k
L L L L
L L L L
ˆt ˆkj
ˆt ˆkj
较准确,由公式(9)(10),利用 Matlab 的最小自回归系数分别为 、、、 。
(4)预测。
按 AR(3)的预测公式:
(17)
得出 y16= ,y17=,y18=,由式(12)可得出平均误差率为 %,可说明瓦斯涌出量预测值
比较可靠。
4 结论
时间序列预测法是工程统计中的常用方法,可利用它建立煤矿瓦斯涌出量与深度的函数关系。能够对
矿井中未开采的区域进行预测,预测精度高,计算简单,具有很强的实际操作性;为了增强该方法的通用
性,需要开展广泛的实验,更多地获得煤矿瓦斯涌出量在各种环境条件下的实测数据,建立一套完整详细
的瓦斯涌出量数据库,进而选定条件由数据库中的实测数据对瓦斯涌出量进行仿真预测[6];其次,在建立
时间序列时,要注意数据的准确性,同时还要注意煤层赋存条件及地质构造的影响,以提高预测的准确性。
参考文献:
[1]施式亮,宋译,何利文,等.矿井掘进工作面瓦斯涌出混沌特性判别研究[J].煤炭学报,2006,31(6):
58-62.
[2] RABINER .语音数字信号处理[M].北京:电子工业出版社,1993.
[3] QUATITERI T F.离散时间语音信号处理--原理于应用[M].北京:电子工业出版社,2004.
[4]宿晶亮,栗苹,刘宁.AR 模型在直升机声学环境模拟中的应用[J].探测与控制学报,2001,23(2):45-48.
[5]杨位钦,顾 岚.时间序列分析与动态数据建模[M].北京:北京工业学院出版社, 1986.
[6]宿晶亮,栗苹,刘宁.AR 模型在直升机声学环境模拟中的应用[J].探测与控制学报,2001,23(2):45-48.
作者简介:孟海东,(1958-)男,内蒙古托克托县人,教授,博士,硕士研究生导师,从事矿产资源数据
挖掘方向的研究和工作。
邮箱:51428554@
联系地址:包头市内蒙古科技大学矿业学院 08 研究生 3 班 孙搏
邮编:014000
联系电话:15847296927
1 2 t t ty y y y
mailto:51428554@