- 1 -
基于多因素的铁路货运量 BP 神经网络预测研究
摘 要:铁路货运量作为铁路运输生产的基础工作之一,是铁路运输企业制定正确市场营销
战略的前提条件。本文在对铁路运输影响因素进行定性及定量分析的基础上,选取了国内生
产总值、第二产业比重、原煤产量、原油产量等 10 个指标作为影响因素,运用 BP 神经网
络模型构建它们与铁路货运量之间的复杂映射,从而对铁路货运量进行预测,并以近 12年
铁路货运量为实例进行验证。
关键词:铁路货运量;预测;BP神经网络
0 前言
铁路货运量是指一定时期内以重量单位计算的由铁路实际运输的货物数量,它是货运市
场中重要的基础数据,也是处理好铁路内部各部门协调发展的前提。科学、准确地预测铁路
货运量是安排铁路运输生产,最大限度发挥铁路运能的理论依据。
目前,对铁路货运量预测的方法,主要包括时间序列(算术平均,移动平均,加权平均,
指数平滑等)预测法[1-2],灰色预测法[3-4],ARMA 预测模型,马尔可夫预测模型[5]或者综
合以上两种或者两种以上方法进行组合预测[6]的方法等。虽然这些预测方法所用的模型各不
相同,但究其实质,其做法均是从时间序列中找规律,利用历年的货运总量数据通过各自的
模型预测出未来的货运总量,属于因果分析,趋势预测,即只能反映变化趋势,而不能反映
出影响货运量的内部因素对货运量的影响,故这些方法还是存在着一定的局限性。
近年来,虽然人们越来越认识到对货运量内部影响因素进行研究的重要性,但是这一方
面的具体研究成果仍然较少,且大部分的研究对各影响因素的分析均只有定性分析而缺少定
量分析。如文献[7]、[8]都首先对影响铁路货运量的因素进行了定性分析,建立神经网
络模型对运量进行预测,但文献中影响因素均为人为给出,并未对各影响因素进行定量分析,
带有一定的人为主观色彩。
本文将在定性分析影响我国铁路货运量的因素的基础上,从中选取一些影响因素,然后
对这些因素进行关联度的定量分析,得出各因素与铁路货运量之间的量化关系,将与铁路货
运量有密切关系的影响因素带入所设计的 BP 神经网络,实现各因素与铁路货运量的复杂映
射,从而对铁路货运量进行预测。最后以近 12 年的数据为实例对预测的准确性进行验证。
1 铁路货运量影响因素分析
定性分析
(1)国民经济发展的影响
一个国家经济的发展在很大程度上能够带动国家铁路货运量的提高,历史数据证明,铁
路货运量的增长与国民经济的增长之间有着密切的关系。能够反映一个国家经济发展的指标
包括国民生产总值(GNP),国内生产总值(GDP)等。其中国内生产总值为指按市场价格
计算的一个国家(或地区)所有常住单位在一定时期内生产活动的最终成果。国民生产总值为
国内生产总值加上来自国外的净要素收入。而货运量是在本国范围内进行计算的,显然,国
内生产总值相比更能说明问题。因此,本文将采取国内生产总值作为国民经济发展的代表指
- 2 -
标。
(2)产业结构的变动
产业结构的变动必然会引起全社会货运总量及各运输方式货运量的变化,对于铁路货运
量而言,占运量绝大比重的各工业产品的变动对货运量的影响尤其巨大。故本文将采用第二
产业(工业)占国内生产总值的比重作为反映产业结构的指标。
(3)能源、冶金等工业及农业的发展
由于我国能源资源分布的不均衡,而其他交通方式在运送大宗货物的局限性,决定了由
铁路来承担煤、钢铁等大宗货物的中长距离运输。历年资料数据显示,煤、金属及非金属矿
石、钢铁、原油等能源资料的运量占了铁路货运量的 60%以上,且比重仍在不断上升中。
这些资源产量的变化将直接影响铁路货运量的变化。除了工业产品外,粮食等农产品的运输
也是铁路货物运输中不可忽略的一部分。故本文之后将会分析原煤、原油、钢铁、粮食等产
量对铁路货运量的具体影响。
(4)各运输方式的发展
近年来,随着经济的发展,虽然铁路货运量比较以前有较大的提高,但是铁路货运量的
增长并不跟全社会货运总量的增长呈等比例增长,公路运输占了全社会货运市场的绝大比
重。故公路运输等其他交通方式的发展对铁路货物运输也有着直接的关系。而各交通方式占
货运市场的份额能够直观地体现出各交通方式在交通体系中的地位。故本文之后将会分析各
交通方式占货运市场的份额变化对铁路货运量的影响。
(5)对外贸易的发展
随着我国对外贸易的不断发展,传统单一的运输方式逐步向多式联运发展。越来越多的
大宗货物在远洋运输及铁路运输之间来回变动。故本文之后将对港口货物吞吐量对铁路货运
量的影响作出分析。
(6)国家政策的变动
国家政策带有较重的人为色彩,一般难以量化,但可以通过国家对某些行业的投资多少
及投资方向来间接体现。国家对社会基本建设的投资多少不仅能看出国家对某些基本行业的
扶持力度,同时基建所用到的建材、矿建等也是铁路运输的重点。
定量分析
在上述的定性分析中,选取了一些对铁路货运量会造成影响的因素,但是这些影响因素
之间哪些是主要的,哪些是次要的,主要因素影响有多大,次要因素的影响又有多少,是否
到达可以忽略的情况等等,这些都需要对各影响因素进行定量分析。本文将根据灰色关联度
的理论[9]对各因素进行定量分析。
灰色关联度确定如下:
第一步:数据无量纲化。由于各数据的单位,数量级各不相同,如不无量纲化,将会导
致之后计算的不准确。本文采取初值化进行数据的无量纲化,即将每一组数据均用该组的第
一个数据去除,得到一列新的数据列。如:
设原始数据列为 ( ) ( ) ( ) ( )( )ny3y,2y,1yy iiiii "= ,则无量纲化后的数据列为
( )
( )
( )
( )
( )
( )
( )
( ) ⎟⎟⎠
⎞
⎜⎜⎝
⎛=
1y
ny
1y
3y
,
1y
2y
,
1y
1y
x
i
i
i
i
i
i
i
i
i " , ( )( )01yi ≠ 。 (1)
第二步:求差序列。
- 3 -
各个时刻 ix 与 0x 的绝对差为 ( ) ( )kxkx i0i −=∆ ,( n,2,1ki, "= ) (2)
第三步:求两级最小差与最大差。
两级最小差: ( ) ( ) ( )( )kxkxminminmin i0kii −=∆ , (3)
两级最大差: ( ) ( ) ( )( )kxkxmaxmaxmax i0kii −=∆ 。 (4)
第四步:计算关联系数。
关联系数 ( ) ( ) ( ) ( ) ( )( ) ( ) ( ) ( )
k
i0kii0
i0kii0ki
i −+−
−+−
=δ
( ) ( ) (max)
(max)(min)
ii0
ii
∆+−
∆+∆= (5)
第五步:计算关联度
关联度 ( )∑
=
=
N
1k
ii kN
1 δγ (6)
2 BP 神经网络
人工神经网络(Artificial Neural Network,ANN)[10-11]是近些年逐步发展起来的一门
十分活跃的交叉学科,其本身所具有的非线性映射、并行处理、自适应学习和鲁棒容错等特
性,使其成为现今人工智能学科方面的代表,并被广泛用于模式识别、人工智能、(如自然
语言处理、市场分析、预测估值、密码破译、智能机器人等)、控制工程、优化计算、信号
处理等领域。
BP 神经网络即基于误差反向传播算法(BP 算法)的多层前向神经网络,是迄今为止
最著名的多层网络学习算法,也是人工神经网络中应用最广泛的算法模型。典型的 BP 网络
是三层前馈网络,即输入层、隐含层和输出层,其结构图如图 1 所示。
图1 三层BP神经网络结构图
BP 网络的学习过程分为两个阶段:第一个阶段是输入已知学习样本,通过设置的网络
结构和随机赋予的权值和阈值,从网络的第一层向后计算各神经元的输出;第二个阶段是对
输入层 隐含层 输出层
为神经元
中国科技论文在线
- 4 -
权值和阈值进行修改,从最后一层向前计算各权值和阈值对总误差的影响,据此对各权值和
阈值进行修改。以上两个过程反复交替,直到网络的实际输出与样本输出之间的误差逐步减
小的规定的精度为止。由于误差逐层往回传递,以修正层与层之间的权值和阈值,所以这种
算法被称误差反向传播(Back Propagation)算法[12]。
3 铁路货运量预测
原始数据
为了利用模型进行数据预测,我们用近 12 年的基础数据对相关的参数进行计算[13]。
如表 1 所示。其中,Y 为铁路货运量(万吨),X1~X10分别表示国内生产总值(亿元),
第二产业比重(%),原煤产量(亿吨),原油产量(万吨),钢材产量(包括生铁,粗钢,
钢材)(万吨),粮食产量(万吨),基建投入(亿元),港口货物吞吐量(万吨),铁路
份额(%),公路份额(%)。
表1 原始数据
年份 Y X1 X2 X3 X4 X5
1996 171024
1997 172149
1998 164309 16100
1999 167554 16000
2000 178581 16300
2001 193189
2002 204956 16700
2003 224248
2004 249017
2005 269296
2006 288224
2007 314237
续上表
年份 Y X6 X7 X8 X9 X10
1996 171024 85152
1997 172149 90822
1998 164309 92237
1999 167554 105162
2000 178581 125603
2001 193189 142634
2002 204956 166628
2003 224248 201126
2004 249017 246074
2005 269296 292777
2006 288224 342191
2007 314237 388200
中国科技论文在线
- 5 -
各影响因素与铁路货运量的灰色关联度
根据公式(1)至(6)及给定的基础数据,计算得各影响因素与铁路货运量的关联度。
以计算国内生产总值与铁路货运是把关联度为例:
1δ =(1,,,,,,,,,,,
)
则 ( )∑
=
=
12
1k
11 k12
1 δγ =
(1++++++++++ +)/12=
同理可得,Y 与 X2~X10 之间的灰色关联度 2γ ~ 10γ 依次为 ,,,,
,,,,。
由以上各关联度可以看出,所有的关联度都在 以上,表明以上十种因素对铁路货运
量均有着较为紧密的联系,故本文将将这十种因素均带入下一步计算中。
BP 神经网络预测结果
MATLAB[14]提供了神经网络工具箱,利用此工具箱将可以方便地进行神经网络的计算,
因此本文将在 MATLAB 基础上构建 BP 神经网络,进行货运量的预测。
对于本算例的 BP 神经网络,输入层包含 12 个神经元,输出层包含 1 个神经元,隐含
层神经元数目经训练后定为 13,训练函数采用“traingdx”,学习算法采用“learngdm”,
输入层到隐含层的传输函数设为“tansig”,隐含层到输出层的传输函数采取“purelin”,动
量因子为 ,学习率为 。
将各组数据归一化后带入 BP 神经网络,进行网络训练。
经过 637 步运算,算法收敛。训练过程网络性能变化如图 2 所示。
图2 BP网络训练性能变化曲线
数据分析结果如表 2 所示。
表2 1996年~2007年货运量BP预测结果 单位:万吨
年份 实际运量 预测运量 相对误差%
1996 171024 170735
1997 172149 172437
1998 164309 163876
中国科技论文在线
- 6 -
1999 167554 168062
2000 178581 178626
2001 193189 193274
2002 204956 204763
2003 224248 224214
2004 249017 249067
2005 269296 269287
2006 288224 288225
2007 314237 314231
从表 2 可以看出,1996 年~2007 年货运量预测最大相对误差为 %,最小相对误差
为 %,结果是非常令人满意的。
预测数据同实际数据的拟合图如图所示。可以看出,预测值同实际值的拟合的结果相当
令人满意。
图3 1996年~2007年BP预测拟合图
(注释:“—”实线部分为实际货运量曲线;“○”为神经网络预测数据)
4 结论
铁路货运量是铁路货运市场中一项重要基础数据。针对当前各预测方法偏向因果分析及
趋势预测,并不能反映出影响货运量的内部因素的情况,本文对铁路货运量的影响因素进行
了定性及定量的分析。分析表明,原煤产量为铁路货运量最大的影响因素,同时,原油产量、
铁路在总货运市场的占有率、国民经济等因素对铁路货运量的变化也有着较深的影响。针对
这些影响因素,铁路应该加强对原煤、原油等大宗货物的管理,提供有质服务,以提高铁路
在货运市场的地位,提高铁路货运量。
在对各影响因素进行分析之后,本文构建了一个三层 BP 神经网络。结果表明,算法具
有良好的收敛性,很好地实现了各影响因素与铁路货运量之间的复杂非线性映射,预测结果
令人满意。
中国科技论文在线
- 7 -
参考文献
[1] George ,Gwilym ,Gregory 著,顾岚译.时间序列分析预测与控制[M],北京:
中国统计出版社,1997.
[2] C.查特菲尔德著,骆振华译.时间序列分析引论[M],厦门:厦门大学出版社,1987.
[3] 张永杰. 灰色系统理论在道路货运量、货运周转量预测中的运用[J]. 交通运输系统工程与信息.2003,01:
75~79
[4] 刘思峰,郭天榜,党耀国等.灰色系统理论及其应用[M],北京:科学出版社,1999.
[5] 胡奇英.马尔可夫决策过程引论[M],西安:西安电子科技大学出版社,2000
[6] 杨鹏程,龙建成,马建军. 铁路货运量的组合预测方法研究[J]. 物流科技,2006,11:66~68.
[7] 匡敏,胡思继,刑培昱,武旭. 基于国民经济大系统下的铁路货物运输量预测方法的研究[J]. 北方交通
大学学报(社会科学版).2003,12:21~24
[8] 赵继阳,熊天文. 用改进的前向神经网络预测铁路货运量[J]. 西南交通大学学报,1998,6:252~256.
[9] 邓聚龙.灰色系统基本方法[M],武汉:华中理工大学出版社,1996.
[10] 焦李成.神经网络系统理论[M],西安:西安电子科技大学出版社,1996.
[11] 阎平凡,张长水.人工神经网络与模拟进化计算[M],北京:清华大学出版社,2005.
[12] 周开利,康耀红编著. 神经网络模型及其 MATLAB 仿真程序设计[M],北京:清华大学出版社,2005.
[13] 中国统计年鉴[M],2008.
[14] 刘卫国主编.MATLAB 程序设计教程[M],北京:中国水利水电出版社,2005.
BP neural network forecast method for railway
freight volumes based on multi-factors
WU Xiao Ling, FU Zhuo,
School of Traffic and Transportation Engineering, Central South University, Changsha (410075)
Abstract
The forecast of railway freight volume is one of fundamental works for railway transportation
production and the precondition for working out the suitable railway transportation market strategy.
Based on the qualitative and quantitative analysis of the influence, the paper selects GDP, proportion of
the second industry, output of coal, output of oil and other 10 indicators as the influence index, then
constructs the complex mapping among them by BP neural network model and tests the forecast results
by the use of the real data of railway freight volumes in the last 12 years.
Keyword:railway freight volumes; forecast; BP neural network
作者简介:
吴晓玲(1985-),女,福建泉州人,在读硕士研究生,交通运输规划与管理专业;
符卓(1960-),男,中南大学交通运输工程学院教授, 博士生导师, 研究方向为交通运输规
划与管理,物流配送管理
中国科技论文在线