第三篇:技术经济预测
技术经济分析的一个重要特征就是“预测”性,是在项目尚未实施前进行分析和
研究、论证。因此熟悉和掌握现代的预测方法是进行技术经济分析的一个至关重
要的基本技能。
目前在众多的技术经济分析方法里所介绍的是线性预测,即把所要求讨论的
两个(或等多)的变量之间的关系认定为线性关系,与之相对应的有套较完整的
回归方法和检验手段。但是,这还远远不够,因为在实践中,我们所遇到的问题
中,变量与变量之间的关系往往是非线性的,要求我们用相应的非线性预测方法
来讨论和建立变量之间的函数问题。
第七章:线性回归
线性回归的前提假设是:所研究的变量之间具有线性的关系。变量之间所构
成的函数关系为线性的——一次函数。
§ 一元线性回归
我们知道,变量之间存在着两种关系,第一种是确定性关系。即变量之间相
互制约,通过一些已知的变量就可以精确地求出另外一些变量的值。如:运动定
律中的 F=am 知道其中任何两个变量的值。就能够求出第三个变量的值;第二种是
非确定性关系。然而,非确定关系中,有些变量之间仍然存在着某些相关的因素,
如我们常说的市场需要量与人们的收入之间的关系。在非确定性关系中,还有些
变量之间毫无关系,如人的体重与树木的高度等,这种关系称为完全无关系。
确定性关系是函数关系,导数学领域里的事情;非确定性关系是数理统计的
内容。
所谓回归分析就是研究相关关系的变量之间的关系。
一、一元线形回归模型的建立
如果两个相关的变量有一序列的原始数据{(x1,y1)(x2,y2)……,(xn,yn)}在
直角平面坐标系中的离散图呈线性分布趋势。则用线形回归方法求其近似表达式(回
归模型)。
.
. .
. .
1、设回归方程式为
baxy *
),( *jj yx
),( jj yx
( 为两待定参数)
2、设定误差
显然,这里得出的估计值与实际值 之间有误差。即:
3、最小二乘法原理
为了使描述的直线最能代表离散图的趋势,根据最小二乘法的原则,必须使
这些误差的平方和为最小。
4、极值原理
根据 , 这里有两个待定参数 ,于是,依极值原理有:
解联立方程组
………………………(1)
二、一元线性回归应用
[例 1:某一亩实验田每年使用化肥和粮食的产量如下表所示,求:当化肥施用
到 150 斤和 180 斤时,相应的粮食灿烂是多少?
各年所施化肥量 70 74 80 78 85 92 90 95
各年粮食产量 510 600 680 700 900 1020 1000 1100
各年所施化肥量 92 108 115 123 130 138 145
各年粮食产量 1150 1100 1180 1220 1250 1280 1300
解:设化肥的施用量为 x,粮食产量为 y
baxy * ba,
y jjj yy
*
Qmin
n
j
n
j
jjj yy
1 1
2*2 )(
n
j
jj baxyQ
1
2)(min ba和
0
0
b
Q
a
Q
n
j
jj
n
j
jjj
baxy
xbaxy
1
1
0)1)((2
0))((2
22
2
22
)(
)(
jj
jjjjj
jj
jjjj
xxn
yxxyx
b
xxn
yxyxn
a
于是根据以上的统计资料有抽样序列 , 已知
计算数据: ;
;
;
;
于是,由一元线形回归方程的待定系数公式有:
故其回归方程为:
于是,当 x=150 时, 得出 =1470(公斤)
当 x=180 时, 得出 =1950(公斤)
[*附录:当自变量 为年(或其他时间表示时),可以简化系数 的表达式
ⅰ当年数为奇数时,则以中间的一年为原点。即:令 =0 并将 的值以一年为计算单位。此
时,时间的序列就相应地变为:……-3,-2,-1,0,1,2,3,……
ⅰ当年的系数为偶数时,则以中间两年之中点为原点。令其为零,并将 的值以半年为计算单
位。此时,时间序列就相应地变为:……-5,-3,-1,1,3,5……
因此有: 得出:
…………………………(2)
15
),( jj yx 15n
15
1
1515
j
jx
15
1
14990
j
jy
15
1
2 161125
j
jx
15
1
1591940
j
jj yx
2295225)( 2
15
1
j
jx
229522516112515
1591940151514990161125
)(
229522516112515
149901515159194015
)(
22
2
22
jj
jjjjj
jj
jjjj
xxn
yxxyx
b
xxn
yxyxn
a
* xy
150y
180y
x ba,
中x x
x
n
j
jx
1
0
n
y
b
x
yx
a
j
j
jj
2
[例 2:已知某产品 1974 年至 1985 年的销售资料如下表。请预测 1988 年的销量。
单位(吨)
1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985
500 510 480 600 600 660 580 700 680 740 790 960
解:设时间序列为,因为是偶数年,故取 1979 到 1980 年的中间点为原点。于
是列表如下所示:
年份 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985
-11 -9 -7 -5 -3 -1 1 3 5 7 9 11
500 510 480 600 600 660 580 700 680 740 790 960
计算:
; ;
所以根据回归方程有
故回归方程为: y=+650
当 1988 年时, x=17
y=×17+650= 吨
§ 多元线性回归
假定因变量 与自变量 之间存在线形关系。
一、多元线性回归模型的建立
1、取样本点
即:
jx
jy
0jx
5722jx 7800jy 10020jj yx
600
12
7800
12
10020
572
2
j
j
jj
y
b
x
yx
a
y kxxx ,,, 21
nkjjjj
xxxy ),,,,( 21
knnnn
k
k
k
xxxy
xxxy
xxxy
xxxy
21
323133
222122
121111
2、设定多元线性回归模型
回归方程: …………………(3)
3、取误差变量
= ( ) ………(4)
4、最小二乘法原理
= …………………..(5)
5、极值原理
…………….(6)
二、多元线性回归的矩阵形式
1、引进向量、矩阵的概念
(1)矩阵:
(2)向量:
kk xbxbxbby 22110
*
*
jjj yy
kjkjjj xbxbxbby 22110 nj ,,2,1
n
j
jj yyQ
1
2* )(min
n
j
kjkjjj xbxbxbby
1
2
22110 )(
0))((2
0))((2
0)1)((2
22110
122110
1
22110
0
kjkjkjjj
k
jkjkjjj
kjkjjj
xxbxbxbby
b
Q
xxbxbxbby
b
Q
xbxbxbby
b
Q
knnn
k
k
xxx
xxx
xxx
A
21
22212
12111
1
1
1
(3)线性方程组:
………………………(7)
简化形式为:
………………………(8)
2、简化模型
=
=
=
=
= ………………………(9)
ⅰ
又ⅰ 是一个数,
ⅰ
于是有:
…………………………(10)
3、假设条件
如果满足条件: 可逆,则有:
………………………………(11)
ny
y
y
y
Y
3
2
1
kb
b
b
b
b
2
1
0
n
3
2
1
nknknnn
kk
kk
xbxbxbby
xbxbxbby
xbxbxbby
22110
2222212102
1121211101
AbY
n
j
jj yyQ
1
2* )(
n
j
j
1
2
T
)()( AbYAbY T
))(( AbYAbY TTT
AbAbYAbAbYYY TTTTTT
YAbAbY TTTT )(
AbY T
YAbAbY TTT
AbAbYAbYYQ TTTTT 2
0)(22
bAAYA
b
Q TT
AAT
YAAAb TT 1)(
§ 回归模型的检验
上面得出的回归模型是以假定两个相关变量存在着线形相关的基础上的,然而,
这种线形假定究竟是否符合客观实际?它们之间的线形相关程度究竟如何?还要
进一步用统计理论加以检验。
目前,检验一元线形回归最常用的方法是 检验和 t 检验.
一、 检验(相关系数的检验)
1、计算相关系数
………………………(12)
[其中: ; (平均值)]
将平均值公式代入(12)有:
…………………(13)
2、判别
通过(12)或(13)式的计算可知,
(1)当 =1 时:
说明变量 完全线形相关。所有的经验点 都严格地分布在一条直线
上,且 为 的增函数。
(2)当 =0 时:
说明变量 不存在线形关系。 (ⅰx 与 y 毫无关系;ⅰx 与 y 属于非线形关
系)
(3)当 =-1 时:
说明变量 完全线形相关,且 y 为 x 的减函数
(4)一般地, 在(-1,1)之间,而且 的绝对值越大,说明 x 与 y 有较强的线
性关系,线性回归效果越好;反之, 的绝对值越小,说明 x 与 y 的线性关系越差,
22 )()(
))((
yyxx
yyxx
jj
jj
n
x
x j
n
y
y j
])(][)([ 2222 jjjj
jjjj
yynxxn
yxyxn
]1,1[
yx,
njj
yx ),(
y x
yx,
yx,
线性回归效果越差。
3、取置信水平
为置信水平,一般取 在 ~ 之间,( 取得越小,表明越严格),同
时查 ——表格(相关系数检验数表),求出
4、比较 与
在实际检验中,先计算出 的值,并取一置信水平 ,然后查表得出在置信水
平 下的标准相关系数 ,然后再用 与 比较。
当 > 时,则认为在置信水平 下,x 与 y 是线性相关的;
当 < 时,则认为在置信水平 下,x 与 y 是线性无关的。
[例 3:对例 1 进行 检验,取置信水平 =
解:则有:
=
=
由 n=15, = 查表得 =
= > =
所以在置信水平 x= 下,x 与 y 是线形相关的(回归效果良好)。
二、t 检验
1、对给定的问题,求出回归模型之后,计算下列数据
y
x
])(][)([ 2222 jjjj
jjjj
yynxxn
yxyxn
]2247001001593710015][229522516112515[
149901515159194015
r=1
r=-1
2、取置信水平
取置信水平 ,且查 分布表求得:
3、比较
(1)如果 > ,则说明在此置信水平下,回归效果良好;
(2)如果 < ,则认为在此置信水平下,回归效果不好。
[例 4:仍对例 1 进行 t 检验
解:因为 =101 =
所以
而
所以, =207731
=
n
x
x j
n
y
y j
n
x
xxx jjj
2
22 )()(
n
y
yyy jjj
2
22 )()(
222 )()(
xxayy jj
2
)()( 222
n
xxayy
S jj
2)( xx
S
a
j
t
)2(
2
n
t
2)( xx
S
a
j
)2(
2
n
t
2)( xx
S
a
j
)2(
2
n
t
x
y
8110)( 2xx j
957095)( 2yy j
a a
222 )()(
xxayy jj
2
)()( 222
n
xxayy
S jj
215
207731
=
取置信水平 =
则
于是,查表
因为 <
所以,说明在此置信水平下回归效果良好。
2)( xx
S
a
j
2
132152 n
)13( t
)13( t
第八章 非线性预测
§ 季节性波动曲线预测
在实际中,许多商品,尤其是消费品,都是随着“季节”的变化而改变其市场
的需求情况,如服装、食品等。这就称为季节性波动。同样的产品,在一个时期
(往往是以年为时期)内的销售曲线是呈周期性变化的。这类曲线可以利用线性
回归来进行建立预测模型。
一、收集原始数据(取样本点)
1、取 个样本点
为了表现出周期性变化规律,一般要取两个以上的周期样本点
[例 1:某企业将 2003 年、2004 年各月份的产品销售量统计如下表,试建立季
节性预测模型,且预测 2005 年 1、6、8 月份的销售量。
2003 年:
月份 1 2 3 4 5 6 7 8 9 10 11 12
销量 55
2004 年:
月份 13 14 15 16 17 18 19 20 21 22 23 24
销量 54
2、作图
在直角平面系中作出抽样点的离散图,并且光滑地连成曲线。
销售量
B
A
时间
n2
njj
yx
2
),(
0
取点后在 直角平面上描点,并光滑地连接成曲线(见上图)
二、确定长期趋势波动
长期趋势波动的确定一般有两种方法:
1、两点法
取两点坐标:A(第一个周期的中点,前 个抽样点的平均值)
B(第二个周期的中点,后 个抽样点的平均值)
根据 A、B 两点的坐标,建立直线方程式:
…………………………(1)
[例 1 中,计算 2003 年的平均销售量为:
2004 年的平均销售量为:
于是得到两点:A(6,) B(18,)
利用两点式求得直线方程为:
2、线性回归法
利用已得到的 个抽样点进行线性回归,将得到回归直线方程:
…………………………(2)
[例 1 中,样本点的个数是 24 个,于是计算得到
; ; ;
根据一元线性回归公式计算得到 以及直线方程
三、计算各点的趋势值
得到长期趋势的直线方程之后(上述两种方法中,无论用哪一种方法得到的
均可以。这里我们不妨取 ),将各 代入模型计算 值:
月份 xj 1 2 3 4 5 6 7 8 9 10 11
趋势值 y*j
2
n
n n
2
3
oxy
n
n
baxy *
12
12
12
1
j
jy
12
12
24
13
j
jy
xy
n2
baxy #
24
1
300
j
jx
24
1
j
jy
24
1
2 4900
j
jx
24
1
j
jj yx
b
a
xy
xy jx
y
12 13 14 15 16 17 18 19 20 21 22 23 24
由上面计算出来的 是表明按照回归方程 各点值,它隐去了
曲线各周期内的季节性变化情况。
四、确定季节性系数
计算公式: …………………………(3)
(其中 为抽样点的值, 为回归趋势值)
[在例题中,我们取的样本点是两个完全循环周期,因而应该将各周期中的相
同月份的季节性系数进行平均,取平均值作为预测模型的季节性系数:
月份 xj 1 2 3 4 5 6 7 8 9 10 11 12
03 年
αj
04 年
αj
均值
α*
根据两个周期的季节性系数相加后取平均值得到:
五、建立季节性波动预测模型
………………………………(4)
[在例题中,我们得出 ( )
六、预测
在例题中,我们要预测 2005 年 1 月、6 月、8 月份的销售量,故有:
2005 年 1 月:
y xy
y
y j
j
jy
y
yy jj
jjy jx
)()(125
y
2005 年 6 月:
2005 年 8 月:
§ 修正指数曲线预测
一、修正指数曲线
对于取得的一组样本点序列 ,如果分布成下面形状,就可以用修正
指数曲线模型拟合。
1、修正指数曲线模型
修正指数曲线的表达式为:
…………………………………(5)
[式中, 是三个参数,且 <0, 0< <1
2、修正指数曲线图像
在 中,x 代表时间(一般为年次),(以原始资料中最初年份为 0,依次
递增,y 表示趋势值, 为待定参数,其图形如下:
3、函数取值表
为了求出参数 ,我们将时间序列 按年次分为相等的三个部
分(即:将抽样点分为三个相等的部分)。
如果 不是 3 的倍数,则可以在各段接头(首尾)处重复一年或两年(一次或
两次)。
y
k
K+a
0 x
(修正指数曲线图形)
)()(630
y
)()(832
y
njj
yx ),(
xbaKY
baK ,, a b
baKY
baK ,,
baK ,, ),2,1( mjx j
m
设抽样点分段后每段有 个点(年),于是从第 0 年开始,根据 的表
达式,列出表如下:
年 份 的值 的值 的值
0
1
2
3
…… …… ……
第一部分
…… …… ……
第二部分
-1
…… …… ……
第三部分
二、修正指数曲线预测模型
1、我们记
表示第一个 年观测值之和;
n xbaKY
jx jxbaKY 1 jj yy
aK
abK )1( ba
2abK )1( bab
3abK )1(2 bab
1n 1 nabK )1(2 bab n
n nabK )1(1 bab n
1n 1 nabK )1( bab n
2n 2 nabK )1(1 bab n
n2 12 nabK )1(22 bab n
n2 nabK 2 )1(12 bab n
12 n 12 nabK )1(2 bab n
22 n 22 nabK )1(12 bab n
13 n 13 nabK )1(23 bab n
1
0
1
n
j
jyS n
表示第二个 年观测值之和;
表示第三个 年观测值之和
2、把上表中取值结果代入公式
于是得到:
=
=
=
=
=
=
3、推导
=
=
将上面两式相除,有
12
2
n
nj
jyS n
13
2
3
n
nj
jyS n
)()()()( 12
1
0
1
n
n
j
j abKabKabKaKyS
)1( 12 nbbbanK
b
b
anK
n
1
1
)()()()( 1221
12
2
nnnn
n
nj
j abKabKabKabKyS
)1( 12 nn bbbabnK
b
b
abnK
n
n
1
1
)()()()( 1322122
13
2
3
nnnn
n
nj
j abKabKabKabKyS
)1( 122 nn bbbabnK
b
b
abnK
n
n
1
12
)1(
1
1
]
1
1
[]
1
1
[21
n
nn
n
n
b
b
b
a
b
b
abnK
b
b
anKSS
b
b
a
n
1
)1( 2
)1(
1
1
]
1
1
[]
1
1
[ 232
n
n
n
n
n
n
n b
b
b
ab
b
b
abnK
b
b
abnKSS
b
b
ab
n
n
1
)1( 2
nb
SS
SS
21
32
得到: ………………………(6)
将(6)代入 = 得到:
……………………(7)
再将(6)和(7)代入公式 = 便有:
………………………(8)
三、修正指数曲线预测计算程序
1、取时间序列的样本点 ,并将样本点按时间序列(按年或其它时间段)
编号:0,1,2,……,分为三个相等的部分,每个部分包含 个样本点。
[若 ,则可在每部分的相接处重复 1~2 次。
2、计算参数
3、写出修正指数曲线回归方程:
4、预测。
[例 2;某新产品的销售资料如下表所示,试建立预测模型,并预测 2006 年的销
售量。
年份 1992 1993 1994 1995 1996 1997 1998
销售量 150 250 380 540 790 900 1100
年份 1999 2000 2001 2002 2003 2004
销售量 1350 1600 1650 1700 1710 1720
解]:
ⅰ因为样本点的数目是 13 个,不是 3 的倍数,所以在分段时要重复用到有些样
本点,分段及编号如下表:
<第一组>
年份 1992 1993 1994 1995 1996
销售量 150 250 380 540 790
0 1 2 3 4
<第二组>
年份 1996 1997 1998 1999 2000
销售量 790 900 1100 1350 1600
5 6 7 8 9
n
SS
SS
b
21
32
21 SS b
b
a
n
1
)1( 2
221 )1(
1
)(
nb
b
SSa
1S b
b
anK
n
1
1
)
1
1
(
1
1 b
b
aS
n
K
n
mjj
yx ),(
n
nm 3
baK ,,
xbaKY
jy
jx
jy
jx
<第三组>
年份 2000 2001 2002 2003 2004
销售量 1600 1650 1700 1710 1720
10 11 12 13 14
ⅰ计算数据(注意这里 =5)
=2110
=5740
=8380
ⅰ回归模型为
ⅰ预测
因为 2006 年对应于时间序列中的 =16,代入回归方程得出:
=
四、可化为修正指数曲线模型的其它曲线
1、逻辑曲线方程
…………………………………(9)
作变换: ; 得出:
jy
jx
n
4
0
1
j
jyS
9
5
2
j
jyS
14
10
3
j
jyS
3630
2640
21
325
SS
SS
b
b
3010
)1(
1
)(
2521
b
b
SSa
)
1
1
(
5
1 5
1
b
b
aSK
xY
x
Y
xaae
L
y
101
0ae 1a
xe
L
y
1
再作变换: ; ; ;
便得到逻辑曲线预测模型:
……………………………(10)
2、戈铂兹曲线方程
………………………………(11)
两边取对数:
作变换: ; ;
便得出戈铂兹曲线预测模型:
………………………………(12)
戈铂兹曲线又称生长曲线,反映了事物的生长过程,如科学发展的过程正如此。
§ 一般可化为直线模型的曲线预测
一、曲线预测一般程序和步骤
在实际中,有时两个变量之间的关系,并不是线形关系,而是非线性关系,
这时,就要根据经验点(原始资料统计的数据),选配适当的曲线来进行回归。在
一些曲线的回归过程中,是通过将曲线化为直线进行回归的。曲线模型的线性演
化过程的程序如下:
第一步:收集原始资料,得出一组经验点 ;
第二步:在 直角平面坐标系中作出经验点的离散图;
y
y
1*
L
K
1
L
a
eb
xabKy *
xbKay
abKy x lglglg
yy lg KK lg aa lg
xbaKy
njj
yx ),(
oxy
第一个生长过程
第二个生长过程
第三步:分析离散图,选择适当的曲线模型与之拟合;
第四步:将曲线模型进行适当的变换,使之成为线性模型;
第五步:求出线形回归方程;(得出参数值)
第六步:还原成曲线模型;
第七步:回归(预测)。
[例 3:下表是某产品连续十年来的销售情况,试建立回归模型,并预测 2006 年
的销售量。
年 份 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
序 号 1 2 3 4 5 6 7 8 9 10
销售量 5 12 20 29 40 50 63 74 86 96
解:先将观察点绘成离散图
这个图形呈幂函数的形状,因而选取 作为拟合曲线进行回归。
对于 两边取对数:
作变换: ; ; ;
便有直线模型
计算 = ,列表如下:
样本值 1 2 3 4 5 6 7 8 9 10
0 1
样本值 5 12 20 29 40 50 63 74 86 96
ⅰ ; ; ;
baxy
baxy
xbay lglglg
yy lg xx lg aa lg bb
bxay
10
),( jj yx 10)lg,(lg jj yx
jx
jj xx lg
jy
jj yy lg
10
1
j
jx
10
1
j
jy
10
1
j
jj yx
10
1
2 )(
j
jx
ⅰ 依线性回归公式有:
得到线性回归方程式:
查反对数表还原 :
故有:
于是,得到原问题的曲线回归模型为:
预测,因为 2006 年对应于序列数 12,所以有:
二、常见几类基本初等函数的表达式及图像
1、幂函数
表达式:
步骤:
(1)两边取对数
(2)作变换
得出线性回归模型:
由样本点 计算出 ,求出 及 ,并查反对数表
还原 及 ,就可以得到幂函数回归方程式:
2、指数函数
10
1
2
j
jx
)(
)(
22
22
jj
jjjjj
jj
jjjj
xxn
yxxyx
a
xxn
yxyxn
b
xy
ba,
aa a
bb
xy
y
baxy
abay lglglg
xx
bb
aa
yy
lg
lg
lg
*
*
*
*** bxay
njj
yx ),(
njjnjj
yxyx )lg,(lg),( ** *a *b
a b baxy
表达式:
步骤:
(1)两边取对数
(2)作变换
得出线性回归模型:
由样本点 计算出 ,求出 及 ,并查反对数
表还原 及 ,就可以得到指数函数回归方程式:
3、对数函数
表达式:
步骤:
作变换
得出线性回归模型:
由样本点 计算出 ,求出 及 ,就可以得到对数
函数回归方程式:
4、多项式函数
表达式:
步骤:
作变换
得出多元线性回归模型:
由 样 本 点 计 算 出 , 求 出
xaby
bxay lglglg
bb
aa
xx
yy
lg
lg
lg
*
*
*
*
xbay ***
njj
yx ),(
njjnjj
yxyx )lg,(),( ** *a *b
a b xaby
xbay lg
xx lg*
*bxay
njj
yx ),(
njjnjj
yxyx ),(lg),( ** a b
xbay lg
k
k xbxbxbby
2
210
k
k xx
xx
xx
2
2
1
kk xbxbxbby 22110
njj
yx ),(
n
k
jjjjnkjjjj
xxxyxxxy ),,,,(),,,,( 221
,就可以得到对数函数回归方程式:
5、双曲线函数
表达式:
步骤:
作变换
得到线性回归模型:
由样本点 计算出 ,求出 及 ,就可以得到对数
函数回归方程式:
第九章 马尔柯夫链
kbbbb ,,,, 210
k
k xbxbxbby
2
210
x
b
ay
x
x
y
y
1
1
*
*
** bxay
njj
yx ),(
njj
njj xy
yx
)
1
,
1
(),( ** a b
x
b
ay
§ 概论
马尔柯夫过程(简称马氏过程)是一个数学模型。马尔柯夫过程首先要满足
基本的条件:无后效性(或无记忆性)
马氏过程是研究不同状态下变化的情况。也就是研究系统由一个概率向另一
个状态转移的主观观察的概率。
马氏过程所研究的动态概率系统的状态转移是服从一个概率转移矩阵,可以
连续地或周期地观察。
马尔柯夫过程目前在国防、生产,特别是在系统控制、可靠性、生存产储、
设备维修、市场占有的预测、市场销售的动态的决策等应用最广泛。
一、转移概率矩阵
1、一次转移概率矩阵
设事物 有 个状态:状态 ,状态 ,状态 ,……,状态 ;
事物 处于各个状态的概率分布为: (其中 );
表示由状态 一步转移到状态 的概率.
于是有转移概率矩阵:
P=
转移概率矩阵 P 具有下面两条性质:
ⅰ、 0≤ ≤1 ( =1,2,… ; =1,2,… )
ⅰ、 ( =1,2,… )
[例如:某产品 A 的销售情况分为:
状态 1;销路很好
状态 2:销路好
状态 3:销路一般
状态 4:销路不太好
状态 5:销路不好
状态 6:销路很坏
状态 7:无销路
因而,产品 A 现阶段(可以是年,月,季度等)可以处在以上 7 个状态中间的
某一个状态(当然是随机的)于是:
表示现在处于销路很好时,下一阶段仍为很好的概率;
A n 1 2 3 n
A ),,,( 21 nF
n
j
j
1
1
ijp i j
nnnn
n
n
PPP
PPP
PPP
...
............
...
...
21
22221
11211
ijp i n j n
n
j
ijp
1
1 i n
11p
表示现在处于销路很好时,下一阶段销路好的概率;
表示现在处于销路很好时,下一阶段处于销路一般的概率;
…………
2、K 次转移概率矩阵
假设前提:事物 每一步转移都按照相同的转移概率矩阵进行。
我们记 为经过 步转移后的转移概率矩阵,
那么应该有:
( 个 相乘)
=
二、有“利润”的马尔柯夫链
1、定义
设事物 由状态 ( =1,2,… )经过一步转移到状态 ( )时有
一个利润值 与之对应。 (其中: )
便得出事物 经过一步转移的“利润”矩阵:
2、K 步转移利润
记 为事物 现在处于状态 经过 步转移后获得的总“利润”期望值
,且定义矩阵运算:
12p
13p
A
)()()(
)()()(
)()()(
)(
21
22221
11211
kpkpkp
kpkpkp
kpkpkp
kP
nnnn
n
n
k
PPPkP )( k P
kP
A i i n j nj ,,2,1
ijr
表示亏损时
表示盈亏平衡时
表示盈利时
,r
;,r
;,r
ij
ij
ij
0
0
0
A
nnnn
n
n
rrr
rrr
rrr
R
21
22221
11211
)(kvi A i k
).,2,1( ni
P*R= * =
=
引进向量:
=
我们作出状态转移及利润计算示意图(如下“有利润马尔柯夫链计算示意图” )
由图中可以看出;
令 便有:
………………(13)
由于事物 每转移一次,就产生一个“利润”,故第 次转移后所产生的“利润”期
望值 = 第一次转移的期望值+第二次转移的期望值+……+第 次转移的期望值。
=
=
=
于是得到:
第一步转移 第二步转移 第三步转移 ……
nnnn
n
n
PPP
PPP
PPP
...
............
...
...
21
22221
11211
nnnn
n
n
rrr
rrr
rrr
21
22221
11211
nnnnnnnn
nn
nn
rPrPrP
rprprp
rprprp
...
.....................
....
...
2211
2222222121
1112121111
n
j
njnj
n
j
jj
n
j
jj
rP
rP
rP
1
1
22
1
11
.......
)(kV
)(
....
)(
)(
2
1
kv
kv
kv
n
ininiiiii rprprpv 2211)1(
ni ,,2,1
RPV *)1(
A k
k
)1()2( ii vv ][ 111313121211111 nni rprprprpp
][ 222323222221212 nni rprprprpp
][ 332211 nnnnnnnnnnin rprprprpp
)1()1()1()1( 2211 niniii vpvpvpv
)1(
)2(
)1(
),,,()1( 2
1
21
n
iniii
v
v
v
pppv
)1(),,,()1( 21 Vpppv iniii
(有利润马尔柯夫链计算示意图)
11r
11p
11r nr1
11p np1
nr1
np1 1nr
1np
1ir
nnr
1ip nnp
inr 11r 11p
inp nr1
1nr np1
1np
nnr
nnp 1nr
1np
nnr
nnp
1
n
1
n
1
n
1
n
1
n
n
1
1
n
i
=
= ………………(14)
=第一次转移期望值+第二次转移期望值+第三次转移期望值
=第二次转移后的期望值+第三次转移期望值
=
+{
}
+{
}
+............
+{
}
=
+
+
+………
+
=
+
+
+………
+
=
+
)2(
)2(
)2(
)2( 2
1
nv
v
v
V
)1(),,,()1(
)1(),,,()1(
)1(),,,()1(
21
222212
112111
Vpppv
Vpppv
Vpppv
nnnnn
n
n
)1()1( VPV
)3(iv
)3(iv )1()1()1()1()1( 332211 niniiii vpvpvpvpv
)()( 22222221211211112121111111 nninni rprprppprprprppp
)( 221111 nnnnnnnnni rprprppp
)()( 22222221212221112121111212 nninni rprprppprprprppp
)( 221122 nnnnnnnnni rprprppp
)()( 2222222121211121211111 nnninnnnin rprprppprprprppp
)( 2211 nnnnnnnnnnin rprprppp
)1()1()1()1()1( 332211 niniiii vpvpvpvpv
)]1()1()1([ 12121111 nni vpvpvpp
)]1()1()1([ 22221212 nni vpvpvpp
)]1()1()1([ 2211 nnnnnin vpvpvpp
)1()1()1()1()1( 332211 niniiii vpvpvpvpv
)1(),,,( 112111 Vpppp ni
)1(),,,( 222212 Vpppp ni
)1(),,,( 21 Vpppp nnnnin
)1(),,,()1( 21 Vpppv iniii
)1(),,,(),,(),,,( 21222212112111 VpppPpppppppp nnnninnini
=
+
=
令 便有:
=
由(14)式 = 可知:
………………(15)
依此类推,我们得到一般递推公式为:
………………(16)
或者:
…………………(17)
这就是事物 现在处于状态 ,经过 步转移后的利润期望值总和!
§ 平稳理论
一、平稳理论
定理 1:设 为一概率矩阵,则有:
…………………(18)
矩阵 称为概率矩阵 的平稳概率矩阵。同时不难发现,在 中 个行
向量是相同的。
定理 2:设 是一个分布向量,则有:
)1(),,,()1( 21 Vpppv iniii
)1(),,,,( 321 VPpppp iniii
)]1()1()[,,,,()1( 321 VPVppppv iniiii
ni ,,2,1
)]1()1()[,,,()1(
)]1()1()[,,,()1(
)]1()1()[,,,()1(
)3(
21
222212
112111
VPVpppv
VPVpppv
VPVpppv
V
nnnnn
n
n
)]1()1([)1( VPVPV
)2(V )1()1( VPV
)2()1()3( VPVV
)1()1()( kVPVkV
n
j
jijiji kvrpkv
1
)]1([)(
A i k
)( ijpP
n
n
n
n
n
www
www
www
PP
21
21
21
*lim
*P )( ijpP
*P n
),,,( 21 nF
……………………(19)
也就是说,无论起初的分布向量如何,只要当概率矩阵经过无穷次转移,最
后的分布仍然趋向一个稳定的分布——平稳概率矩阵中的一个行向量。
二、实际变动
在实际应用中,我们不可能去按照 寻求 ,(因为这样是几乎不可
能的事情),而是用一些近似的方法求得 。
我们认为,只要 相当大,下式就可以成立:
……………………(20)
而
所以有:
……………………(21)
当 充分大时,我们又可以认为:
………………………(22)
结合(21)和(22),于是就得到:
即:
………………………(23)
解齐次线性方程组
……………………(24)
便可求出稳定向量 。
§ 马尔柯夫链应用
一、市场占有率的预测
1、进行市场调查,分析得出下面两组信息
(1) 目前市场占有情况。即你企业的产品在市场上的占有率以及同类产品的
厂家在市场的分别各自的占有率;
(2) 前一阶段(年,月,季度等)你企业的市场占有情况以及其它厂家的市
场占有情况,且分析占有流动情况。(当然,也可以用前几个阶段的占有流动情况
),,,(lim 21 n
n
n
wwwPF
*lim PPn
n
*P
*P
n
),,,( 21 n
n wwwPF
PPFPF nn 1
),,,( 21
1
n
n wwwPPF
n
nn PFPF 1
),,,(),,,( 2121 nn wwwPwww
0])[,,,( 21 PEwww n
1
0])[,,,
21
21
n
n
www
PEwww
),,,( 21 nwww
综合分析。)
2、建立转移概率矩阵
3、进行市场占有预测
[例 4:某出口产品,其竞争对手有日本、南朝鲜,其调查得出现在市场占有情
况为:
ⅰ目前购买中国产品的顾客占 40%,购买日本产品的占 30%,购买南朝鲜产
品的顾客占 30%,同时,分析得知:
ⅰ前一年买中国产品的顾客中,本年仍有 80%买中国产品,15%买日本产品,
5%买南朝鲜产品
前一年买日本产品的顾客中,本年有 40%买中国产品,40%仍买日本产品,20%
南朝鲜产品
前一年买南朝鲜产品的顾客中,本年有 20%买中国产品,20%买日本产品,60%
仍买南朝鲜产品
分析如下——
我们可以得出:
1)现在的市场占有分布为:(一共有三个状态,买中国的产品,买日本的产
品,买南朝鲜的产品)
=(40%,30%,30%)
2)转移概率矩阵为:
=
如果我们要预测 3 年以后的市场占有情况,则应该取 =3
= =
此矩阵表示意义为三年以后:
现在购买中国产品的顾客仍有 %购买中国的产品,%的顾客购买日本
的产品,%顾客购买南朝鲜的产品;
现在购买日本产品的顾客三年以后将有 %购买中国的产品 %的顾客
购买日本产品,21%的顾客购买南朝鲜的产品;
现在购买南朝鲜的产品的顾客三年以后将有 %购买中国产品,%的顾
客购买日本产品,31%的顾客购买南朝鲜产品。
3)市场占有预测
三年以后市场占有情况为:
=
),,( 321 pppF
P
%60%20%20
%20%40%40
%5%15%80
k
3P
3
)}3(),2(),3({ 321 pppF
3
321 ),,( Pppp
=(40%,30%,30%)
=(%,%,%)
即:三年以后该产品中国在香港的占有率为 %,日本占有率为 %,
南朝鲜为 %。
[例 5:某地区经过对 300 人的抽样调查得到资料如下:
ⅰ原来饮水果酒的人现在仍然喜欢饮水果酒的占 85%,改饮啤酒的占 5%,改饮
白酒的占 10%;
ⅰ原来饮啤酒的人现在仍然喜欢饮啤酒的占 90%,改饮水果酒的占 5%,改饮白
酒的占 5%;
ⅰ原来饮白酒的人现在仍然喜欢饮白酒的占 80%,改饮啤酒的占 10%,改饮水
果酒的占 10%。
试问经过若干年后,当处于平衡状态时,三种饮酒的人各占多少?
[分析:
建立状态转移概率矩阵如下:
保持或丧失
水果酒 啤酒 白酒
水果酒
啤酒
保持
或
获得 白酒
即:
解联立方程组:
得到向量: (,,),这就是若干年后饮酒人群中饮各
种酒的人数分布。
二、有“利润”的期望报酬预测
1、抽样调查,统计,并且处理数据得出以下两个矩阵
ⅰ概率转移矩阵 ;
%31%%
%21%%
%%%
P
1
),,(
),,(
321
321321
www
wwwwww
),,( 321 www
)( ijpP
ⅰ“利润”矩阵
由 P 和 R 构成了一个有“利润”的马尔柯夫链。
2、建立期望预测的数学模型
3、进行预测和决策
[例 6:某工厂准备开发一新产品,投资 15 万元,对市场作出了大量的调查。估
计产品可能出现三中状况:畅销、一般、滞销。并分析得出 P 和 R 如下,如果该
工程的寿命为五年,试决策之。
ⅰ目前的概率分布为:
(销路好,一般,滞销)=(80%,20%,0)
ⅰ转移概率矩阵为:
P=
ⅰ“利润”矩阵为:
R= (单位:万元)
解:首先计算
=P*R
= * =
= +
=
=
= +
)( ijrR
n
j
jijiji kvrpkv
1
)]1([)(
%50%30%20
%20%30%50
%15%25%60
513
146
2510
)1(V
513
146
2510
4
)2(V )1(V )1(VP
4
)3(V )1(V )2(VP
= +
= +
=
= +
= +
= +
=
= +
=
=
=
由 可知,若新产品处于畅销时,5 年后可获得期望利润 。万元;若
新产品现在处于一般时,5 年后可获得利润 万元;若新产品现在处于滞销
时,5 年或可获得利润 万元。
4
4
)4(V )1(V )3(VP
4
4
695
)5(V )1(V )4(VP
4
4
)5(V
再由现在产品的分布概率(80%,20%,0)可知 5 年后将获得期望利润为
(,,0) =(万元)
因为 -15=10 说明方案可行。如果考虑资金的时间价值,设 =10% , 则
(P/F,10%,5)=×= 万元>10 万元,说明方案还是可行。
三、选择设备保养地点
[例 7:汽车出租公司在甲、乙、丙三个地点附近设有停车场,顾客可在甲、乙、
丙三处租车,汽车送走顾客后,(如果没有载客)就要回到甲、乙、丙三处候客。
根据过去统计资料,汽车在三处的往返关系的概率如下:
若该公司准备在甲、乙、丙三处的某一处建设一个汽车保养厂,问,应该选
择在哪里最优?
分析:
根据题意可知,要选择地点建厂,就是要知道公司经过长期的经营后,集结
在何处的汽车最多。
这就成为一个求稳定概率向量的问题。
ⅰ
ⅰ有方程组:
显然,这是一个齐次线性方程组,根据克莱姆法则,如果 是非奇异的,则方
程组只有唯一的零解;如果 是奇异的,则方程组有基础解系(即有无穷多个解),
为此,再增加一个方程:
于是解联立方程组:
返回
甲 乙 丙
甲 0
乙 0 租车
丙
i
P
),,(
),,( 321321 wwwwww
P
P
1321 www
1
321
32
321
321
www
ww
www
www
经过计算得出解 =(,,),说明经过长期的经营后,甲地的汽车
集结最多,所以保养厂应该建在甲处。
四、选择零部件的更新方式
[例 8:机械制造厂要定期检查机床轴承,按照惯例,工厂把轴承分为四个等级:
第一级——新轴承;第二级——轻度磨损;第三级——中度磨损;第四级——报
废轴承。
如果在检查中更换一副轴承,其费用是 50 元,但如果机床仍用坏轴承运行,
则就可能发生事故,而根据过去的统计资料表明,每发生一次事故所造成的费用
损失平均为 250 元(其中还不包括换新轴承的费用)。
又根据过去的经验:一副新轴承在下次检查时有 的概率成为二级, 的
概率成为三级;一副二级轴承在下次检查时有 的概率仍为二级, 的概率变
为三级, 的概率成为四级(报废);一副三级轴承在下次检查时有 的概率仍为
三级, 的概率变为四级(报废)。
工厂现有两个方案:
(1)在每次检查中把四级轴承全部换掉;
(2)在每次检查中把三级及四级轴承全部换掉。
试选优。
分析:
ⅰ根据题目可知,由于在检查开始时,机床上不可能存在一级的轴承;反之,
在检查完毕后,机床上也不再存在着四级轴承。所以得到各级轴承之间的转移概
率矩阵为:
转换成
一级 二级 三级 四级
一级 0 0
二级 0
三级 0 0
原来的
四级 1 0 0 0
即:
=
ⅰ对于第一种方案:
经过长期的运转及更换后,达到平衡状态时,各级轴承所占的份额是多少呢?
这就要求计算平衡概率分布向量,解联立方程:
W
P
0001
1
),,,(
0001
),,,(
4321
43214321
wwww
wwwwwwww
得到:
=(,,,)
这里有一点值得注意,实际上我们在机床上永远只能看见三个级别的轴承
(1,2,3 级或 2,3,4 级),因为一级轴承和四级轴承不可能同时出现在机床上,
所以,
=(,,,)实际上并不是概率向量,所以此向量该写成下面形
式更为确切:(一级,二级。三级,四级)=(,,,0),为了使这个
向量成为概率向量,由于在机床上只有三个级别的轴承,于是,真正的分布向量
应该为:
=
=(,,,0)
以一副轴承为计算单位,我们知道,更换的概率为 %,(即每次检查时有
%的轴承为四级轴承),同时,四级轴承可能发生事故,所以计算一副轴承更
换的费用为:
×50 元+×250 元= 元
ⅰ对于第二种方案:
此时,在分析轴承的级别时,只考虑三个级别,如下表:
转换成
一级 二级 三、四级
一级 0
二级 0
原
来
的 三、四级 1 0 0
解联立方程组:
得出:
=(,,)
同上面分析一样,我们得到轴承分布向量:
=
=(,,0)
所以计算一副轴承更换的费用为:
×50 元= 元 (更换费用),另外,一副二级轴承在下一次转换成四级轴
承的概率为 (见第一个表),有: ××250 元 = 元
于是,两项之和为:
元+ 元= 元
根据上述分析,可见第二方案要比第一方案优。
),,,( 4321 wwwwW
W
),,,( 4321 wwwwW )0,
,
,
(
1
),,(
001
),,(
321
321321
www
wwwwww
),,( 321 wwwW
),,( 321 wwwW
)0,
,
(
五、预测人口变动
[例 9:某地区经过整理统计资料后得到 1980 年 6 月 30 日至 2005 年 6 月 30 日
25 年间人口的变动资料如下:
ⅰ2005 年 6 月 30 日人口的组成情况与过去 25 年间累计去世的人数所占百分比:
(0~25 岁,25~50 岁,50~75 岁,75~100 岁,100~125,去世)
=(, , , , , )
ⅰ转换概率矩阵:按照目前的生活条件和医疗条件,估计人口的转换概率矩阵
不会有多大的变动,而且经过统计得出相应的转移概率阵如下:
2005 年 6 月 30 日
0~25 25~50 50~75 75~100 100~125 去世
0~25 0 0 0 0
25~50 0 0 0 0
50~75 0 0 0 0
75~100 0 0 0 0
100~125 0 0 0 0 0 1
1980
年
6
月
30
日 25 年间出生的 0 0 0 0
[如 1980 年 6 月 30 日后 25 年间出生的人,有 94%存活,6%已经死亡。
试预测 2005 年 6 月 30 日至 2030 年 6 月 30 日 25 年间该地区的人口变动情
况。
分析:
根据转移概率矩阵,可以计算 25 年后(2030 年 6 月 30 日)的人口变动情况
为:
=(,,,,,)
这就是说,到 2030 年 6 月 30 日时,累计 25 年间人口变动情况是:
(0~25 岁,25~50 岁,50~75 岁,75~100 岁,100~125,去世 )
=(, , , , , )
值得一提的是:
ⅰ根据转换概率矩阵循环运算的特点,上面计算中是假设本周期内出生的婴儿
所占份额等于上一周期里去世人数所占的份额,所以份额如果偏高或偏低的话,
可以作出适当的调整,但注意调整后必须要使得向量成为分布向量。
ⅰ如果考察 2030 年 6 月 30 日时人口结构情况的话,那么,“去世”就不能作为
一个“状态”了,应该作出调整如下:
计算:++++=
(0~25 岁,25~50 岁,50~75 岁,75~100 岁,100~125 岁)
100000
),,,,,(
= ( , , , , )
=(, , , , )