第十八章 概率分布与营销决策
第一节 概率的基本概念
第二节 离散型概率分布
第三节 连续型概率分布
第四节 营销决策
第五节 营销模拟决策
营销研究18
第一节 概率的基本概念
试 验、样本空间和计数法则
试验结果的概率分配
事件及其概率
基本的概率关系
条件概率
贝叶斯定理
概率被视为是衡量某一特定事件的机会或可能性的数值量度。比如“明天下雨”这个事件的机会或可能性,如果几乎为零,则表示明天几乎不下雨,而如果是90%,则表示明天几乎要下雨,如果100%,则表示明天肯定要下雨。
营销研究18
试验
试验是任何可以产生明确定义的结果的过程。即在一次试验中,有且只有一个可能的试验结果。比如:
正面,反面
合格,不合格
购买,不购买
1,2,3,4,5,6
获胜,失利,平局
试验结果
抛掷一枚硬币
对某一零件进行检验
拨打一次促销电话
投掷一枚骰子
进行一场足球比赛
试验
营销研究18
样本空间
某试验的样本空间是指该试验的所有可能试验结果的集合。任何这里一个特定的试验结果都被称为样本点。它是样本空间的组成元素。计为:
S={a、b、c…}
其中,S表示样本空间, a、b、c…是样本点表示样本空间S元素。 样本空间S可以是有限的,也可以是无限的。比如前面一些试验的样本空间:
S1={正面,反面}
S2={合格,不合格}
S3={购买,不购买}
S4={1,2,3,4,5,6}
S5={获胜,平局,失利}
营销研究18
计数规则
对于一次试验,试验结果的计数就是穷尽其结果。如投掷硬币一次,结果是正面和反面这两个样本。
对试验的结果(样本点)进行确认和计数的规则。
对于多步骤试验,试验结果的计数采用树形图的方法,即乘法原则。如,一次投掷两枚硬币的试验结果。这种试验相当于先投掷一枚硬币后,再投掷一枚硬币的两步骤试验。试验结果如图:
步骤1:
投掷一枚硬币
正面
反面
步骤2:再投掷一枚硬币
正面
反面
正面
反面
(正面、正面)
(正面、反面)
(反面、正面)
(反面、反面)
样本点
营销研究18
多步骤试验计数法则
如果一个试验可以分为连续的k个步骤,且第一步有n1结果,第二步有n2结果,依此类推,则该试验的所有结果有:
n= n1 × n2×… × nk
如投掷两枚硬币的实验结果是:
n=2 × 2=4
营销研究18
组合计数法则
从N个物体中任取n个的这样一种试验,其试验结果的计数采用组合计数法则。
从N个物体中任取n个的组合数为:
N
n
=
N!
n!(N-n)!
式中, N!= N(N -1)(N -2) …(2)(1)
n!= n(n -1)(n -2) …(2)(1)
0!=1
营销研究18
例
我班有44名同学,现要组成一个6人小组,这样的小组组合有几种?
44
6
=
44!
6!(44-6)!
=7059052
Excel中的combin函数
营销研究18
试验结果的概率分配
对于试验结果的概率分配有多种方法。但其都必须满足两个基本条件:
10.每个试验结果(样本点)的概率值必须在0和1之间。即,假如Ei是第i种试验结果,P(Ei)表示这种结果发生的概率,则
0 ≤P(Ei) ≤1
2. 这种试验的所有结果的概率值之和必须为1。即
∑P(Ei)= P(E1)+ P(E2)+…+ P(En)=1
营销研究18
古典法
以试验结果发生的可能性均等假设作为基础,分配概率的方法称为古典法。比如,某个试验有n个结果,每个结果发生的可能性相等,则该试验的每个结果的概率均为1/n。
投掷硬币的结果的概率。如果硬币是均匀的,即正反两面没有差异,则投掷一次,出现正面和反面的可能性是相等的,因此,P(正)=P(反)=1/2=。
掷骰子的结果的概率。S={1、2、3、4、5、6},如果骰子是正六面体的均匀体,即每个面没有差异,则掷一次出现某点的概率是相等的,即
P(1)=P(2)=P(3)=P(4)=P(5)=P(6)=1/6
营销研究18
相对频数法
为了测量某一试验结果的概率,我们对这种试验重复多次,以测定出现某一结果的相对频数。比如,测量市场中消费者购买某新产品的概率。对一个消费者做这样的试验,试验结果是两个中的一个,即,购买或不购买。如果重复400次这样的试验,即调查400个消费者,可观察他们购买的人数,即购买结果的频数,现该频数是100。于是可以得到市场上一个消费者购买该新产品的概率是100/400=1/4=。
营销研究18
主观法
由于有些试验的结果,其可能性既不均等又不能用相对频数来反映,因此,上述结果的概率不能用古典法和相对频数法来分配。比如,对一场足球比赛的结果分配概率,就不能用如上的方法。我们要用主观的评价。
营销研究18
例
某工程公司,对某种两阶段类型的项目完成可能结果有9个,即 (2,6)、(2,7)、(2,8)、(3,6)、(3,7)、(3,8)、 (4,6)、(4,7)、(4,8),这些数对表示第一阶段所花的几个月和第二阶段所花的几个月。如(3,6)表示第一阶段花了3个月,第二阶段花了6个月。现在要对它们分配概率。已知该公司完成过相同的项目40个,完成的情况如表:
6
6
2
4
8
2
2
4
6
(2,6)
(2,7)
(2,8)
(3,6)
(3,7)
(3,8)
(4,6)
(4,7)
(4,8)
6
6
6
7
7
7
8
8
8
2
2
2
3
3
3
4
4
4
工程数
样本点(结果)
阶段2
阶段1
完成时间/月
营销研究18
例的结果
概率分配采用相对频数法,分配结果如下表:
P(2,6)=6/40=
P(2,7)=6/40=
P(2,8)=2/40=
P(3,6)=4/40=
P(3,7)=8/40=
P(3,8)=2/40=
P(4,6)=2/40=
P(4,7)=4/40=
P(4,8)=6/40=
8
9
10
9
10
11
10
11
12
(2,6)
(2,7)
(2,8)
(3,6)
(3,7)
(3,8)
(4,6)
(4,7)
(4,8)
分配的概率
完成的总时间
试验结果(样本点)
思考:我任意请一个同学上来报告,该同学是男同学的概率是多 少?
营销研究18
事件及其概率
事件是若干样本点的集合
某些试验结果的集合
某个事实
例:如前的某工程公司的例子
营销研究18
例:如前的某工程公司的例子
P(2,6)=6/40=
P(2,7)=6/40=
P(2,8)=2/40=
P(3,6)=4/40=
P(3,7)=8/40=
P(3,8)=2/40=
P(4,6)=2/40=
P(4,7)=4/40=
P(4,8)=6/40=
概率
6
6
2
4
8
2
2
4
6
(2,6)*
(2,7)*
(2,8)*
(3,6)*
(3,7)*
(3,8)
(4,6)*
(4,7)
(4,8)
6
6
6
7
7
7
8
8
8
2
2
2
3
3
3
4
4
4
工程数
样本点(结果)
阶段2
阶段1
完成时间/月
如以C表示“工程可以在10个月或10个月以内完工”这一事件,则, C={(2,6),(2,7),(2,8),(3,6),(3,7),(4,6)}这一事件由以上六个样本点构成。只要其中有一个样本点发生,则表示事件C发生了。
营销研究18
事件的概率
事件概率等于事件中所有样本点概率之和。因此,C事件的概率为:
P(C)=P(2,6)+ P(2,7)+ P(2,8)+ P(3,6)+ P(3,7)+ P(4,6) = +++++=
例,表示事件L “少于10个月的事件”和事件M “大于10个月的事件”并求它们的概率。
P(L)=P(2,6)+ P(2,7)+ P(3,6) = ++ =
P(M)=P(3,8)+ P(4,7)+ P(4,8) = ++=
营销研究18
10事件的补:
设事件A,则A的补是指“所有不包含在A内的样本点”的事件,记为Ac 。满足:
P(A)+P(Ac)=1 或 P(A) =1-P(Ac)
Ac
A
例:A=明天下雨事件,则Ac =明天不下雨事件
P(明天下雨事件)+ P(明天不下雨事件) =1
营销研究18
20加法公式
两事件的并:A和B的并是所有的属于A或B或同时属于二者的样本点构成的事件。记为,A∪B。
两事件的交:A和B的交是同时属于A和B的样本点构成的事件。记为, A∩B。
A
B
A∪B
A
B
A∩B
加法公式:P(A∪B)= P(A)+ P(B) - P(A∩B)
解释: A∪B的样本点等于A的样本点加B的样本点减A∩B的样本点
营销研究18
例
某公司的人事部对两年内的员工跳槽情况进行了总结。发现离职员工有30%的人是因为对工资不满意,有20%的人是因为对工作不满意,12%的人指出他们对工资和工作都不满意。那么在两年里离职的员工中,是因为对工资不满意,或者对工作不满意,或者两者皆而有之的概率是多少呢?
解:设S=事件“对工资不满意”,W=事件“对工作不满意”,故有: P(S)= , P(W)= , P(S∩W)=,
P(S∪W)= P(S) + P(W) + P(S∩W)= +- =
营销研究18
互斥事件
互斥事件是指两个事件没有公共的样本点,即两个事件A、B,其中一个发生,另一个必不同时发生。即,P(A∩B)=0。由此,有以下结论:
P(A∪B)= P(A)+ P(B)
A
B
营销研究18
条件概率
假设有一个事件A,概率为P(A)。如果我们获得了新的信息,即知另一个事件B已经发生,我们希望利用这一新的信息来对事件A重新计算概率,即“给定B事件下A的概率” P(A∣B)。下面通过举例说明条件概率的公式。
某警局有1200名警官,其中男性960名,女性240名,在过去的两年中288名男性和36名女性得到了升 职,为此,女性认为自己的升职机会低于男性,你认为有性别歧视吗?原因是什么?设:
M=事件“某警官是男性”
W=事件“某警官是女性”
A=事件“某警官得到升职”
Ac=事件“某警官没有得到升职”
为此问题可改为, P(A∣M) > P(A∣W) ?
营销研究18
例的解释
1200
240
960
总计
876
204
672
没升职(Ac)
324
36
288
升职(A)
总计
女(W)
男(M)
升职 性别
A(324)
M(960)
W(240)
Ac (876)
672
288
36
204
营销研究18
例的解释续
可以先计算边际概率P (M)、 P (W)、P (A)、P (Ac),它们是:
P (M)=
960
1200
=
P (W)=
240
1200
=
P (A)=
324
1200
=
P (Ac)=
876
1200
=
联合概率:
P (A∩M)=
288
1200
=
P (A∩W)=
36
1200
=
P (Ac∩M)=
672
1200
=
P (Ac∩W)=
204
1200
=
P (A|M)=
288
960
= =
288/1200
960/1200
=
P (A∩M)
P (M)
P (A|W)=
36
240
= =
36/1200
240/1200
=
P (A∩W)
P (M)
结论:男性警官升迁机会多
营销研究18
条件概率公式
P (A | B)=
P (A∩B)
P (B)
P (B | A) =
P (B∩A)
P (A)
P (A∩B)= P (A | B ) P (B) = P (B | A)P (A)
乘法公式:
营销研究18
独立事件
如果P(A | B)=P(A),P(B | A)=P(B),则称A、B是独立事件。否则,称这两个事件是相关的。由此有乘法公式:
P (A∩B)= P (A ) P (B)
营销研究18
例
假设某报业集团已知某地区有84%的住户订阅了该集团的日报,记为D事件“订阅了日报”,则P(D)=,此外,还知道已订阅了日报的住户还“订阅了其晚”(事件S)的概率为,即P(S | D)= ,那么既订日报又订晚报的概率是多少?
解:
P(S ∩ D)= P(S | D) P(D)
= × =
订日报
订晚报
设某加油站经理知道,加油者使用信用卡的概率为,问接下来的第一个和第二个加油者都用信用卡的可能性是多少?
A
使用信用卡
B
解:设A=“第一人用信用卡”
设B=“第二人用信用卡”
求P(A∩B)?
P(A∩B)=P(A)P(B)=×
=
营销研究18
类别变量相关分析的应用
例,1990年《亚运会》调查资料,汇总表如下:
586
5()
150()
211()
178()
42()
女
1
边际概率
1220
634
总计
8
347
419
363
83
3()
197()
208()
185()
41()
未回答
大专或以上
高中或中专
初中
小学及以下
边际概率
总计
男
教育 性别
实际频数分布与两变量独立的频数分布相差不大,可认为两变量独立。
营销研究18
贝叶斯定理
通过先验概率(先前知道的概率),利用新的信息,获得后验概率。举例说明该公式。
假设某制造厂从两个供应商处购买零件。A1表示“零件来自供应商1的事件”, A2表示“零件来自供应商2的事件”。已知有65%的零件来自供应商1,其余35%来自供应商2。因此,在生产中,随机取一个零件用于生产,那么这个零件属于供应上的先验概率P(A1)=,而P(A2)=。零件质量与供应商有关。数据如下:
2
5
98
95
供应商1
供应商2
不合格产品率%
合格产品率%
供应商 质量
假设G表示“零件质量合格”事件,B表示“零件质量不合格”事件,则以上数据反映的信息如下:
营销研究18
贝叶斯定理说明
P(G|A1 )=
P(B|A1 )=
P(G|A2 )=
P(B|A2 )=
我们可以把该厂的零件关于供应商和质量进行综合汇总,数据如下概率树表示:
A1()
A2()
G()
B()
G()
B()
(G∩A1 )
(B∩A1 )
(G∩A2 )
(B∩A2 )
P (G∩A1 )= P(G|A1 )P(A1)=
P (B∩A1 )= P(B|A1 )P(A1)=
P (G∩A2 )= P(G|A2 )P(A2)=
P (B∩A2 )= P(B|A2 )P(A2)=
注:联合概率能否用交叉表的形式表示
营销研究18
贝叶斯定理说明续
问题提出:在生产中,随机取出一个零件,该零件是供应商1提供的,即A1(或A2)并且合格的G(或不合格的B)的事件,则这些事件是(A1 ∩G)、( A1 ∩B)、(A2 ∩G )、(A2∩B) 。
进一步的问题:生产中发现一个零件不合格,那么它来自A1或A2的概率是多少?即求P(A1 | B)或P(A2 | B)。
P(A1 | B)=
P(A1 ∩ B)
P(B)
P(B) = P(A1 ∩ B)+ P(A2 ∩ B)
供应商1零件A1
供应商2零件A2
B
P(A1 ∩ B)= P(B|A1 )P(A1)
P(A2 ∩ B)= P(B|A2 )P(A2)
营销研究18
贝叶斯公式:
P(A1 | B)=
P(A1 ∩ B)
P(B)
=
P(B|A1 )P(A1)
P(B|A1 )P(A1)+P(B|A2 )P(A2)
P(A2 | B)=
P(A2 ∩ B)
P(B)
=
P(B|A2 )P(A2)
P(B|A1 )P(A1)+P(B|A2 )P(A2)
=
=
注:如果A1 、 A2 、…、 An 互斥,并等于整个样本空间,则一般的贝叶斯公式如下:
P(Ai | B)=
P(B|Ai )P(Ai)
∑P(B|Ai )P(Ai)
i=1、2、 …、 n
A2
An
A1
… … …
B
营销研究18
第二节 离散型概率分布
离散型随机变量
离散型概率分布
`数学期望与方差
二项概率分布
泊松概率分布
超几何概率分布
几何概率分布
营销研究18
离散型随机变量
随机变量是一次试验的结果的数值性描述。比如,掷骰子试验,一次试验结果是1、2、…、6的某个点数。这个结果可以就用该数值表示,这就是说掷骰子试验的结果可用1、2、…、6来表示。
离散型随机变量:是由有穷个数值或一系列无穷数值构成的随机变量,如1、2、…。
例:某人参加一项考试,考试的内容分为4部分。记考试的结果,即通过其中的几部分的结果为x,则x的取值为0、1、2、3、4是一个离散的随机变量。
例:某收费站记录一天中到达的车辆数的结果,记为x,则其取值是0、1、2、3、 …,也是离散型的随机变量。
营销研究18
举例
0、1、2、3、4、5
0、1、…、50
下定单的客户数
损坏的收音机数
接触5位客户
检查运来的50部收音机
随机变量的可能值
随机变量x
试验
注意:很多试验结果本身就是用数值来描述的,如前面举的一些例子,所以,此时随机变量的取值就用这些数值。
也有一些试验结果不是用数值来表示的,如掷硬币的试验结果用正反描述。检验产品质量的结果是合格和不合格。为此,这些试验的随机变量x要赋予取值。比如,x=1表示正面(合格),x=0表示反面(不合格)。当然,x也可以取别的什么值,如x=5表示正面(合格), x=10表示反面(不合格)。
营销研究18
离散型随机变量的概率分布
概率分布是对随机变量取不同值时的概率的描述。它用概率函数来定义,记为f(x),它是随机变量的函数,表示随机变量x = x时的概率。
营销研究18
举例
例:某汽车销售公司的一天的汽车销售量的可能性。在过去300天的营业时间内,有54天每天销售量为0,有117天每天销售量为1辆,有72天每天为2辆,有42天每天3辆,12天为4辆,3天为5辆。假设汽车公司一天的营业量作为试验,定义随机变量为x = 一天中售出的汽车数,则x可取值0、1、2、3、4、5。根据历史数据,用相对频数法给随机变量配上相应的概率,用随机变量的概率函数符号表示如下:
合计
f (0)=
f (1)=
f (2)=
f (3)=
f (4)=
f (5)=
0
1
2
3
4
5
f (x)
x
概率分布
营销研究18
离散型概率函数的要求条件
概率函数要满足的条件:
f(x) ≥0
∑f(x)=1
上举例中,概率函数满足了这些条件。
离散型概率分布除了用函数值、表格表示外,还可用图表示。如上举例中,图表示如下:
0 1 2 3 4 5
营销研究18
均匀离散型概率分布
概率分布:f(x)=
1
n
n—随机变量取值的个数。
例:掷骰子的试验,定义随机变量x的取值就是试验结果的点数。即x =1、2、3、4、5、6。该随机变量的概率函数是:
f(x)=
1
6
x =1、2、3、4、5、6
这是一个均匀的离散型概率分布。
营销研究18
例:
已知随机变量及其概率如下:
总计
20
25
30
35
f(x)
x
问题:这是概率分布? x = 30的概率? x 不大于25的概率? x 大于30的概率?
营销研究18
数学期望
数学期望:随机变量的概率平均值。
离散型随机变量的数学期望:
E(x)=∑xf(x)=
例,前面所举例,求某汽车销售公司一天销售量的随机变量x的数学期望。
E(x)=0×+1×+2×+3×+4×+
5×
=(辆)
这里数学期望的含义是平均每天的销售量。由此可以
推算平均每月的销售量是30 × (辆)=45(辆)
营销研究18
方差
方差反映了随机变量的分散程度或称变异性。
离散型随机变量的方差:
var(x)=∑(x-)2f(x)=2
标准差:
= √2
营销研究18
例
前例汽车销售公司的有关数据如下:
总计
0-
1-
2-
3-
4-
5-
0
1
2
3
4
5
(x-)2f(x)
f(x)
(x-)2
(x-)
x
汽车销售公司一天销量的标准差 = √2 = √ =辆
问题:误差大不大?
营销研究18
二项概率分布(Binomial)
这是一个离散型的概率分布,它与一个被称为二项试验的多步骤试验有关。
二项试验:
试验由一个包括n次相同的试验的序列组成
每次试验有两种可能结果,我们把其中一个称为“成功”,另一个称为“失败”
每次试验中,成功的概率记为p,失败的概率记为1-p
试验都是独立的。
例,一个8次试验的二项试验结果如下,其中记成功为S,失败为F:
S
S
F
S
S
F
F
S
结果
8
7
6
5
4
3
2
1
试验
营销研究18
二项试验的随机变量
在二项试验中,感兴趣的是n次试验中出现成功的次数。如果把这一结果记为x,则x =0、1、2、…、n,它是离散型随机变量,与此相关的概率分布称为二项概率分布。记为
f(x), x =0、1、2、…、n。
例,掷硬币试验重复进行5次,每次结果或正面,或反面,讨论5次试验出现正面的次数。这是二项试验吗?随机变量的取值是?
该试验是由5次相同的试验组成
每次试验有两种结果,即正面或反面,可记正面为成功,反面为失败。
正面(反面)出现的概率在每次试验中都是一样的。正面出现的概率记为p,反面出现的概率记为1-p,它们分别等于
各种实验都是独立的。
结论:是二项试验,随机变量x的取值是0、1、2、3、4、5
营销研究18
例
一个保险推销员随机选择对10家人家进行访问。每家访问的结果是该户人家购买保险算成功,没有购买算失败。根据以往的经验,访问的家庭购买保险的概率为,讨论对这10家访问后,购买保险的户数?
试验由10次相同的试验(访问)组成,其中每次试验就是访问一个家庭
每次试验有两种可能结果,被访家庭购买或不购买保险
每次试验成功的概率都相同,p=,(1-p)=
由于家庭是任意选择的,因此试验是独立的
结论:这是一个二项试验,随机变量x是10个家庭中购买保险的
户数,可取值0、1、2、3、4、5、6、7、8、9、10、11。
营销研究18
二项概率函数
n 次试验中恰有x 次成功的试验结果有多少呢?
例,4次试验中恰有2次成功的试验结果有多少?
1
2
3
4
2
3
4
1
1
3
4
2
1
4
3
2
2
4
3
1
3
4
1
2
4
2
=
4!
2!(4-2)!
=6
n
x
=
n!
x!(n-x)!
营销研究18
二项概率函数
记每次试验成功的概率为p,那么n次试验恰好x成功的试验结果中,任何一个结果的概率都是:
px (1-p)n-x 为什么?
因此, n次试验恰好x成功的概率是所有以上试验结果的概率之和,记为f(x):
f(x)= px (1-p)n-x
nx
为此,二项概率函数是:
f(x)= px (1-p)n-x x=0,1,2,…,n
nx
营销研究18
例:
求重复掷5次硬币的二项概率分布:
f(x)= px (1-p)n-x
5x
其中, x取值范围是0~5, p=。
f(0)= ()5-0 =
50
f(1)= ()5-1 =
51
…… …… ……
f(1)= ()5-5=
55
营销研究18
二项概率分布函数值的求法
直接计算,但当n较大时,很困难。
查二项概率分布表。但范围有限。
Excel的统计函数。
步骤:
10选择function category
20选择statistical binomist
30 取number x,trials n,probability p,and cumulative false or true。其中false表示x值的函数值,true表示x值及以下的累积概率。
营销研究18
二项概率分布的数学期望和方差
数学期望E(x)==np
方差var(x)=2=np(1-p)
证明:
E(x)=0· p0 (1-p)n +1· p1 (1-p)n-1 +‥‥‥+n· pn (1-p)0
=np(0· p0 (1-p)n-1 +1· p1 (1-p)n-1 +‥‥‥+n· pn (1-p)0
=np
n0
n1
nn
n-1 0
n-1 1
n-1 n-1
k·
nk
= k·
n!
k!(n-k)!
= n·
(n-1)!
(k-1)!(n-1-(k-1))!
= n·
n-1 k-1
营销研究18
泊松概率分布(Poisson)
泊松试验:
讨论随机事件在一段时间或空间内发生的次数,以x表示发生次数的随机变量,并将这段时间划分成很多段不重复的小区间,长度为⊿t,如果在一段连续时间内事件发生的次数满足以下条件:
1、各不重复小区间内事件发生的次数是相互独立的
2、各区间内事件发生一次的概率与区间的长度⊿t成比例
3、在一段充分小的时间区间内,事件发生的次数几乎不超过1次
此时,x是泊松随机变量,其概率分布称为泊松分布。
营销研究18
泊松试验的解释
‥ ‥ ‥ ‥
一段时间
例,汽车通过某收费站这一事件。在一段时间内,通过该收费站的汽车数量就是指上述事件在这段时间内发生的次数。这一次数变量是泊松随机变量。
事件:
汽车通过
收费站
事件在一段时间内发生的次数
一段时间划分成若干小时间区间后,每个小时间段同样可讨论事件发生的次数。显而易见,该例中,每个小时间段内汽车通过收费站的次数是独立的。在一个小时间段内,事件发生一次的概率假设与该小时间段长度成一比例。这种小时间段总可以划分得充分的小,并假设在充分小的情况下,事件发生的次数几乎不超过一次。这符合事实,因为过收费站不会两量车同时通过。
营销研究18
泊松试验的例子
一小时内到达汽车停车场的汽车数
15分钟内到达超市收费处的人数
100公里长地下水管漏洞的个数
请在考虑一些这样的例子。
营销研究18
泊松概率函数
f(x)=
xe-
x!
x=0,1,……
其中, f(x)—— 在一个区间内发生x的概率
—— 在一个区间内发生次数的期望值,均值
e=
营销研究18
泊松概率函数的推导
把一段时间划分成n 个小时间段后,根据假设只要n充分小,泊松随机变量x相当于指,在n次的二项试验中成功的次数。假设在小时间段内,事件发生一次的概率p等于/n(不发生的概率1-p),则
f(x) ≈
n
x
px (1-p)n-x
x=0,1,……
当n趋向∞时,上面的近似等于就变为等于。即,
f(x) =lim
n
x
px (1-p)n-x =
x=0,1,……
n∞
xe-
x!
E(x)=∑x ·
xe-
x!
= ∑
x-1e-
(x-1)!
∞
0
∞
1
=
营销研究18
泊松概率函数的推导
f(x) =lim
n
x
px (1-p)n-x =lim
n∞
n∞
n(n-1) …(n-x+1)
x!
nx
x
=lim
n∞
n(n-1) …(n-x+1)
x!
nx
x
(1- /n)n
(1- /n)x
xe-
x!
=
1
1
e-
营销研究18
例
周日上午某银行15钟内,顾客到达一定人数的概率。根据以往的经验,周日上午15分钟平均到达的人数为10人。设x是随机变量,即到达的人数,符合泊松分布,则,
f(x)=
10xe-10
x!
x=0,1,……
求在15分钟内到达人数5人和6人的概率。
f(5)=
105e-10
5!
=
f(6)=
106e-10
6!
=
营销研究18
二项分布的泊松分布近似
当成功概率p很小,试验的次数n很大时,二项分布可用泊松分布近似,其中,=np,一般当p≤和n≥20时较理想。
注意到二项分布表n到20为止。
营销研究18
超几何概率分布(Hypergeometric)
举例说明该概率分布。设总体N的产品中有M个次品,现从N中随机抽取n个产品,n≤N-M,则n中含次品数x是一个离散型随机变量,它满足的分布就是超几何分布。即,
f(x)=
Mx
N-M n-x
Nn
0≤x ≤ min(M,n)
n-x ≤N-M
可证明:
∑f(x)=∑
Mx
N-M n-x
Nn
=1
营销研究18
超几何概率分布证明推导
∵∑
Mx
N-M n-x
是(1+x)M(1+x)N-M中的xn项的系数。而
Nn
是(1+x)N中的xn项的系数。
∴ ∑
Mx
N-M n-x
=
Nn
营销研究18
例
有一个课题组由2男3女组成,课题获奖后,要派2名代表去参加表彰大会。现决定随机派2名去,结果都是女性的概率。总数有5人,现从中随机抽取2人,其中女性人数是超几何随机变量,符合超几何概率分布。这里相当于求x=2的概率。故,
f(2)=
32
5-3 2-2
52
=
如果派3名,其中2名是女性的概率是多少?
f(2)=
32
5-3 3-2
53
=
营销研究18
几何概率分布
二项试验中,第一次成功在第x次试验出现的事件,这x是离散型随机变量,满足几何概率分布。分布函数是:
f(x)=qx-1p x=1,2…
这表示前面x-1次的二项试验结果都不成功,到第x次成功的概率。
营销研究18
第三节 连续型概率分布
连续型随机变量
均匀概率分布
正态概率分布
指数概率分布
营销研究18
连续型随机变量
代表某一区间或多个区间中的任意数值的随机变量称为连续型随机变量。如建立在时间、距离、温度等度量单位上的试验结果可以通过连续型随机变量来描述。
连续型随机变量的例子:
0≤x≤S
从此出发事故发生的地点
一条公路上下次发生事故的地点
0≤x≤100
6个月后工程完成的百分数
建造大楼工程
x≥0
前两顾客到达的时间间隔(分钟)
银行开门
x取值
随机变量
试验
营销研究18
均匀概率分布
讨论随机变量x,表示一个航班从a飞往b的飞行时间。
a
b
飞行时间
假定飞行时间是从a到b之间的任意值,即x的取值为a≤x ≤b,则它是连续型随机变量。如果在[a,b]内飞行时间在任意一分钟内的概率都相等,则x是均匀概率分布。其概率密度函数是:
f(x)=
1
b-a
0
,a≤x ≤b
,其他
(*)
f(x) ≥0
营销研究18
密度函数的含义
连续型随机变量的密度函数其函数值不代表在x处的概率。事实上在x处的概率几乎为零。比如从a飞到b的飞行时间是x的概率几乎为零,不可能如此准时和精确。一般只讨论在一段时间内的概率,如a≤ x1≤x≤x2 ≤b的概率。显然, a≤x≤b的概率为1。用密度函数表示就是: x1≤ x≤x2的概率是在f(x)函数下x1≤x≤x2的面积。由于均匀分布的密度函数是分段函数,每一段都是常数见(*),故在x1≤x≤x2的这段时间内的概率为:
P=
1
b-a
(x2 - x1)
0 a x1 x2 b
营销研究18
一般性总结
连续型随机变量x,其密度函数f(x),一般不讨论x取某个固定值的概率,而是讨论x在某区间[x1 , x2 ]的概率。其概率大小就是曲线f(x)和该区间构成的一块图形面积。
f(x)
x1 x2
如果随机变量的变动范围在a≤x≤b之间,则由密度函数f(x)和[a , b ]构成的图形面积等于1。
营销研究18
均匀分布的数学期望和方差
E(x)=
a+b
2
=
∫
b
a
x f(x)dx
Var(x)=
(a-b)2
12
=
b
a
(x- E(x) )2 f(x)dx
∫
营销研究18
例:
假定我们有兴趣对一块土地竞标,我们知道有另一位竞标人。卖主已宣布最高标价超过10000美元将被接受。假设竞争者间的竞标价x是随机变量,在10000~15000美元间服从均匀分布。
a.假定你出价12000美元,你竞标成功的概率是多少?
b.假定你出价14000美元,你竞标成功的概率是多少?
c.为使你得到土地的概率最大,你应出标多大金额?
d.假定你知道某人打算为这块土地向你支付16000美元。你考虑以小于c.中的金额竞标吗?为什么?
a) P=
12000-10000
15000-10000
=2/5=
b) P=
14000-10000
15000-10000
=4/5=
c) 15000
d)不会,这样能稳赚
营销研究18
正态概率分布(Normal)
很多连续型的随机变量是正态概率分布。比如总体中的样本平均值,测量结果的误差等。
正态概率分布的密度函数为:
f(x)=
1
√2
e-(x-)2/22
其中,——均值
——标准差
-∞< x <+ ∞
营销研究18
, 的含义
,参数决定了分布曲线的位置和形状。
0
-10
20
=5
=10
营销研究18
常见区间的概率和常见概率的区间
*常见区间的概率:
P{x∈(-+, +)}=%
P{x∈(-2+, +2)}=%
P{x∈(-3+, +3)}=%
*常见的概率区间:
P=95%的区间为(+, +)
P=90%的区间为(+, +)
营销研究18
标准正态分布
=0, =1的正态分布称为标准正态分布。
0
=1
z
0≤x ≤z的概率如阴影部分的面积。即P{0≤x ≤z}=上面的阴影部分的面积。对于正态分布,给定z可以通过查正态分布表得到以上的概率,反之如果已知以上的概率,则通过查表可以得到z的大小。如果要求P{x1≤x ≤ x2},怎么求?正态分布表有半表和全表两种,半表是给定z可直接查到如上阴影部分的面积。如果查全表,则给定z查表得到的面积减去
x1
x2
营销研究18
正态分布的Excel的计算
例,已知标准的正态分布,求P{0≤x ≤3}, P{0≤x≤z}=的z 。对于给定的z=3,用统计函数举NORMSDIST求出P{0≤x ≤3}=,对于所求的z,用统计函数NORMSINV求出z=
营销研究18
一般正态分布化为标准正态分布
设x是一般的正态分布随机变量,其均值为,标准差,则z=(x-)/是标准正态分布的随机变量。由于
x= z+,因此求P{a≤x ≤b}就是求
≤z ≤
a-
b-
P
而这是可以通过查表来得到该概率值.
b
a
营销研究18
一般正态分布的Excel求解
P{a≤x ≤b}= P{-∞≤x ≤b} - P{-∞≤x ≤a}
可直接用Excel求解
可直接用Excel求解
例:已知=36500,=5000,x满足正态分布,求:P{30100≤x ≤42900},
解: P{30100≤x ≤42900}=P{-∞≤x ≤42900} - P{-∞≤x ≤30100} =-=
营销研究18
二项概率的正态进似
已知二项概率分布函数是:
f(x)= px (1-p)n-x x=0,1,2,…,n
nx
=np,2=np(1-p)
当n>20时, np≥5,n(1-p) ≥5的情况下,可用=np和
=√np(1-p)的正态分布进似,而且,p=,n比较大时效果更好。由于正态分布是连续变量分布,随机变量任何值x的概率为零,因此,用它进似二项分布x的概率,必须调整为用正态分布的
(-⊿x+x,x+⊿x)的概率去进似二项分布x的概率,一般这里⊿x=,成为连续修正因子 。为什么修正因子用⊿x=?
x
f(x)
1
营销研究18
例:
已知某公司有10%的发票出错历史,即发票出错概率p=。现公司选出100张发票,则出错票12张的概率是多少?这里是一个n=100,成功概率(出错票的概率)p= 的二项试验。故
f(12)= =
100
12
用正态分布进似,即求=np=100× =10 ,=3在(+12,12+ )范围的概率。即
P{≤x ≤}= P{-∞≤x ≤}- P{-∞≤x ≤} = -=
如果求出错票不大于13张的概率,即x ≤13的概率。如何求?
营销研究18
指数概率分布(Exponential)
指数分布随机变量可用于描述诸如到达某一洗车处的两辆车间隔时间;装载一辆卡车所需时间,等等。
指数分布的概率密度函数是:
f(x)= e-x /
1
x≥0, >0
指数分布的概率:
P{x≤ x0}=∫
x0
0
1
e-x /
dx=1- e-x0 /
E(x)=
∫
b
a
x f(x)dx=
Var(x)=
b
a
(x-)2 f(x)dx= 2
∫
营销研究18
例:
某码头装载一辆卡车需要花费时间服从指数分布。如果装载一辆卡车平均时间是15分钟,则概率密度为
f(x)= e-x /15
1
15
概率分布:
P{x≤x0}=1- e-x0 /15
求装载一辆车花费6分钟或更少时间的概率?
解:P{x≤6}=1- e-6 /15 =03297
营销研究18
泊松分布与指数分布的关系
泊松分布:
f(x)=
xe-
x!
x=0,1,……
它表示某一时间间隔中发生x次的概率。
指数分布的概率:
P{x≤ x0}=∫
x0
0
1
e-x /
dx=1- e-x0 /
它表示两次之间时间间隔的长度概率
营销研究18
第四节 营销决策
优惠政策决策。
例, 某轮胎公司生产的轮胎,投放市场后,为了吸引顾客,需要确定一个优惠政策。比如,对于轮胎使用里程不超过多少公里的免费回收政策。根据公司能承受的回收率,确定这个里程。假设公司轮胎的行驶里程平均为36500公里,标准差5000公里。如果回收比率可承受10%,那么回收轮胎的行驶里程定在多少为好?
首先,一条流水线上的下线轮胎的质量满足正态分布,即轮胎的行驶里程x满足正态分布。其次,可以知道大部分的轮胎行驶里程在36500公里左右,假定确定的回收里为程x0(小于36500公里),则行驶里程不超过x0的轮胎应不超过10%。最后通过以上条件求出x0 。
36500
x0
10%
已知,P(x≤x0 ) =10% ,求x0 ?x0 =30092公里
如果化为标准的正态分布如何求解?
营销研究18
第五节 营销模拟决策
营销决策就是对一些营销方案作出选择。选择的标准是“最优”或“最满意”或“满意”。如果营销方案的结果是都是确定的,那么按上述标准进行选择是可行的。比如有四个促销方案,不同的方案会产生四个不同的销售业绩,这时可以选择销售业绩最好的一个方案。如果营销方案可以用数学模型表达,并且这个模型是规定型的,那么所有这些营销方案中存在最优方案,或满意的方案。如线性规划模型就是规定性的,存在最优解。如下的定价模型也是规定性的,Q=a-P,L=PQ-cQ-C,L=-P2+(a-c)P-C,定价方案中存在最优方案。
数学模型中,还有一些描述性模型。他们直接描述关系和提供评价信息。描述性模型用于解释系统的行为、预测未来、帮助决策者选择最优方案或系统设计。如生产过程模型就是描述性的模型。
营销决策中的模拟模型属于描述性模型。描述性模型中有一些是确定型的,即所有的数据都是确定已知的或假设为确定已知的。而有一些模型是概率型的,即某些数据由概率分布来描述。
营销研究18
模拟的概念
模拟是建立系统或决策问题的数学或逻辑模型,并以该模型进行
试验,以获得对系统行为的的认识或帮助解决决策问题的过程。
自古以来,模拟就被用于分析系统与决策问题。如军队的演习、飞行员的飞行模拟、生产系统的模拟、市场营销的决策模拟,等等。
模拟是以模型为基础进行的,也就是对分析系统或决策问题先用模型描述出来,然后对模型的一些可控变量进行不同的取值或不可控变量的不同值的出现时,观察产生的结果,从而分析系统或选择方案。
营销研究18
模拟过程
建立
理论模型
建立
模拟模型
验证和确证
模型
设计利用模型
的试验
进行试验并
分析结果
辨别研究的目的和目标,确定重要输入变量,并规定输出量度。对研究系统进行详细逻辑描述
建立适当的公式或方程,收集数据,决定不确定性变量的概率分布,构建记录结果的 格式。
保证模型没有逻辑错误,是实际系统或问题的合理描述
调整变量,观察结果
营销研究18
蒙特卡洛模拟举例
某食品店在中秋节之前几周就必须向供应商订购某一品牌的月饼。该月饼的每只购入价是元,售出价是。在中秋节前未售出的月饼节后要打对折出售,但总能售尽。在过去几年,每年出售该月饼在4000只到9000只之间,并且没有明显的上升或下降趋势。问题是该食品店应该订购多少月饼呢?显然,定得太多,如果销不出去,则对折出售要损失一笔,如果定得太少,则可能损失获利的机会。我们将该食品店如何订购而使获利满意的决策问题,构建一个利润模型。设进货量为Q,需求量是D,利润为L,则利润表达式是
蒙特卡洛模拟是抽样试验,其目的是估计依若干概率输入变量而
定的结果变量的分布。
L=
12D-+6(Q -D) 若D≤Q
12Q- 若D>Q
其中Q是可控的决策变量,范围是4000至9000,而D是不可控的随机变量。如果D已知,则最优决策就是确定的,即Q=D。但D若是随机的,则决策如何是好呢?
营销研究18
举例的模拟
如果我们通过订购量不同情况下的模拟,得到一系列结果,那么就可以根据这些结果来确定一个好的订购月饼的决策。假如4000、5000、6000、7000、8000和9000只月饼需求出现的概率相等,即等于1/6,那么我们可以用骰子的点数分别代表需求量,如1代表需求4000,2代表需求5000,以此类推,6代表9000。模拟过程就是掷骰子,看它出现几点,然后就确定一个相应的需求量,代入以上的模型,记录下利润。以Q=6000只订购数进行模拟,如掷出来是4点,则对应的需求量是7000只,由于D=7000>6000,由方程计算得:
L=12×6000-×6000=27000
营销研究18
模拟数据
24600
平均值
27000
6000
3
10
21000
5000
2
9
27000
9000
6
8
27000
8000
5
7
27000
6000
3
6
15000
4000
1
5
27000
7000
4
4
21000
5000
2
3
27000
6000
3
2
27000
8000
5
1
利润
需求量
骰子点数
重复
如此重复模拟10次,结果如表: 单位:元
营销研究18
模拟结果
对于订购量Q=6000只月饼,该店模拟销售的利润结果是:
70%
20%
10%
相对频数
7
27000
2
21000
1
15000
频数
利润
平均利润是24600元。如果进行100次的模拟,则结果是
58%
22%
20%
相对频数
58
27000
22
21000
20
15000
频数
利润
平均利润是23280。该值更接近实际的数学期望值。
注意:这里的模拟结果是针对订购量Q=6000的描述性结果,由此还不能知道该订购量是否最优。需比较Q=4000、5000、6000、7000、8000、9000后,才能得到最优。
营销研究18
最优订购量的分析法
本问题的最优决策可以通过分析方法求得:
L=
12D-+6(Q -D) 若D≤Q
12Q- 若D>Q
该方程式整理后得:
L=
6D- 若D≤Q
若D>Q
分别分析订购量为4000、5000、6000、7000、8000、9000只的期望利润,比较得出订购量为8000只时,利润最大为26000元
营销研究18
最优订购量的理论计算
E(L)=
∫
9000
4000
L(D)f(D)dD
其中L(D)是利润函数,E(L)是期望利润, f(D)是随机变量D的密度函数。D满足均匀分布,即:
f(D)=
1
9000-4000
4000<D <9000
E(L)=
∫
9000
4000
L(D)f(D)dD=
∫
Q
4000
(6D- )f(D)dD+
∫
Q
9000
(D)dD
=
5000
1
(3D2 -) +
4000
Q
Q
9000
=
5000
1
- 48000000 + 6000Q+ 40500Q -
营销研究18
求E(L)的最大值
对E(L)关于Q求导,并令其等于0得:
-6Q + 46500=0
Q*=7750使E(L)达到最大的Q值
maxE(L)=
5000
1
-3Q2 + 46500Q - 48000000
=
元
尽管可以由上面的公式求得最优订购量,但是,从风险偏好的角度分析,是否该理论计算的最优订购量是满意的结果呢?(比如保守型的决策)
比如,决策订购量为7750时,当需求量为4000或9000时,利润分别为12375元和34875元。而如果订购量为6000时,当需求量为4000或9000时,利润分别为15000元,27000元。你认为那个决策你更愿意采用呢?
营销研究18
系统模拟举例
一家生产汽车零部件的公司按适时准则向汽车制造厂提供汽车零部件,该公司收到了泵的新合同。该公司泵的计划生产能力是每班100台。由于汽车制造厂生产的波动性,因此它对该公司的泵的需求也是波动的,以往的需求在每天80至130台之间。为了保持足够的库存以满足适时供应承诺的要求,该公司采用了一个对策:当库存降至50台或更少时增开一班进行生产。公司在年度预算编制过程中,要知道(决策)增开多少班次?
这里同样可以采用模拟随时间推移的生产安排情况,据此确定增开班次。该模拟模型是每天的库存描述:
期末库存=期初库存+产量-需求量
假设基期库存等于100,汽车制造厂的需求变化是80、90、100、110、120、130。模拟过程中,每天的需求量由掷骰子的方法生成。其中将骰子的1点对应80、2点对应90,以此类推,6点对应130。
营销研究18
模拟过程
新的一天开始:
期初库存等于
前一天的期末库存
掷骰子:
确定需求量
若期初库存≤50
生产200
是
否
生产100
计算期末
库存
足够天数
营销研究18
该公司5个模拟日的结果
130
100
80
1
110
5
110
200
130
6
40
4
40
100
130
6
70
3
70
100
110
4
80
2
80
100
120
5
100
1
期末库存
产量
需求量
骰子点数
期初库存
天
5天的模拟结果是5天中加一班。当然5天的模拟时间太少。如果模拟100天,则某一模拟中的结果是有6次加班。据此推广至一年250个工作日,则应加班6×=15班。当然模拟时间再长一点,如一年的250个工作日,则结论更接近于实际。
营销研究18
在电子表格上建立模拟模型
食品商店订购月饼的EXCEL表上的模拟模型
=IF(E3<=B15,B3*E3-B4*B15+B5*(B15-E3),B3*B15-B4*B15)
营销研究18
汽车零部件制造公司的EXCEL模型
这里模拟结果中的需求是模拟给出的,即通过掷骰子的方法。
生产安排的模拟模型
营销研究18
生成概率结果
随机数可以在EXCEL中利用RAND()在任何单元格中生成,该函数的括号内不要放入任何变量或什么。注意, EXCEL表格中任何单元格被修改后,包含RAND()的任何单元内的值都将被改变。以下是RAND()生成的100个随机数
通过Tools/Option/Calculation可改为手动,在手动模式下,仅当F9键被按下时,工作单元才被重算。
营销研究18
100个随机数的频数分布
利用Data Analysis Tool/Histogram(数据分析/直方图)可汇总工作单元中数值的频数分布。其中Bin表示汇总单元的上限。
营销研究18
由离散分布得到的模拟结果
从(0,1)随机取一个值,可以利用前面所采用的随机数生成函数的方法。那么从离散概率分布中随机选择一个值x,可以采用以下方法,以如下离散概率分布为例:
1/6
6
1/6
3
1/6
5
1/6
2
1/6
4
1/6
1
P(x)
x
P(x)
x
首先将0到1的范围分割成与离散结果的概率对应区间,于是离散结果与分割的区间一一对应。如1对应(0,1/6),2对应,〔1/6 1/3),以此类推,6对应〔5/6 ,1),如图
1/6
1/3
1/2
2/3
5/6
1
0
1
2
3
4
5
6
然后利用RAND函数生成的随机数,看它入在哪个区间,如入在(0,1/6),则随机选择的结果是1,如入在〔5/6 ,1),则随机选择的结果是6。是不是掷骰子的数值方法?
营销研究18
离散分布生成随机结果的例子
已知一个离散分布如下:
1
50
20
30
5
P(x)
p(x)
x
P(x)
p(x)
x
对应于每个结果的随机数的范围:
50
~1
20
~
30
~
5
~
结果
随机数的范围
结果
随机数的范围
随机生成一个结果:
营销研究18
利用EXCEL的函数生成离散结果
方法是利用函数
=VLOOKUP(lookup_value, table_array_, col_index_num)
函数=VLOOKUP(lookup_value, table_array_, col_index_num)的含义是对lookup_value值搜索table_array_表或列阵,可确定lookup_value值在哪个范围的对应行,并在col_index_num列的对应行中得到函数值。
营销研究18
利用EXCEL数据分析工具生成
操作:
营销研究18
Excel上的蒙特卡洛模拟
利用Excel实施蒙特卡洛模拟的程序:
建立电子
表格模型
生成每个概率
变量随机结果
重复上一步
足够多步
输出数据分析
营销研究18
各种订购量的评估
设计同一需求在不同订购量的电子表格,并可进行评价和决策。其中对于利润公式可以用一个简化公式表示:12×Min(D, G) -×G+6×Max(0, G-D)。 100次重复模拟的结果:
营销研究18
Excel的系统模拟
对于前面举例的汽车零部件公司一年要加几个班次呢?模拟250次(日),结果是
营销研究18