第3章 概率基本知识、随机变量及其概率分布
随机现象与随机事件
自然界中存在两种现象。(1)必然现象,(2)随机现象。
必然现象:在一定条件下必然要出现的结果。(水在100度沸腾,春种秋收,行星运行等)
随机现象:在一定条件下,出现的结果不可预料。(某城市每天的用电量,车站每天的的客流量,河流的水流量等)
随机事件:随机现象中每一个可能出现的结果称为随机事件。(掷色子的结果)
随机现象是通过随机试验来观察的。随机试验有以下3个特点。
(1)在相同条件下可以重复进行多次。
(2)每次试验的可能结果不止一个,但究竟哪一个出现事先无法预料。
(3)试验中所有可能出现的结果是已知的,但每次试验只能出现其中一个。
例如,投硬币问题。某路口5分钟内通过的车辆数。100粒种子的发芽数。
随机试验过程中,每一个可能结果的出现是偶然的,但在多次试验中具有规律性。
概率定义与性质
人们不但希望知道随机事件的结果,重要的是想知道该结果发生的可能性有多大。为什么研究经济和管理问题还要研究概率?有助于从理论和本质上认识经济变量的变化规律。
概率的定义。
(1)概率的统计定义
P(A) = p = =(发生的次数/试验次数)
通过大量的实验得出结果。例如投币问题。
图 模拟投币1000次正面朝上次数与试验总次数的比
(2)概率的古典定义
①随机试验中发生的可能结果个数是有限的。②每一个可能结果发生的可能性是相等的。
P(A) = p = =(A中包含的基本事件数m / 基本事件总数n) ()
利用等可能完备事件组进行分析。例如掷色子问题。若A表示奇数点,则m=3,n=6。
P(A) = p = = = 。
(3)主观概率
对于不可重复试验,主观概率是人对事件发生可能性的判断。因人而异,但不是乱猜。例如,考上大学的概率。
(4) 概率性质:
① 0 ( P(A) ( 1
② P(必然事件) = 1
③ P(不可能事件) = 0
随机变量及其分布。
为了更好的研究随机现象,把随机事件和随机变量联系起来。不同的随机事件看作是某个随机变量在随机试验中取得的不同数值。
随机变量定义:按一定的概率取不同实数值的变量称为随机变量,用x, y等表示。
有时人们不但关心某个随机变量取某个值的概率,还关心该随机变量在整个取值域上的概率。这就是随机变量的概率分布问题。
概率分布类型同样是人们长期对随机变量分布规律的总结,是由实践中总结出来的,但高于实践(例,勾股定理)。例如正态分布就是高斯(Causs)长期对误差分布的研究总结出来的。
北京市某医院1000个新生儿体重值的频数分布表明,新生儿体重值服从正态分布。
图
数据的频率分布是概率分布的近似。数据越多近似性越好。
图 20个新生儿体重值的频数分布 图 1000个新生儿体重值的频数分布
常用的概率分布。
(1)正态分布定义:若连续型随机变量x的概率密度函数为
f (x) = exp(-)
其中(, ( 为常量,( > 0,则称x服从正态分布。记作x ( N((, (2 )。可以证明(, ( 分别是x的数学期望和标准差,即。
E(x) = ( , Var (x) = ( 2 , = (
三种不同参数的正态分布曲线见图。
正态分布的概率密度函数具有如下性质:
① 正态分布曲线以x = ( 对称。最大值点在x = ( 处,即f (x) = 。
② 概率密度函数f (x) 呈钟形。在x = ( ( ( 处密度函数曲线有拐点。
③ 当x ( ( ( 时,f (x) 以x轴为渐近线。
④ 当( 较大时,f (x) 曲线较平缓;当( 较小时,f (x) 曲线较陡峭。
⑤ 已知( 和( 的值,就可以完全确定正态分布密度函数。
对某产品的物理量测量、误差的测量常服从于正态分布。
图 正态分布曲线 图 标准正态分布曲线
(2)标准正态分布定义:
对于正态分布密度函数f (x),当( = 0,( = 1时,即
f (x) =exp(-)
称连续型随机变量x服从标准正态分布。记作x ( N(0, 1 )。
对于标准正态分布E(x) = 0,Var(x) = =1。
标准正态分布曲线见图。标准正态分布密度函数f (x)有如下性质:
① f0(x) 以纵轴对称;
② x = 0 时,f0(x) 的极大值是 1/= ;
③ f (x) 在x = (1处有两个拐点;
④ f0 (x) = 0。
(3)正态分布随机变量的标准化。
可以证明若x ( N((, ( 2 ),则
Z = ( N(0, 1 )
可见对一般正态分布随机变量x做变换Z = ,则可以把x转化为服从标准正态分布的随机变量Z。
对一般正态分布随机变量x计算概率非常不方便。通过标准化变换,利用标准正态分布累计概率表,则很容易计算出x取任意两个值之间的概率。
例1:以1000瓶橙汁饮料净重值为例画直方图如下(file:bank02)。
图
例2:如果已知瓶装橙汁饮料平均净重值为500克,标准差为1克。求瓶装橙汁饮料净重值在501至502克之间的概率是多少。
解:把501和502克标准化。(501-500)/1=1,(502-500)/1=2。所以1至2之间的概率就是橙汁饮料净重值501至502克之间的概率。查表
P(2)- P(1) = =
答:橙汁饮料净重值501至502克之间的概率是。
例3:如果已知瓶装橙汁饮料平均净重值为500克,标准差为1克。求瓶装橙汁饮料净重值在499至502克之间的概率是多少。
解:把499和502克标准化。(499-500)/1= -1,(502-500)/1=2。所以-1至2之间的概率就是橙汁饮料净重值499至502克之间的概率。查表
P(2)- P(-1) = P(2) – [1- P(1)]= - () = - =
答:橙汁饮料净重值499至502克之间的概率是。
例3:如果已知瓶装橙汁饮料平均净重值为500克,标准差为1克。求瓶装橙汁饮料净重值在497至499克之间的概率是多少。
解:把497和499克标准化。(497-500)/1= -3,(499-500)/1= -1。所以-3至-1之间的概率就是橙汁饮料净重值497至499克之间的概率。查表
P(-1)- P(-3) = [1- P(1)] - [1- P(3)]= () - () =
答:橙汁饮料净重值497至499克之间的概率是。
附表:标准正态分布函数表
u
0
0
0
0
0
9
9
9
9
9
8
8
8
7
7
6
6
5
4
3
3
2
1
0
8
7
6
4
3
1
9
7
5
3
1
8
4
3
0
7
4
1
8
4
0
6
2
8
4
9
5
0
5
9
4
8
3
7
0
4
7
1
4
7
9
2
4
6
7
9
0
1
2
3
3
4
4
4
3
2
1
0
9
7
5
3
1
8
6
3
9
6
2
8
4
9
5
0
5
9
3
8
1
5
8
1
4
7
9
1
3
5
6
8
9
9
0
0
0
0
9
9
8
7
5
4
2
0
7
47
20
90
58
24
88
49
09
66
21
74
24
73
20
64
07
47
85
22
56
89
19
48
74
99
22
43
62
79
08
20
30
38
45
50
53
54
54
52
43
37
28
18
07
94
80
64
46
27
07
85
62
38
21
84
56
26
95
62
28
93
57
20
81
41
00
58
15
70
25
78
31
82
32
82
30
77
24
69
14
57
00
41
82
22
61
00
37
74
10
45
79
13
45
78
09
40
70
99
28
56
83
097
358
613
863
106
344
576
802
024
240
451
656
857
053
244
431
613
790
963
132
297
457
614
766
915
060
201
339
473
604
731
855
975
093
207
319
427
533
636
736
833
928
020
110
197
282
365
445
523
599
673
744
814
882
948
012
074
134
193
250
305
359
411
462
511
559
605
650
694
736
777
817
856
893
930
965
000
= (u≥0)
PAGE
PAGE 27