第五章 概率与概率分布
统计学
第五章 概率与概率分布
第一节 概率基础
第二节 随机变量及其分布
学习目标
1. 了解随机事件的概念、事件的关系和运算
2. 理解概率的定义,掌握概率的性质和运算法则
理解随机变量及其分布,计算各种分布的概率
用Excel计算分布的概率
第一节 概率基础
一. 随机事件及其概率
二. 概率的性质与运算法则
随机事件的几个基本概念
试 验
在相同条件下,对事物或现象所进行的观察
例如:掷一枚骰子,观察其出现的点数
试验具有以下特点
可以在相同的条件下重复进行
每次试验的可能结果可能不止一个,但试验的所有可能结果在试验之前是确切知道的
在试验结束之前,不能确定该次试验的确切结果
事件的概念
事件:随机试验的每一个可能结果(任何样本点集合)
例如:掷一枚骰子出现的点数为3
随机事件:每次试验可能出现也可能不出现的事件
例如:掷一枚骰子可能出现的点数
必然事件:每次试验一定出现的事件,用表示
例如:掷一枚骰子出现的点数小于7
不可能事件:每次试验一定不出现的事件,用表示
例如:掷一枚骰子出现的点数大于6
事件与样本空间
基本事件
一个不可能再分的随机事件
例如:掷一枚骰子出现的点数
样本空间
一个试验中所有基本事件的集合,用表示
例如:在掷枚骰子的试验中,{1,2,3,4,5,6}
在投掷硬币的试验中,{正面,反面}
事件的关系和运算
(事件的包含)
A
B
B A
若事件A发生必然导致事件B发生, 则称事件B包含事件A,或事件A包含于事件B,记作或 A B或 B A
事件的关系和运算
(事件的并或和)
事件A和事件B中至少有一个发生的事件称为事件A与事件B 的并。它是由属于事件A或事件B的所有的样本点组成的集合,记为A∪B或A+B
B
A
A∪B
事件的关系和运算
(事件的交或积)
A
B
A∩B
事件A与事件B同时发生的事件称为事件A与事件B的交,它是由属于事件A也属于事件B的所有公共样本点所组成的集合,记为B∩A 或AB
事件的关系和运算
(互斥事件)
A
B
A 与 B互不相容
事件A与事件B中,若有一个发生,另一个必定不发生, 则称事件A与事件B是互斥的,否则称两个事件是相容的。显然,事件A与事件B互斥的充分必要条件是事件A与事件B没有公共的样本点
事件的关系和运算
(事件的逆)
A
A
一个事件B与事件A互斥,且它与事件A的并是整个样本空间,则称事件B是事件A的逆事件。它是由样本空间中所有不属于事件A的样本点所组成的集合,记为A
事件的关系和运算
(事件的差)
A - B
A
B
事件A发生但事件B不发生的事件称为事件A与事件B的差,它是由属于事件A而不属于事件B的那些样本点构成的集合,记为A-B
事件的关系和运算
(事件的性质)
设A、B、C为三个事件,则有
交换律:A∪B=B∪A
A∩B=B∩A
结合律:A∪(B∪C)=(A∪B)∪C
A(BC) =(AB) C
分配律:A∪(B∩C)=(A∪B)∩(A∪C)
A∩(B∪C)=(A∩B)∪(A∩C)
事件的概率
事件的概率
事件A的概率是对事件A在试验中出现的可能性大小的一种度量
表示事件A出现可能性大小的数值
事件A的概率表示为P(A)
概率的定义有:古典定义、统计定义和主观概率定义
事件的概率
例如,投掷一枚硬币,出现正面和反面的频率,
随着投掷次数 n 的增大,出现正面和反面的频率
稳定在1/2左右
试验的次数
正面 /试验次数
0
25
50
75
100
125
概率的古典定义
如果某一随机试验的结果有限,而且各个结果在每次试验中出现的可能性相同,则事件A发生的概率为该事件所包含的基本事件个数 m 与样本空间中所包含的基本事件个数 n 的比值,记为
概率的古典定义
(实例)
【例】某钢铁公司所属三个工厂的职工人数如下表。从
该公司中随机抽取1人,问:
(1)该职工为男性的概率
(2)该职工为炼钢厂职工的概率
12500
4000
8500
合计
6200
4800
1500
合计
1800
1600
600
4000
3200
900
炼钢厂
炼铁厂
轧钢厂
女职工
男职工
工厂
某钢铁公司所属企业职工人数
概率的古典定义
(计算结果)
解:(1)用A 表示“抽中的职工为男性”这一事件;A为全公司男职工的集合;基本空间为全公司职工的集合。则
(2) 用B 表示“抽中的职工为炼钢厂职工”;B为炼钢厂
全体职工的集合;基本空间为全体职工的集合。则
概率的统计定义
在相同条件下进行n次随机试验,事件A出现 m 次,则比值 m/n 称为事件A发生的频率。随着n的增大,该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,取向于稳定,这个频率的稳定值即为事件A的概率,记为
概率的统计定义
(实例)
【例】:某工厂为节约用电,规定每天的用电量指标
为1000度。按照上个月的用电记录,30天中有12天的
用电量超过规定指标,若第二个月仍没有具体的节电
措施,试问该厂第一天用电量超过指标的概率。
解:上个月30天的记录可以看作是重复进行了30次
试验,试验A表示用电超过指标出现了12次。根据概
率的统计定义有
主观概率定义
对一些无法重复的试验,确定其结果的概率只能根据以往的经验人为确定
概率是一个决策者对某事件是否发生,根据个人掌握的信息对该事件发生可能性的判断
例如,我认为2001年的中国股市是一个盘整年
概率的性质与运算法则
概率的性质
非负性
对任意事件A,有 0 P 1
规范性
必然事件的概率为1;不可能事件的概率为0。即P ( ) = 1; P ( ) = 0
可加性
若A与B互斥,则P ( A∪B ) = P ( A ) + P ( B )
推广到多个两两互斥事件A1,A2,…,An,有 P ( A1∪A2 ∪… ∪An) = P ( A1 ) + P (A2 ) + …+ P (An )
概率的加法法则
法则一
两个互斥事件之和的概率,等于两个事件概率之和。设A和B为两个互斥事件,则
P ( A∪B ) = P ( A ) + P ( B )
事件A1,A2,…,An两两互斥,则有
P ( A1∪A2 ∪… ∪An)
= P ( A1 ) + P (A2 ) + …+ P (An )
概率的加法法则
(实例)
【例】根据钢铁公司职工的例子,随机抽取一名职工,计算该职工为炼钢厂或轧钢厂职工的概率
解:用A表示“抽中的为炼钢厂职工”这一事件;B表示“抽中的为轧钢厂职工”这一事件。随机抽取一人为炼钢厂或轧钢厂职工的事件为互斥事件A与B 的和,其发生的概率为
概率的加法法则
法则二
对任意两个随机事件A和B,它们和的概率为两个事件分别概率的和减去两个事件交的概率,即
P ( A∪B ) = P ( A ) + P ( B ) - P ( A∩B )
概率的加法法则
(实例)
【例】设某地有甲、乙两种报纸,该地成年人中有20%读甲报纸,16%读乙报纸,8%两种报纸都读。问成年人中有百分之几至少读一种报纸。
解:设A={读甲报纸},B={读乙报纸},C={至少读一种报纸}。则
P ( C ) =P ( A∪B )
= P ( A ) + P ( B ) - P ( A∩B )
= + - =
条件概率与独立事件
条件概率
在事件B已经发生的条件下,求事件A发生的概率,称这种概率为事件B发生条件下事件A发生的条件概率,记为
P(B)
P(AB)
P(A|B) =
条件概率的图示
事件 AB及其概率P (AB)
事件B及其概率P (B)
事件A
事件B
一旦事件B发生
概率的乘法公式
用来计算两事件交的概率
以条件概率的定义为基础
设A、B为两个事件,若P(B)>0,则P(AB)=P(B)P(A|B),或P(AB)=P(A)P(B|A)
概率的乘法公式
(实例)
【例】设有1000中产品,其中850件是正品,150件是次品,从中依次抽取2件,两件都是次品的概率是多少?
解:设 Ai 表示“第 i 次抽到的是次品”(i=1,2),所求概率为P(A1A2)
事件的独立性
一个事件的发生与否并不影响另一个事件发生的概率,则称两个事件独立
若事件A与B独立,则P(B|A)=P(B), P(A|B)=P(A)
此时概率的乘法公式可简化为
P(AB)=P(B)·P(B)
推广到n个独立事件,有
P(A1 A2 …An)=P(A1)P(A2) … P(An)
事件的独立性
(实例)
【例】某工人同时看管三台机床,每单位时间(如30分钟)内机床不需要看管的概率:甲机床为,乙机床为,丙机床为。若机床是自动且独立地工作,求
(1)在30分钟内三台机床都不需要看管的概率
(2)在30分钟内甲、乙机床不需要看管,且丙机床需要看管的概率
解:设 A1,A2,A3为甲、乙、丙三台机床不需要看管的事件, A3 为丙机床需要看管的事件,依题意有
(1) P(A1A2A3)= P(A1) P(A2) P(A3)==
(2) P(A1A2A3)= P(A1) P(A2) P(A3)
= ()=
全概公式
设事件A1,A2,…,An 两两互斥, A1+A2+…+ An=(满足这两个条件的事件组称为一个完备事件组),且P(Ai)>0(i=1,2, …,n),则对任意事件B,有
我们把事件A1,A2,…,An 看作是引起事件B发生的所有可能原因,事件B 能且只能在原有A1,A2,…,An 之一发生的条件下发生,求事件B 的概率就是上面的全概公式
全概公式
(实例)
【例】某车间用甲、乙、丙三台机床进行生产,各种机床的次品率分别为5%、4%、2%,它们各自的产品分别占总产量的25%、35%、40%,将它们的产品组合在一起,求任取一个是次品的概率。
解:设 A1表示“产品来自甲台机床”, A2表示“产品来自乙台机床”, A3表示“产品来自丙台机床”, B表示“取到次品”。根据全概公式有
贝叶斯公式
(逆概公式)
与全概公式解决的问题相反,贝叶斯公式是建立在条件概率的基础上寻找事件发生的原因
设n个事件A1,A2,…,An 两两互斥, A1+A2+…+ An= (满足这两个条件的事件组称为一个完备事件组),且P(Ai)>0(i=1,2, …,n),则
贝叶斯公式
(实例)
【例】某车间用甲、乙、丙三台机床进行生产,各种机床的次品率分别为5%、4%、2%,它们各自的产品分别占总产量的25%、35%、40%,将它们的产品组合在一起,如果取到的一件产品是次品,分别求这一产品是甲、乙、丙生产的概率
解:设 A1表示“产品来自甲台机床”, A2表示“产品来自乙台机床”, A3表示“产品来自丙台机床”, B表示“取到次品”。根据贝叶斯公式有:
第二节 随机变量及其分布
一. 随机变量的概念
离散型随机变量的概率分布
连续型随机变量的概率分布
随机变量的概念
随机变量的概念
一次试验的结果的数值性描述
一般用 X、Y、Z 来表示
例如: 投掷两枚硬币出现正面的数量
根据取值情况的不同分为离散型随机变量和连续型随机变量
离散型随机变量
随机变量 X 取有限个值或所有取值都可以逐个列举出来 X1 , X2,…
以确定的概率取这些不同的值
离散型随机变量的一些例子
0,1,2, …,100
0,1,2, …
0,1, 2,…
男性为0,女性为1
可能的取值
取到次品的个数
顾客数
销售量
顾客性别
抽查100个产品
一家餐馆营业一天
电脑公司一个月的销售
销售一辆汽车
随机变量
试验
连续型随机变量
随机变量 X 取无限个值
所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点
连续型随机变量的一些例子
X 0
0 X 100
X 0
可能的取值
使用寿命(小时)
半年后工程完成的百分比
测量误差(cm)
抽查一批电子元件
新建一座住宅楼
测量一个产品的长度
随机变量
试验
离散型随机变量的概率分布
离散型随机变量的概率分布
列出离散型随机变量X的所有可能取值
列出随机变量取这些值的概率
通常用下面的表格来表示
p1 ,p2 ,… ,pn
P(X =xi)=pi
x1 ,x2 ,… ,xn
X = xi
P(X =xi)=pi称为离散型随机变量的概率函数
pi0
0
离散型随机变量的概率分布
(实例)
【例】如规定打靶中域Ⅰ得3分,中域Ⅱ得2分,中域Ⅲ得1分,中域外得0分。今某射手每100次射击,平均有30次中域Ⅰ,55次中域Ⅱ,10次中Ⅲ,5次中域外。则考察每次射击得分为0,1,2,3这一离散型随机变量,其概率分布为
P(X=xi)pi
0 1 2 3
X = xi
离散型随机变量的概率分布
(0—1分布)
一个离散型随机变量X只取两个可能的值
例如,男性用 1表示,女性用0表示;合格品用 1 表示,不合格品用0表示
列出随机变量取这两个值的概率
离散型随机变量的概率分布
(0—1分布实例)
【例】已知一批产品的次品率为p=,合格率为q=1-p==。并指定废品用1表示,合格品用0表示。则任取一件为废品或合格品这一离散型随机变量,其概率分布为
P(X=xi)=pi
0 1
X = xi
0
1
1
x
P(x)
离散型随机变量的概率分布
(均匀分布)
一个离散型随机变量取各个值的概率相同
列出随机变量取值及其取值的概率
例如,投掷一枚骰子,出现的点数及其出现各点的概率
离散型随机变量的概率分布
(均匀分布实例)
【例】投掷一枚骰子,出现的点数是个离散型随机变量,其概率分布为
1/6 1/6 1/6 1/6 1/6 1/6
P(X=xi)=pi
1 2 3 4 5 6
X = xi
0
1/6
P(x)
1
x
2
3
4
5
6
离散型随机变量的数学期望和方差
离散型随机变量的数学期望
在离散型随机变量X的一切可能取值的完备组中,各可能取值xi与其取相对应的概率pi乘积之和
描述离散型随机变量取值的集中程度
计算公式为
离散型随机变量的方差
随机变量X的每一个取值与期望值的离差平方和的数学期望,记为D(X)
描述离散型随机变量取值的分散程度
计算公式为
离散型随机变量的方差
(实例)
【例】投掷一枚骰子,出现的点数是个离散型随机变量,其概率分布为如下。计算数学期望和方差
1/6 1/6 1/6 1/6 1/6 1/6
P(X =xi)=pi
1 2 3 4 5 6
X = xi
解:数学期望为:
方差为:
几种常见的离散型概率分布
常见的离散型概率分布
超几何分布
离散型随机变量的概率分布
泊松分布
二项分布
二项试验
(贝努里试验)
二项分布与贝努里试验有关
贝努里试验具有如下属性
试验包含了n 个相同的试验
每次试验只有两个可能的结果,即“成功”和“失败”
出现“成功”的概率 p 对每次试验结果是相同的;“失败”的概率 q 也相同,且 p + q = 1
试验是相互独立的
试验“成功”或“失败”可以计数
二项分布
进行 n 次重复试验,出现“成功”的次数的概率分布称为二项分布
设X为 n 次重复试验中事件A出现的次数,X 取 x 的概率为
二项分布
显然, 对于P{X=x} 0, x =1,2,…,n,有
同样有
当 n = 1 时,二项分布化简为
二项分布的数学期望和方差
二项分布的数学期望为
E ( X ) = np
方差为
D ( X ) = npq
二项分布
(实例)
【例】已知100件产品中有5件次品,现从中任取一件,有放回地抽取3次。求在所抽取的3件产品中恰好有2件次品的概率
解:设 X 为所抽取的3件产品中的次品数,则X~B ( 3 , ),根据二项分布公式有
泊松分布
用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布
泊松分布的例子
一个城市在一个月内发生的交通事故次数
消费者协会一个星期内收到的消费者投诉次数
人寿保险公司每天收到的死亡声明的人数
泊松概率分布函数
— 给定的时间间隔、长度、面积、体积内“成功”的平均数
e =
x —给定的时间间隔、长度、面积、体积内“成功”的次数
泊松概率分布的期望和方差
泊松分布的数学期望为
E ( X ) =
方差为
D ( X ) =
泊松分布
(实例)
【例】假定某企业的职工中在周一请假的人数X服从泊松分布,且设周一请事假的平均人数为人。求
(1)X 的均值及标准差
(2)在给定的某周一正好请事假是5人的概率
解:(1) E(X)==;D(X) = ==
(2)
泊松分布
(作为二项分布的近似)
当试验的次数 n 很大,成功的概率 p 很小时,可用泊松分布来近似地计算二项分布的概率,即
实际应用中,当 P,n>20,np5时,近似效果良好
连续型随机变量的概率分布
连续型随机变量的概率分布
指数分布
连续型随机变量的概率分布
正态分布
均匀分布
其他分布
连续型随机变量的概率分布
连续型随机变量可以取某一区间或整个实数轴上的任意一个值
它取任何一个特定的值的概率都等于0
不能列出每一个值及其相应的概率
通常研究它取某一区间值的概率
用数学函数的形式和分布函数的形式来描述
概率密度函数
设X为一连续型随机变量,x 为任意实数,X的概率密度函数记为f(x),它满足条件
f(x)不是概率
概率密度函数
密度函数 f(x)表示X 的所有取值 x 及其频数f(x)
值
(值, 频数)
频数
f(x)
a
b
x
概率密度函数
在平面直角坐标系中画出f(x)的图形,则对于任何实数 x1 < x2,P(x1< X x2)是该曲线下从x1 到 x2的面积
f(x)
x
a
b
概率是曲线下的面积
分布函数
连续型随机变量的概率也可以用分布函数F(x)来表示
分布函数定义为
根据分布函数,P(a<X<b)可以写为
分布函数与密度函数的图示
密度函数曲线下的面积等于1
分布函数是曲线下小于 x0 的面积
f(x)
x
x0
F ( x0 )
连续型随机变量的期望和方差
连续型随机变量的数学期望为
方差为
均匀分布
均匀分布
若随机变量X的概率密度函数为
称X在区间[a ,b]上均匀分布
数学期望和方差分别为
x
f(x)
b
a
正态分布
正态分布的重要性
1. 描述连续型随机变量的最重要的分布
2. 可用于近似离散型随机变量的分布
例如: 二项分布
3. 经典统计推断的基础
x
f (x)
概率密度函数
f(x) = 随机变量 X 的频数
= 总体方差
=; e =
x = 随机变量的取值 (- < x < )
= 总体均值
正态分布函数的性质
概率密度函数在x 的上方,即f (x)>0
正态曲线的最高点在均值,它也是分布的中位数和众数
正态分布是一个分布族,每一特定正态分布通过均值的标准差来区分。 决定曲线的高度,决定曲线的平缓程度,即宽度
曲线f(x)相对于均值对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交
正态曲线下的总面积等于1
随机变量的概率由曲线下的面积给出
和 对正态曲线的影响
x
f(x)
C
A
B
正态分布的概率
概率是曲线下的面积!
a
b
x
f(x)
标准正态分布的重要性
一般的正态分布取决于均值和标准差
计算概率时 ,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的
若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表
标准正态分布函数
任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布
标准正态分布的概率密度函数
标准正态分布的分布函数
标准正态分布
x
m
s
一般正态分布
=1
Z
标准正态分布
标准正态分布表的使用
将一个一般的转换为标准正态分布
计算概率时 ,查标准正态概率分布表
对于负的 x ,可由 (-x) x得到
对于标准正态分布,即X~N(0,1),有
P (a X b) b a
P (|X| a) 2 a 1
对于一般正态分布,即X~N( , ),有
标准化的例子
P(5 X )
x
=5
=10
一般正态分布
=1
Z
标准正态分布
0
.0478
标准化的例子
P( X )
一般正态分布
.1664
.0832
.0832
标准正态分布
正态分布
(实例)
【例】设X~N(0,1),求以下概率:
(1) P(X <) ;(2) P(X >2); (3) P(-1<X 3) ; (4) P(| X | 2)
解:(1) P(X <) = ()=
(2) P(X >2)=1- P(2 X)==
(3) P(-1<X 3)= P(X 3)- P(X <-1)
= (3)- (-1)= (3) – [1-(1)]
= -()=
(4) P(| X | 2) = P(-2 X | 2)= (2)- (-2)
= (2)- [1-(2)]=2 (2)- 1=
正态分布
(实例)
【例】设X~N(5,32),求以下概率
(1) P(X 10) ; (2) P(2<X <10)
解: (1)
(2)
二项分布的正态近似
二项分布的正态近似
当n 很大时,二项随机变量X近似服从正态分布N{np , np(1-p)}
对于一个二项随机变量X,当n很大时,求 P(x1Xx2)时可用正态分布近似为
为什么概率是近似的
.0
.1
.2
.3
0
2
4
6
8
10
x
P(x)
正态曲线增加的概率
正态曲线减少的概率
二项概率:矩形的面积
正态概率:曲线下从到的面积
增加的部分与减少的部分不一定相等
二项分布的正态近似
(实例)
【例】100台机床彼此独立地工作,每台机床的实际工作时间占全部工作时间的8%。求
(1)任一时刻有70~80台机床在工作的概率
(2)任一时刻有80台以上机床在工作的概率
解:设X表示100机床中工作着的机床数,则X~B(100,)。现用正态分布近似计算,np=80,npq=16
(1)
(2)
本章小结
定义试验、结果、事件、样本空间、概率
描述和使用概率的运算法则
定义和解释随机变量及其分布
计算随机变量的数学期望和方差
计算离散型随机变量的概率和概率分布
计算连续型随机变量的概率
用正态分布近似二项分布
用Excel计算分布的概率
结 束
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
3
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
3
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
As the number of vertical bars (n) increases, the errors due to approximating with the normal decrease.
As a result of this class, you will be able to ...