第七章 随机变量及概率分布
随机变量
离散型随机变量的概率分布
正态分布
抽样分布
随机变量
随机变量的概念
随机变量的分类
随机变量的概念
所谓随机变量,就是按一定的概率取值的变量。通常用大写拉丁字母 X、Y、Z或希腊字母 表示。
随机变量的概念
随机变量有以下两个特性:
(1)取值的不确定性。由于随机事件在一次试验中可能出现,也可能不出现,具有一定的随机性,因此随机变量的取值也是随机的。
(2)随机变量的取值虽然是不确定的,但由于随机变量出现的可能性大小是遵循一定规律的,因此,随机变量的取值也是有规律性的。
随机变量的概念
例1 进入某商店的顾客,有购物和不购物两种,可能结果中,购物的占25%。若购物记为1,不购物记为0,并以字母X表示购物与否,则
X是随购物与否取值(0或1)的随机变量。
随机变量的概念
例2 20件产品中有3件次品,从中任取2件,其中的次品数是个随机变量,若用X表示,则X的可能值为0、1、2。
例3 测量某一工件的长度,用X表示测量得到的数值,由于受到仪器的精度、操作者的水平,温度等因素的影响,X的取值可能是某一特定区间[a、b]上的某一实数值,X是随测量结果在[a、b]上取值的一个随机变量。
随机变量的分类
(1)离散型随机变量
(2)连续型随机变量
(1) 离散型随机变量
如果随机变量X的所有取值都可以逐个列举出来,则称X为离散型随机变量。
例如,在一批产品中“取到次品的个数”,“单位时间内交换台收到的呼叫次数”等都是离散型随机变量。
(2)连续型随机变量
如果随机变量X的所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任一点,则称该随机变量为连续型随机变量。例如,一批电子元件的寿命以及实际中常遇到的“测量误差”等都是连续型随机变量。
离散型随机变量的概率分布
离散型随机变量概率分布的概念
离散型随机变量的数学期望和方差
二项分布
离散型随机变量概率分布的概念
离散型随机变量的概率分布是由离散型随机变量所有可能的取值( )及其相应的概率( )组成,它反映了随机变量各个取值发生可能性的大小及它们的分布状况和分布特征。
离散型随机变量概率分布的概念
离散型随机变量的概率分布特征:
(1)随机变量任取一值的概率都界于0和1之内,
即(
(2)随机变量所有取值的概率之和等于1。即
离散型随机变量概率分布的概念
例如:抛一个骰子,即一个四方体,上面六个面,分别记1、2、3、4、5、6分,显然,出现其中一个分值的概率是1/6,这离散型随机变量的概率分布如下表和下图。
离散型随机变量概率分布的概念
表7-1 抛一个骰子的概率分表
累计概率
1
1
1/6
1/6
2
2
1/6
2/6
3
3
1/6
3/6
4
4
1/6
4/6
5
5
1/6
5/6
6
6
1/6
6/6
1
-
3
6
5
4
2
1
0
x
离散型随机变量的数学期望和方差
(1)离散型随机变量的数学期望
数学期望是随机变量各个取值 与相应概率 的乘积的和,它反映分布的中心位置。即
离散型随机变量的数学期望和方差
例1 某社区每个家庭每年去诊所就医次数的概率分布如下表
年平均就医次数( )
0
1
2
3
4
试求:该社区家庭年平均就医次数的数学期望
并解释其含义。
表7-2 某社区就医次数概率分布表
解:
它说明该社区家庭年平均就医次。
数学期望 的意义:随机变量的数学期望是以其取值的概率为权数的一种平均,它给出了概率分布中心位置的测度,有时也简称 为随机变量X的均值。
离散型随机变量的数学期望和方差
离散型随机变量的数学期望和方差
数学期望性质:
①设c常数,则有
②设 为随机变量,c为常数,则
③设 为任意两个随机变量,则 。
一般地,有
离散型随机变量的数学期望和方差
数学期望性质:
④设 为两个相互独立的随机变量,则
,一般地,若
为相互独立的随机变量,则
⑤随机变量的线性函数的数学期望
若 ,则 ,其中
为任意两个随机变量, 为常数。
离散型随机变量的数学期望和方差
例2:令 表示某工厂甲产品的日产量, 表示甲产品的成本,有 ,此处 表示固定成本, 表示单位甲产品所需变动成本,求平均产量为50时的平均成本 。
解:
令有 则 为
离散型随机变量的数学期望和方差
(2)离散型随机变量的方差和标准差
方差是随机变量与数学期望离差平方的数学期望,它反映分布的离中程度。一般用 或 表示。
即
对于离散型变量
式中 为 时的概率 ,也可用
表示。
如例1来就医的次数X的分布中,求得每个家庭年平均就医次数 ,那么,就医次数的方差可计算如下:
离散型随机变量的数学期望和方差
离散型随机变量的数学期望和方差
如果用方差的平方跟来研究随机变量取值离开其均值的程度,则具有相同的测度单位,从而更能准确描述分布的离散趋势,这就涉及到标准差,其定义如下:
随机变量的标准差 或 为其方差的算数平方根, 或 。
例1中,每个家庭年就医次数的标准差
即,它表示该社区家庭年就医次数与平均年就医次数的平均离差为次。
方差具有以下性质:
①当c为常数,则
②当 为一随机变量,c是常数,则
③若 、为两个相互独立的随机变量,则
④若c为常数, 为随机变量,则:
离散型随机变量的数学期望和方差
二项分布
在每次试验中有两种可能结果的二项分布无疑是应用最广的离散型随机变量的概率分布。像每一次试验只有两个结果的重复试验称为贝努里试验。
如果把一枚硬币抛掷固定次数的结果作为贝努里试验的例子,那么贝努里试验有以下特点:
(1)每次试验(在本例中就是抛一次)只有两种可能结果:正面或反面,是或否,成功或失败;
(2)不管进行多少次,任何一次试验结果的概率是固定的,对于一枚硬币,每抛一次出现正面的概率是;
(3)试验是独立的,即每次抛币法结果不影响任何其他抛币结果。
二项分布
二项分布
例1 在生产某个零件的过程中,每个零件可能合格或不合格,这个生产过程可以看作一个贝努里试验序列。我们以对应生产中的第i个零件。如果这个零件不合格,以 表示;如果合格,以
表示。但我们更关心的是在对近期生产中的1000个零件的检验中出现k个不合格产品的概率,即 的概率。
则我们将二项随机变量定义为n个独立且具有同分布的贝努里随机变量之和(以 表示):
为一个二项随机变量。
二项分布
二项概率函数是指描述二项随机变量分布的概率函数,它是考查n次独立同分布贝努里试验中
的概率函数。
概率分布为 ,式中:
,0<p<1, 是二项系数,且
二项分布
二项概率分布是离散型的。因 只能取
个值,即 ,一旦指定了 和 的值,一个唯一的二项分布就确定了。故称 和
为二项概率分布的参数。所以通常把服从二项概率分布的随机变量记作 ,二项分布的数学期望值为 ,方差为 。
由二项式定理可以推出
正态分布
正态分布的概率密度函数及其数学性质
标准正态分布及其应用
正态分布的概率密度函数
及其数学性质
如果对于随机变量X的分布函数 ,存在着非负的函数 ,使对于任意实数 ,有
,则称 为 的概率密度函数,简称“概率密度。”
连续随机变量的密度函数为:
式中 , , 为随机变量 的均值, 为随机变量 的标准差,则称 服从参数 , 的正态分布 。记作 ,如图7-2 。
图7-2
正态分布的概率密度函数
及其数学性质
为了画出正态分布的图形,我们先对概率密度 做几点讨论:
(1) ,即整个概率密度曲线都在 轴上方;
(2)曲线 ,相对于 对称,并在
处达到最大值 。
(3)曲线的陡缓程度由 决定, 越大,曲线越平缓; 越小,曲线越陡峭;
(4)当 时,曲线以x轴为其渐近线,如图7-2,图中 决定图形的中心位置, 决定图形陡峭程度。
正态分布的概率密度函数
及其数学性质
标准正态分布及其应用
在正态分布概率密度函数 的基础上,令
, 由于是正态随机变量的线性组合,因此当对Z求数学期望值和方差时得
是一个具有 正态随机变量,称
为标准正态随机变量,称其概率密度函数 为标准随机变量的概率密度函数,相应的分布称标准正态分布,简称 分布。(如图7-3)
(1)标准正态分布
的概率密度函数是:
图7-3
标准正态分布及其应用
(2)正态分布表
由于任何正态随机变量通过上述变换,都可以转化为标准正态随机变量,因此,只要计算出正态随机变量 的取值区间为 的概率
并将其编成表,就可以求出任何正态随机变量
的取值区间为 的概率,即
标准正态分布及其应用
因为标准正态分布也是个对称的钟形分布,对称线为 ,所以当以对称线 为中心将概率密度曲线 之下的面积一分为二时,二者面积相等,各为1/2 ,即
注:
标准正态分布及其应用
例1:某软饮料公司包装可乐时,每瓶重量平均为330毫升,标准差为10毫升,并已知每瓶重量是个正态随机变量。公司总经理认为如果每瓶包装重量超过338毫升,其费用将超出成本预算范围;每瓶低于325升,将达不到规定的重量标准。问该公司的瓶装可乐在每瓶325-338毫升的概率是多少?
标准正态分布及其应用
解:对 进行变量转换
查书附录的 分布表得
由此可见,该公司的瓶装可乐既不超出成本预算的重量,又不低于规定的重量标准的可能性或概率只有%。
标准正态分布及其应用
图7-4 瓶装可乐重量为325~338ml的概率
标准正态分布及其应用
-2
-1
0
+1
+2
抽样分布
正态总体中的 分布
分布
t 分布
F 分布
正态总体中的 分布
定理:设 是独立分布随机变量,且每个随机变量服从正态分布 ,则其均值
服从正态分布 。
正态总体中的 分布
因为独立正态变量之和 仍为正态变量,
乘上 后的 也还是正态变量。且
所以, 服从正态分布
分布
分布的图形如图7-5
设 是来自总体 的样本,则称随机变量 服从自由度为n的 分布,记为 。其中自由度是指被上式右段包含的独立变量的个数。
分布的概率密度为
分布
n=15
n=5
n=1
图7-5 分布概率密度示意图
分布
(1) 分布的可加性。设
并且 , 相互独立,则有 ;
(2)若 则有 。
分布的性质:
分布
对于给定的正数 , 称满足条件
的点
分布的上 分位点。
图7-6 分布上 分为点示意图( 越小数越大)
t 分布
关于t分布的早期理论工作,是英国统计学家威廉•西利•戈塞特[Willam Sealy Grosset(1876-1937)]在1900年进行的的。戈塞当时受雇于爱尔兰首都柏林金尼斯啤酒厂,由于该厂不允许雇员用自己的名字发明研究成果,于是戈塞特采用了“学生”(student)这个笔名发表文章,阐述他发明的“小样本理论”。从而t分布通常被称为“学生t分布”或“学生分布”。
t分布是小样本分布,小样本一般是指n<30,t分布适用于当总体标准差 未知时,用样本标准差S代替总体标准差 ,由样本平均数推断总体平均数以及两个小样本之间差异的显著性检验等。
设 , ,并且相互独立,则称随机变量
服从自由度为n的t分布,记为
t 分布
t分布的概率密度为
的图形如下:
t 分布
t 分布
(正态)
图 7-7
的图形
对于给定的正数 , ,称满足条件
的点 为 分布的上 分位点。
图7-8
t 分布
t 分布
由 分布上 分位点的定义及 图形的对称性可知 , 分布上 分位点可由t分布表查得。如
,
当n足够大时, 近 似于 分布。因此,在n充分大时,就用标准正态分布近似:
如
F 分布
F分布是以统计学家R•A•Fishier姓氏的第一个字母命名的。F分布定义为两个独立的 分布被各自的自由度除以后的比率这一统计量的分布。F分布的用途很广,可用于方差分析,协方差分析和回归分析等。
F 分布
设 , 且 相互独立 ,则称随机变量 ,服从自由度 的F分布,记为
。
分布的概率密度为
的图形如图7-9所示
F 分布
图7-9
F 分布
由定义可知,若 ,则
对于给定的正数 , 称满足条件
的点 为 分布的上 分位点,如图7-11.
F 分布
图7-10
F 分布
F 分布的上 分位点有如下性质:
F分布的上 分位点可由查表及上面公式得到,如: