MBA智库文档经济统计学 MBA应用统计学课件第七章随机变量及概率分布.ppt

MBA应用统计学课件第七章随机变量及概率分布.ppt

下载

MBA应用统计学课件（哈工程徐建中）7

green

59页 | 830KB | 2次下载 |

0.0

(0人评价)

我要评价：

投诉举报

用手机看文档

扫一扫,手机看文档

下载

开通VIP

第七章随机变量及概率分布随机变量离散型随机变量的概率分布正态分布抽样分布随机变量随机变量的概念随机变量的分类随机变量的概念所谓随机变量，就是按一定的概率取值的变量。通常用大写拉丁字母 X、Y、Z或希腊字母表示。随机变量的概念随机变量有以下两个特性：（1）取值的不确定性。由于随机事件在一次试验中可能出现，也可能不出现，具有一定的随机性，因此随机变量的取值也是随机的。（2）随机变量的取值虽然是不确定的，但由于随机变量出现的可能性大小是遵循一定规律的，因此，随机变量的取值也是有规律性的。随机变量的概念例1 进入某商店的顾客，有购物和不购物两种，可能结果中，购物的占25%。若购物记为1，不购物记为0，并以字母X表示购物与否，则 X是随购物与否取值（0或1）的随机变量。随机变量的概念例2 20件产品中有3件次品，从中任取2件，其中的次品数是个随机变量，若用X表示，则X的可能值为0、1、2。例3 测量某一工件的长度，用X表示测量得到的数值，由于受到仪器的精度、操作者的水平，温度等因素的影响，X的取值可能是某一特定区间[a、b]上的某一实数值，X是随测量结果在[a、b]上取值的一个随机变量。随机变量的分类（1）离散型随机变量（2）连续型随机变量（1）离散型随机变量如果随机变量X的所有取值都可以逐个列举出来，则称X为离散型随机变量。例如，在一批产品中“取到次品的个数”，“单位时间内交换台收到的呼叫次数”等都是离散型随机变量。（2）连续型随机变量如果随机变量X的所有可能取值不可以逐个列举出来，而是取数轴上某一区间内的任一点，则称该随机变量为连续型随机变量。例如，一批电子元件的寿命以及实际中常遇到的“测量误差”等都是连续型随机变量。离散型随机变量的概率分布离散型随机变量概率分布的概念离散型随机变量的数学期望和方差二项分布离散型随机变量概率分布的概念离散型随机变量的概率分布是由离散型随机变量所有可能的取值（）及其相应的概率（）组成，它反映了随机变量各个取值发生可能性的大小及它们的分布状况和分布特征。离散型随机变量概率分布的概念离散型随机变量的概率分布特征: （1）随机变量任取一值的概率都界于0和1之内，即( （2）随机变量所有取值的概率之和等于1。即离散型随机变量概率分布的概念例如：抛一个骰子，即一个四方体，上面六个面，分别记1、2、3、4、5、6分，显然，出现其中一个分值的概率是1/6，这离散型随机变量的概率分布如下表和下图。离散型随机变量概率分布的概念表7-1 抛一个骰子的概率分表累计概率 1 1 1/6 1/6 2 2 1/6 2/6 3 3 1/6 3/6 4 4 1/6 4/6 5 5 1/6 5/6 6 6 1/6 6/6 1 － 3 6 5 4 2 1 0 x 离散型随机变量的数学期望和方差（1）离散型随机变量的数学期望数学期望是随机变量各个取值与相应概率的乘积的和，它反映分布的中心位置。即离散型随机变量的数学期望和方差例1 某社区每个家庭每年去诊所就医次数的概率分布如下表年平均就医次数（） 0 1 2 3 4 试求：该社区家庭年平均就医次数的数学期望并解释其含义。表7-2 某社区就医次数概率分布表解：它说明该社区家庭年平均就医次。数学期望的意义：随机变量的数学期望是以其取值的概率为权数的一种平均，它给出了概率分布中心位置的测度，有时也简称为随机变量X的均值。离散型随机变量的数学期望和方差离散型随机变量的数学期望和方差数学期望性质： ①设c常数，则有 ②设为随机变量，c为常数，则 ③设为任意两个随机变量，则。一般地，有离散型随机变量的数学期望和方差数学期望性质： ④设为两个相互独立的随机变量，则，一般地，若为相互独立的随机变量，则 ⑤随机变量的线性函数的数学期望若，则，其中为任意两个随机变量，为常数。离散型随机变量的数学期望和方差例2：令表示某工厂甲产品的日产量，表示甲产品的成本，有，此处表示固定成本，表示单位甲产品所需变动成本，求平均产量为50时的平均成本。解：令有则为离散型随机变量的数学期望和方差（2）离散型随机变量的方差和标准差方差是随机变量与数学期望离差平方的数学期望，它反映分布的离中程度。一般用或表示。即对于离散型变量式中为时的概率 ,也可用表示。如例1来就医的次数X的分布中，求得每个家庭年平均就医次数，那么，就医次数的方差可计算如下：离散型随机变量的数学期望和方差离散型随机变量的数学期望和方差如果用方差的平方跟来研究随机变量取值离开其均值的程度，则具有相同的测度单位，从而更能准确描述分布的离散趋势，这就涉及到标准差，其定义如下：随机变量的标准差或为其方差的算数平方根，或。例1中，每个家庭年就医次数的标准差即，它表示该社区家庭年就医次数与平均年就医次数的平均离差为次。方差具有以下性质： ①当c为常数，则 ②当为一随机变量，c是常数，则 ③若、为两个相互独立的随机变量，则 ④若c为常数，为随机变量，则：离散型随机变量的数学期望和方差二项分布在每次试验中有两种可能结果的二项分布无疑是应用最广的离散型随机变量的概率分布。像每一次试验只有两个结果的重复试验称为贝努里试验。如果把一枚硬币抛掷固定次数的结果作为贝努里试验的例子，那么贝努里试验有以下特点：（1）每次试验（在本例中就是抛一次）只有两种可能结果：正面或反面，是或否，成功或失败；（2）不管进行多少次，任何一次试验结果的概率是固定的，对于一枚硬币，每抛一次出现正面的概率是；（3）试验是独立的，即每次抛币法结果不影响任何其他抛币结果。二项分布二项分布例1 在生产某个零件的过程中，每个零件可能合格或不合格，这个生产过程可以看作一个贝努里试验序列。我们以对应生产中的第i个零件。如果这个零件不合格，以表示；如果合格，以表示。但我们更关心的是在对近期生产中的1000个零件的检验中出现k个不合格产品的概率，即的概率。则我们将二项随机变量定义为n个独立且具有同分布的贝努里随机变量之和（以表示）：为一个二项随机变量。二项分布二项概率函数是指描述二项随机变量分布的概率函数，它是考查n次独立同分布贝努里试验中的概率函数。概率分布为，式中：，0<p<1, 是二项系数，且二项分布二项概率分布是离散型的。因只能取个值,即 ,一旦指定了和的值，一个唯一的二项分布就确定了。故称和为二项概率分布的参数。所以通常把服从二项概率分布的随机变量记作，二项分布的数学期望值为，方差为。由二项式定理可以推出正态分布正态分布的概率密度函数及其数学性质标准正态分布及其应用正态分布的概率密度函数及其数学性质如果对于随机变量X的分布函数，存在着非负的函数，使对于任意实数，有，则称为的概率密度函数，简称“概率密度。” 连续随机变量的密度函数为：式中 , , 为随机变量的均值，为随机变量的标准差，则称服从参数 , 的正态分布。记作 ,如图7-2 。图7-2 正态分布的概率密度函数及其数学性质为了画出正态分布的图形，我们先对概率密度做几点讨论：（1），即整个概率密度曲线都在轴上方；（2）曲线，相对于对称，并在处达到最大值。（3）曲线的陡缓程度由决定，越大，曲线越平缓；越小，曲线越陡峭；（4）当时，曲线以x轴为其渐近线，如图7-2，图中决定图形的中心位置，决定图形陡峭程度。正态分布的概率密度函数及其数学性质标准正态分布及其应用在正态分布概率密度函数的基础上，令 , 由于是正态随机变量的线性组合，因此当对Z求数学期望值和方差时得是一个具有正态随机变量，称为标准正态随机变量，称其概率密度函数为标准随机变量的概率密度函数，相应的分布称标准正态分布，简称分布。（如图7-3）（1）标准正态分布的概率密度函数是：图7-3 标准正态分布及其应用（2）正态分布表由于任何正态随机变量通过上述变换，都可以转化为标准正态随机变量，因此，只要计算出正态随机变量的取值区间为的概率并将其编成表，就可以求出任何正态随机变量的取值区间为的概率，即标准正态分布及其应用因为标准正态分布也是个对称的钟形分布，对称线为，所以当以对称线为中心将概率密度曲线之下的面积一分为二时，二者面积相等，各为1/2 ，即注：标准正态分布及其应用例1：某软饮料公司包装可乐时，每瓶重量平均为330毫升，标准差为10毫升，并已知每瓶重量是个正态随机变量。公司总经理认为如果每瓶包装重量超过338毫升，其费用将超出成本预算范围；每瓶低于325升，将达不到规定的重量标准。问该公司的瓶装可乐在每瓶325-338毫升的概率是多少？标准正态分布及其应用解：对进行变量转换查书附录的分布表得由此可见，该公司的瓶装可乐既不超出成本预算的重量，又不低于规定的重量标准的可能性或概率只有%。标准正态分布及其应用图7-4 瓶装可乐重量为325~338ml的概率标准正态分布及其应用 -2 -1 0 +1 +2 抽样分布正态总体中的分布分布 t 分布 F 分布正态总体中的分布定理：设是独立分布随机变量，且每个随机变量服从正态分布，则其均值服从正态分布。正态总体中的分布因为独立正态变量之和仍为正态变量，乘上后的也还是正态变量。且所以，服从正态分布分布分布的图形如图7-5 设是来自总体的样本，则称随机变量服从自由度为n的分布，记为。其中自由度是指被上式右段包含的独立变量的个数。分布的概率密度为分布 n=15 n=5 n=1 图7-5 分布概率密度示意图分布（1）分布的可加性。设并且，相互独立，则有；（2）若则有。分布的性质：分布对于给定的正数，称满足条件的点分布的上分位点。图7-6 分布上分为点示意图（越小数越大） t 分布关于t分布的早期理论工作，是英国统计学家威廉•西利•戈塞特[Willam Sealy Grosset(1876-1937)]在1900年进行的的。戈塞当时受雇于爱尔兰首都柏林金尼斯啤酒厂，由于该厂不允许雇员用自己的名字发明研究成果，于是戈塞特采用了“学生”（student）这个笔名发表文章，阐述他发明的“小样本理论”。从而t分布通常被称为“学生t分布”或“学生分布”。 t分布是小样本分布，小样本一般是指n<30，t分布适用于当总体标准差未知时，用样本标准差S代替总体标准差 ,由样本平均数推断总体平均数以及两个小样本之间差异的显著性检验等。设 , ,并且相互独立，则称随机变量服从自由度为n的t分布，记为 t 分布 t分布的概率密度为的图形如下： t 分布 t 分布（正态）图 7-7 的图形对于给定的正数 , ，称满足条件的点为分布的上分位点。图7-8 t 分布 t 分布由分布上分位点的定义及图形的对称性可知 , 分布上分位点可由t分布表查得。如，当n足够大时，近似于分布。因此,在n充分大时，就用标准正态分布近似：如 F 分布 F分布是以统计学家R•A•Fishier姓氏的第一个字母命名的。F分布定义为两个独立的分布被各自的自由度除以后的比率这一统计量的分布。F分布的用途很广，可用于方差分析，协方差分析和回归分析等。 F 分布设，且相互独立 ,则称随机变量 ,服从自由度的F分布，记为。分布的概率密度为的图形如图7-9所示 F 分布图7-9 F 分布由定义可知，若，则对于给定的正数，称满足条件的点为分布的上分位点，如图7-11. F 分布图7-10 F 分布 F 分布的上分位点有如下性质： F分布的上分位点可由查表及上面公式得到，如：

联系我们

智库文档公众号

客服微信

MBA应用统计学课件第七章随机变量及概率分布.ppt

下载

标签

相关专题更多

联系我们

意见反馈

标签

相关专题 更多

联系我们

意见反馈

相关专题更多