此处是大标题样稿字样十五
字以内
一.抽样
二.试验
三.样本空间
四.事件及其概率
第一节 随机事件及其概率
一、抽样
.概念概念
从总体中抽取部分单位,并进行实际调查,从总体中抽取部分单位,并进行实际调查,
以推断总体。以推断总体。
.抽样的两种方法:抽样的两种方法:
重置抽样和不重置抽样重置抽样和不重置抽样
两种抽样方法
重置抽样重置抽样
.概念:概念:
也称有放回的抽样,从总体中抽取一个单位,登记也称有放回的抽样,从总体中抽取一个单位,登记
后再放回总体参加下一次的抽取,连续试验后再放回总体参加下一次的抽取,连续试验nn次。次。
.重置抽样排列数:重置抽样排列数:
从总体从总体NN个单位,抽取样本容量为个单位,抽取样本容量为nn个单位的重置个单位的重置
试验,可能抽取的样本点个数:试验,可能抽取的样本点个数:
不重置抽样不重置抽样
1.概念:
也称无放回的抽样,每次总体中抽
取一个单
位,登记后不再放回原总体,不参
加下一次抽
选,下一次继续从总体余下的单位
抽取样本单
位,这样继续进行n次试验。
有n个单位的样本是由n次连续试验
构成的,但
因每次抽出不重置,所以实质上等
同于同时从
总体中抽取n个样本单位。
不重置抽样排列数:不重置抽样排列数:
不重置抽样又分为考虑顺序和不考虑顺序不重置抽样又分为考虑顺序和不考虑顺序
的情况的情况(排列与组合(排列与组合)。)。
从从1010个同学中抽三个担任不同职务,有:个同学中抽三个担任不同职务,有:
从从1010个同学中抽三个考察其平均成绩,则:个同学中抽三个考察其平均成绩,则:
二、试验
1.概念:
在相同条件下,对事物或现象所进行的观察。在相同条件下,对事物或现象所进行的观察。
例如:掷一枚骰子,观察其出现的点数;产品质例如:掷一枚骰子,观察其出现的点数;产品质
量检验,考察其是否是合格品等。量检验,考察其是否是合格品等。
2.试验具有以下特点:
可以在相同的条件下重复进行;可以在相同的条件下重复进行;
每次试验的每次试验的可能结果可能结果不止一个,不止一个,
但试验的所有可能结果在试验但试验的所有可能结果在试验
之前是确切知道的;之前是确切知道的;
在试验结束之前,不能确定该在试验结束之前,不能确定该
次试验的确切结果;次试验的确切结果;
1.基本事件
如果一个事件不能分解成两个或更多个事件,则这如果一个事件不能分解成两个或更多个事件,则这
个事件称为基本事件,也称为个事件称为基本事件,也称为样本点样本点 。。
通常样本点不止一个单位,而是由许多单位构成,通常样本点不止一个单位,而是由许多单位构成,
这时就要连续这时就要连续nn次试验的结果构成一个样本点。次试验的结果构成一个样本点。
2.样本空间
以以全部全部样本点为元素的集合,称为样本空间。样本点为元素的集合,称为样本空间。
三、样本空间三、样本空间
试验 样本空间
抛一枚硬币抛一枚硬币
抛掷一颗骰子抛掷一颗骰子
抽出一件产品检测抽出一件产品检测
一场足球比赛一场足球比赛
{{正面向上,反面向上正面向上,反面向上}}
{1{1,,22,,33,,44,,55,,6}6}点点
{{合格,不合格合格,不合格}}
{{获胜,失利,平局获胜,失利,平局}}
抛掷两枚硬币抛掷两枚硬币
抽两件产品检测抽两件产品检测
{{(正,正),(反,正),(反,(正,正),(反,正),(反,
反)反)}}
………………
练习题
写出随机试验的样本空间
1.记录某班一次统计学测试的平均
分数
2.某人骑自行车在公路上行驶,观
察该骑车人在遇到第一个红灯停
下来以前已经遇到的绿灯个数。
3.生产产品,直到有10件正品为止,
记录生产产品的总件数。
.事事件件::随随机机试试验验的的每每一一个个可可能能结结果果((任任何何样样本本点点集集
合合))
•• 例如:掷一枚骰子出现的点数为例如:掷一枚骰子出现的点数为33
.随机事件:每次试验可能出现也可能不出现的事件随机事件:每次试验可能出现也可能不出现的事件
•• 例如:掷一枚骰子可能出现的点数例如:掷一枚骰子可能出现的点数
.必然事件:每次试验一定出现的事件,用必然事件:每次试验一定出现的事件,用表示。表示。
•• 例如:掷一枚骰子出现的点数小于例如:掷一枚骰子出现的点数小于77
.不可能事件:每次试验一定不出现的事件,用不可能事件:每次试验一定不出现的事件,用表表
示。示。
例如:掷一枚骰子出现的点数大于例如:掷一枚骰子出现的点数大于66
四、事件及其概率
5.事件的概率
(1)事件A的概率是对事件A在试
验中出现的
可能性大小的一种度量
(2)表示事件A出现可能性大小的
数值,事件
A的概率表示为P(A)
(3)概率的定义有:古典定义、
统计定义和主
观概率定义
6.概率的统计定义
在在相相同同条条件件下下进进行行nn次次随随机机试试验验,,事事件件AA出出
现现 m m 次次,,则则比比值值 mm//n n 称称为为事事件件AA发发生生的的频频率率。。
随随着着nn的的增增大大,,该该频频率率围围绕绕某某一一常常数数PP上上下下摆摆
动动,,且且波波动动的的幅幅度度逐逐渐渐减减小小,,趋趋向向于于稳稳定定,,
这个这个频率的稳定值即为事件频率的稳定值即为事件AA的概率的概率,记为,记为
例如,投掷一枚硬币,出现正面和反面的频率,
随着投掷次数 n 的增大,出现正面和反面的频率
稳定在1/2左右
试验的次数试验的次数
正面正面 / /试验次试验次
数数
00 2525 5050 7575 100100 125125
第二节 随机变量及其分布
一、随机变量的概念一、随机变量的概念
二、离散型随机变量的概率分布二、离散型随机变量的概率分布
三、连续型随机变量的概率分布三、连续型随机变量的概率分布
一、随机变量的概念
1.概念
随机事件的数量表现就称为随机变
量。
例如: 投掷两枚硬币出现正面的数
量;从班
级同学中抽10个,抽中女生的人数
…。
2.分类
根据取值情况的不同分为离散型随
机变量和
连续型随机变量
(1)离散型随机变量
如果随机变量如果随机变量 XX的的取值都可以逐个列举出来取值都可以逐个列举出来 XX11 , ,
XX22,,……,,则则XX称称为为离散型随机离散型随机变变量量
离散型随机变量的一些例子离散型随机变量的一些例子
试验 随机变量 可能的取值
抽查100个产品
一家餐馆营业一天
电脑公司一个月的销
售
销售一辆汽车
取到次品的个数
顾客数
销售量
顾客性别
0,1,2, …,100
0,1,2, …
0,1, 2,…
男性为0,女性
为1
(2)连续型随机变量
如果如果XX的的所有可能取值不可以逐个列举出来,而所有可能取值不可以逐个列举出来,而
是取数轴上某一区间内的任意点,则称该随机是取数轴上某一区间内的任意点,则称该随机
变量为变量为连续型随机变量连续型随机变量
连续型随机变量的一些例子连续型随机变量的一些例子
试验 随机变量 可能的取值
抽查一批电子元件
新建一座住宅楼
测量一个产品的长度
使用寿命(小时)
半年后工程完成的百分比
测量误差(cm)
X 0
0 X 100
X 0
二、离散型随机变量的概率分布
.离散型随机变量离散型随机变量XX的所有可能的所有可能取值取值及其取这些及其取这些
值的值的概率概率按顺序排列起来就形成按顺序排列起来就形成概率分布概率分布。。
.通常用下面的表格来表示通常用下面的表格来表示
X = xi x1 ,x2 ,… ,xn
P(X =xi)=pi p1 ,p2 ,… ,pn
.概率分布的性质:概率分布的性质:
随机变量取值的概率是非负的,随机变量取值的概率是非负的,即即 p pii00;;
随机变量所有取值的概率总和等于随机变量所有取值的概率总和等于11,即,即
((ii==11,,22,,……,,nn))
4.离散型随机变量的概率分布(实例)
【【例例】】如如规规定定打打靶靶中中域域ⅠⅠ得得33分分,,中中域域ⅡⅡ得得22分分,,
中中域域ⅢⅢ得得11分分,,中中域域外外得得00分分。。今今某某射射手手每每100100次次
射射击击,,平平均均有有3030次次中中域域ⅠⅠ,,5555次次中中域域ⅡⅡ,,1010次次
中中ⅢⅢ,, 55次次中中域域外外。。则则考考察察每每次次射射击击得得分分为为
0,1,2,30,1,2,3这一离散型随机变量,其概率分布为这一离散型随机变量,其概率分布为
X = xi 0 1 2 3
P(X=xi)pi
5.离散型随机变量的数学特征
离散型随机变量的数学期望离散型随机变量的数学期望
离散型随机变量的方差离散型随机变量的方差
离散型随机变量的数学期望
((11))在在离离散散型型随随机机变变量量XX的的一一切切可可能能取取值值的的
完完备备组组中中,,各各可可能能取取值值xxii与与其其相相对对应应的的概概
率率ppii乘积之和。乘积之和。
((22)计算公式为)计算公式为
((33)性质)性质
第三章所讲的平均数的性质也完全
适合于数学
期望。对于抽样分布通常要考虑多
个变量的情
况,所以还要补充两条性质。
①n个随机变量代数和的数学期望
等于它们的数学期望之和。
②n个独立随机变量连乘积的数学
期望等于它们数学期望的乘积
离散型随机变量的方差
((11)随机变量)随机变量XX的每一个取值与期望值的离差的每一个取值与期望值的离差
平方的数学期望,记为平方的数学期望,记为DD((XX)),或,或Var(X)Var(X),或,或
它用来描述离散型随机变量取值的分散程度它用来描述离散型随机变量取值的分散程度
((22)计算公式为)计算公式为
离散型随机变量的方差(实例)
【【例例】】投投掷掷一一枚枚骰骰子子,,出出现现的的点点数数是是个个离离散散型型随随
机机变变量量,,其其概概率率分分布布为为如如下下。。计计算算数数学学期期望望和和方方
差差
X = xi 1 2 3 4 5 6
P(X =xi)=pi 1/6 1/6 1/6 1/6 1/6 1/6
解:解:数学期望为数学期望为::
方差为:方差为:
三、连续型随机变量的概
率分布
※连续型随机变量可以取某一区
间或整个实
数轴上的任意一个值。
※它取任何一个特定的值的概率
都等于0,
所以不能列出每一个值及其相应
的概率,通
常研究它取某一区间值的概率
(一)密度函数f(x)
((xx))表示随机变量表示随机变量XX在点在点xx上的概率密度,上的概率密度,
所以称为密度函数。所以称为密度函数。
((xx))不是概率。不是概率。
.通常把密度函数的图形称为分布曲线。通常把密度函数的图形称为分布曲线。
在平面直角坐标系中画出f(x)的
图形,则对于任何实数 a < b,
P(a X< b)是该曲线下从a 到 b
的面积
ff((xx))
xa b
概率是曲线下的面积
(二)密度函数具有以下
性质:
.密度函数密度函数 是非负函数,即是非负函数,即
.随机变量随机变量XX落在区间落在区间 内的概率内的概率
等于它的密度函数在该区间上的定积等于它的密度函数在该区间上的定积
分。即:分。即:
其几何意义就是概率其几何意义就是概率
等于区间等于区间
上分布曲线和上分布曲线和XX轴围成的面积。轴围成的面积。
.由于由于 是必然事件,所以是必然事件,所以
(三)分布函数
.连连续续型型随随机机变变量量的的概概率率也也可可以以用用分分布布函函数数FF((xx))
来表示来表示
.分布函数定义为分布函数定义为
. 根据分布函数,根据分布函数,PP((aa<<XX<<bb))可以写为可以写为
分布函数与密度函数的图
示
1.密度函数曲线下的面积等于1
2.分布函数是曲线下小于 x0 的面
积
ff((xx))
xx
xx00
F F ( ( xx00
))
(四)连续型随机变量的期望和方差
1.连续型随机变量的数学期望为
2.方差为
第三节 抽样分布
基本概念基本概念
重置抽样分布及其数值特征重置抽样分布及其数值特征
不重置抽样分布及其数值特征不重置抽样分布及其数值特征
一、基本概念
.抽样分布:抽样分布:
从一个总体中抽取样本容量相同的所有可能从一个总体中抽取样本容量相同的所有可能
样本之后,计算样本统计量的值及取该值的样本之后,计算样本统计量的值及取该值的
相应概率,就组成了样本统计量的概率分相应概率,就组成了样本统计量的概率分
布,简称抽样分布。布,简称抽样分布。
样本统
计量 总体未
知参数
样本统
计量
样本统
计量
样本统
计量
样本统
计量
样本统
计量
样本统
计量
样本统
计量
样本统
计量
样本统
计量
样本统
计量
样本统
计量
样本统
计量
抽样分布抽样分布
样本统计量所有可能值的样本统计量所有可能值的
概率分布概率分布
主要样本
统计量
平均数 比率(成数) 方差平均数 比率(成数) 方差
2.参数和统计量(总体指标和抽样指标)
总体参数(总体指标)
(parameter)
根据全及总体各个单位的标志值
或标志属性计算的,反映总体某
种属性或特征的综合指标称为全
及指标。
全及指标值具有唯一性。
常用的全及指标有总体平均数(
)(或总体成数P)、总体标准
差σ(或总体方差σ2 )。
● 统计量(抽样指标)
由抽样总体各单位标志值计算出来反映由抽样总体各单位标志值计算出来反映
样本特征,用来估计总体的综合指标称样本特征,用来估计总体的综合指标称
为统计量(抽样指标)。为统计量(抽样指标)。
它是一个随机变量。它是一个随机变量。
3.统计量的特点
统计量(抽样指标)是随机变量,随着抽
到的样本单位不同其取值也会有变化。
统计量是样本变量的函数,用来估计总
体参数,因此与总体参数相对应。
要了解本班男同学的身高,从总共30名男同
学中抽取5名同学测量他们的身高,用这5名
同学的平均身高来估计本班男同学的身高。
样本点:
样本空间:
样本统计量:
4.统计量的计算
样本平均数:
样本方差:
样本成数:
二、重置抽样分布
(一)样本平均数的分布
样本平均数的分布是总体中全部样
本平均数的
可能取值和与之相应的概率组成。
下面用一个例子来说明该问题
某班组5个工人的日工
资为34、38、42、46、
50元。
现用重置抽样的方法从5
人中随机抽2个构成样本。
共有52=25个样本。
样本平均数的均值、方
差及标准差:
抽样平均数的标准差反映所有的样本平均数与总体平均
数的平均误差,又称为抽样平均误差,用 表示。
(二)两个重要结论:
1.重置抽样的样本平均数的平均数等于总体平均
数,即
2.重置抽样的抽样平均数的标准差等于总体标准
差除以样本单位数的平方根。即
样本抽样分布
原总体分布
以上两个结论具有普遍意义,其一般推
导见课本p113。
这一等式可以看出两项重要
事实(1)抽
样平均误差比总体标准差小的多,仅为
其 。
例如一个县的粮食亩产高低悬殊,亩产
标准差为80公
斤,如果随机抽取100亩求平均亩产,
那么样本平均
亩产量的差异就显著减小,平均误差只
及总体亩产标
准差的 ,即
所以用样本平均亩产来代表总体平均亩
产是更有效的.
(2)抽样平均误差与总体标准差
成正比变
化,而与样本容量n的平方根成反
比变化。
例如在同一个总体中,如果抽样单
位数扩大原
来的4倍,则抽样平均误差就缩小
一半,如果抽
样平均误差增加一倍,则样本单位
数只需要原
来的1/4。
(三)总体成数的估计
总体成数p是指具有某种特征的单位在总体中的比
重。在前面我们已经知道,成数是一个特殊平均
数,设总体单位总数目是N,总体中有该特征的单
位
数是N1。设X是0、1变量,
即:总体单位有该特征,则X取1,否则取0,则有:
现从总体中抽出n个单位,如果其中有相应特征的单位
数是n1,则样本成数是:
成数 P也是一个随机变量,利用样本平均数的
分布性质结论,即有:
例题
Eg.已知某批零件的一级品率为80
%,现用重置抽样方法从中抽取
100件,求样本一级品率的抽样
平均误差。
三、不重置抽样分布
(一)样本平均数的分布(一)样本平均数的分布
某班组5个工人的日工资为
34、38、42、46、50元。
现用不重置抽样的方法从5
人中随机抽2个构成样本。
共有20个样本。
不重置抽样样本平均数的
平均数、方差及标准差:
(二)两个重要结论:
1.不重置抽样分布虽然与重置抽样分布不
同,但
它们的样本平均数的平均数仍等于总体平
均
数,即:
2.抽样平均数的标准差也是反映样本平均
数与总体平均数的平均误差程度。即:
所以抽样平均数的标准差也可称为抽样平
均误差,或抽
样标准误差,不重置抽样的抽样平均误差
等于重置抽样
的平均误差乘以修正因子
n/N称为抽样比。
(三)样本成数的分布(三)样本成数的分布
抽样平均误差为:
对于(0,1)分布的总体,总体平均数
为:
总体方差为:
从总体中抽取容量为n的样本,样本成数p
的分布实质是样本平均数的分布。有:
重置抽样 不重置抽样
样本平均数误差
样本成数误差
抽样平均误差公式汇编
回顾
某企业生产一批灯泡,共某企业生产一批灯泡,共1010,,000000只,只,
随机抽取随机抽取500500只做耐用试验。测算结果只做耐用试验。测算结果
平均使用寿命为平均使用寿命为55,,000000小时,由历史小时,由历史
经验得知总体标准差为经验得知总体标准差为300300小时,小时,500500
之中发现之中发现1010只不合格。只不合格。
求平均数和成数的抽样平均误差。求平均数和成数的抽样平均误差。
第四节 正态分布和正态
逼近
一、正态分布
二、正态分布再生定理
三、中心极限定理
四、抽样分布的正态逼近
一、正态分布
(一)正态分布概述:(一)正态分布概述:
.定义定义
一个连续型随机变量一个连续型随机变量XX,如果其密度函数为,如果其密度函数为
那么我们称那么我们称XX服从参数为服从参数为xx和和正态分布。正态分布。
连续型随机变量的一种重要分布,它是统计推断
的基础
2.密度函数f(x)的性质
(1)对称性;
(2)非负性;
(3)最大值;
(4)拐点;
f (x)
((55)) xx 和和σσ的意义的意义;;
位置参数位置参数 形状参数形状参数
((11)变动平均数)变动平均数
((22)变动标准差)变动标准差
改变分布改变分布中心中心位置;位置;
表现为图形的平移。表现为图形的平移。
分布分布疏密疏密程度程度
表现为图形的拉伸或压缩表现为图形的拉伸或压缩
(二)正态分布函数的标
准化
.标准正态分布定义标准正态分布定义
数学期望为数学期望为00,方差为,方差为11的正态分布,称为标的正态分布,称为标
准正态分布。用准正态分布。用N(0,1)N(0,1)来表示。来表示。
变量变量XX服从标准正态分布记为:服从标准正态分布记为:
标准正态分布其几何意义是将分布曲线的中标准正态分布其几何意义是将分布曲线的中
心移到原点,使得离差化为以心移到原点,使得离差化为以 为单位的相为单位的相
对离差。对离差。
2.标准正态分布的特点:
(1)分布的平均数(数学期望)为0;
(2)分布的方差为1。
(3)密度函数为:
(4)分布函数:
3.非标准正态分布标准化
((11)为什么要把不同的正态分布变换为具有相)为什么要把不同的正态分布变换为具有相
同参数的同参数的— — 标准正态分布:标准正态分布:NN((00,,11)?)?
为了计算的方便!计算服从标准正态分布的变量取为了计算的方便!计算服从标准正态分布的变量取
值在某个区间的概率只需查标准正态概率分布表值在某个区间的概率只需查标准正态概率分布表
((22)如何进行标准化?)如何进行标准化?
标准正态分布表的两种形
式:
本教材后附表本教材后附表
是这种形式是这种形式
-Z
形式形式11
形式形式22
在在统计推断统计推断中,常常需要中,常常需要
((11)求随机变量)求随机变量ZZ距中心的绝距中心的绝
对值不超过对值不超过zz的概率。即变量的概率。即变量
落落
在区间(-在区间(-zz,,zz)的概率。)的概率。
((22)给定)给定F(z)F(z),求随机变量,求随机变量ZZ
距中心的距离距中心的距离zz。。
Z
F ( Z )
( % )
记住记住
.标准正态分布表的使用:标准正态分布表的使用:
例题:
F(Z)
-2 0 2
例题:
525 550 575
F(x)
二、正态分布再生定理
n
…
x2
x3
x1
xN
x
(x11 … x1n )
(x21 … x2n)
(xm1 …xmn)
…
…
x1
x2
xm
…
…
x
三、中心极限定理 P126
随着n 的增大而趋近于
中心极限定理
大样本
n ≥30
n
小结:
正态分布再生定理:限定总体服从正
态分布,对样本容量n无要求;
中心极限定理:总体分布可不为正态
分布,甚至可以不知道总体的分布。
要求样本单位数n很大( 至少n≥30
),则样本平均数就趋近于正态分布。
四、抽样分布的正态逼近
正态逼近 — 应用于样本统计
量取值某个区间的概率
总体分布类型不清楚时,只要
样本容量相当大,就可以用正
态分布来近似地估计样本平均
数和样本成数取值某个区间的
概率
一般认为,
时为大样本,抽样分布接近正态。
0
THANKS