第四章 抽样分布
你不必吃完整一头牛,才知道它的肉是咬不动的。
——Samel Johnson
2008年8月
参数与统计量
总体参数是对总体特征的概括性度量
参数通常是想要知道的但又未知的
用希腊字母表示
2008年8月
参数与统计量
诸如二项分布中的 n 和 p, 正态分布中的 m和 s 这样的参数, 都是总体中未知的描述性度量
研究一个总体所要关心的参数有总体平均数、总体标准差、总体比例等总体参数
研究两个总体时,关心的参数有均值之差、两总体比例之差、两总体的方差比
2008年8月
参数与统计量
一般总体参数是未知的,可利用样本信息推断总体参数——统计量
Eg.抽500样本的平均收入推断该地区人口平均收入
2008年8月
参数与统计量
统计量:根据样本算出来的用于推断总体的某些量,是对样本特征的某个概括性度量
统计量是:
样本的函数
随机变量
是根据样本数据算出来的
用英文字母表示
2008年8月
总体参数是根据样本统计量来推断的
Eg.根据样本均值推断总体均值
根据样本方差来推断总体方差
根据样本比例来推断总体比例
通过样本统计量来推断总体参数必然有某种不确定性
————如何判断用样本统计量推断总体参数时是否可靠呢?
2008年8月
参数与统计量
实际上,我们发现样本统计量具有某种特定的性质,即样本统计量的概率分布有规律性,具有特定的性质
一般来说,准确的分布是很难知道的
2008年8月
Eg. 从样本是从总体中任意取出的时,样本均值的分布是什么样的?
很多时候,当n足够大时,我们可以将样本均值的分布近似为正态分布
样本统计量的概率分布提供了样本统计量稳定的信息,构成推断总体参数的基础
2008年8月
样本统计量的分布:就是抽样分布
抽样分布的定义:
它是由样本统计量的所有可能值行成的相对频数分布(由重复抽样产生)
Eg.样本均值的分布,样本比例的分布,样本方差的分布
2008年8月
2008年8月
三种分布
总体分布
样本分布
抽样分布
2008年8月
总体分布
总体分布的定义:
总体中各元素的观察值所行成的相对频数分布
怎么得到总体分布?
若所有观察值可得到,通过直方图观察其分布状况
若不能得到所有观察值,这时可抽样推断
2008年8月
总体分布
总体分布的特点:
未知的
可根据经验了解其分布类型(假定其服从某分布)
我们关心总体中的某参数
2008年8月
样本分布(或经验分布)
样本分布是
从总体中抽取一个容量为n的样本,由这n个观察值构成的相对频数分布
样本中各观察值的分布
2008年8月
样本分布(或经验分布)
样本分布的特点
来自总体,蕴含总体的信息和特征
当样本容量n小的时候,样本分布与总体分布会有偏差和不一致
当样本容量n增大时,样本分布接近总体分布
2008年8月
样本分布与抽样分布
样本分布:样本中各观察值的分布
抽样分布:多次抽样可计算出多个样本统计量,这些样本统计量所有值构成的分布
2008年8月
单个总体参数推断时的抽样分布
1. 样本均值的抽样分布
2. 样本比例的抽样分布
3. 样本方差的抽样分布
2008年8月
样本均值的分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总体的均值、方差及分布如下
总体分布
1
4
2
3
0
.1
.2
.3
均值和方差
2008年8月
样本均值的分布
(例题分析)
现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为
3,4
3,3
3,2
3,1
3
2,4
2,3
2,2
2,1
2
4,4
4,3
4,2
4,1
4
1,4
4
1,3
3
2
1
1,2
1,1
1
第二个观察值
第一个
观察值
所有可能的n = 2 的样本(共16个)
2008年8月
样本均值的分布
(例题分析)
计算出各样本的均值,如下表。并给出样本均值的抽样分布
3
2
4
4
3
2
1
1
第二个观察值
第一个
观察值
16个样本的均值(x)
x
样本均值的抽样分布
0
P ( x )
2008年8月
样本均值的分布与总体分布的比较
(例题分析)
=
σ2 =
总体分布
样本均值分布
2008年8月
2008年8月
样本均值的分布
与中心极限定理
= 50
=10
X
总体分布
n = 4
抽样分布
x
n =16
当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x 的期望值为μ,方差为σ2/n。即x~N(μ,σ2/n)
2008年8月
2008年8月
2008年8月
中心极限定理
(central limit theorem)
当样本容量足够大时(n 30) ,样本均值的抽样分布逐渐趋于正态分布
从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大(n>=30)时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布
一个任意分布的总体
x
中心极限定理
(central limit theorem)
x 的分布趋于正态分布的过程
2008年8月
抽样分布与总体分布的关系
总体分布
正态分布
非正态分布
大样本
小样本
样本均值
正态分布
样本均值
正态分布
样本均值
非正态分布
2008年8月
样本均值的分布
样本均值的期望值和方差
样本均值的分布
(数学期望与方差)
样本均值的分布
(数学期望与方差)
不重复抽样时,样本均值的方差需要用修正系数 去修正
2008年8月
样本均值的分布
(数学期望与方差)
注意:
对无限总体进行不重复抽样时,可当做重复抽样处理
对有限总体,当N很大,而抽样比n/N很小,其修正系数趋于1这时也可当做重复抽样处理
2008年8月
2008年8月
2008年8月
其他统计量的分布
样本统计量的概率分布
2008年8月
总体(或样本)中具有某种属性的单位与全部单位总数之比
不同性别的人与全部人数之比
合格品(或不合格品) 与全部产品总数之比
总体比例可表示为
样本比例可表示为
样本比例的分布
(proportion)
2008年8月
适合研究分类问题
样本比例的抽样分布(定义):在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布
一种理论概率分布
样本比例的抽样分布
2008年8月
4. 当样本容量很大时(np>=5或
n(1-p) >=5 )
样本比例的抽样分布可用正态分布近似
样本比例的抽样分布
不重复抽样时,样本比例的方差需要用修正系数 去修正
2008年8月
2008年8月
样本方差的抽样分布
用样本方差去推断总体方差时必须知道样本方差的抽样分布
样本方差的抽样分布,是在重复选取容量为n的样本时,由样本方差的所有可能取值形成的相对频数分布
2008年8月
样本方差的抽样分布
对于来自正态总体的简单随机样本,则比值
的抽样分布服从自由度为 (n -1) 的2分布,即
c2分布
(图示)
选择容量为n 的
简单随机样本
计算样本方差s2
计算卡方值
2 = (n-1)s2/σ2
计算出所有的
2值
不同容量样本的抽样分布
c 2
n=1
n=4
n=10
n=20
m
s
总体
两个总体参数推断时的抽样分布
1. 两个样本均值之差的抽样分布
2. 两个样本比例之差的抽样分布
3.两个样本方差比的抽样分布
两个总体都为正态分布,即 ,
两个样本均值之差 的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差
方差为各自的方差之和
两个样本均值之差的抽样分布
两个样本均值之差的抽样分布
m
1
s
1
总体1
s
2
m
2
总体2
抽取简单随机样样本容量 n1
计算x1
抽取简单随机样样本容量 n2
计算x2
计算每一对样本
的x1-x2
所有可能样本
的x1-x2
m1 -m2
抽样分布
两个总体都服从二项分布
分别从两个总体中抽取容量为n1和n2的独立样本,当两个样本都为大样本时,两个样本比例之差的抽样分布可用正态分布来近似
分布的数学期望为
方差为各自的方差之和
两个样本比例之差的抽样分布
两个样本方差比的抽样分布
两个总体都为正态分布,即X1~N(μ1 ,σ12),X2~N(μ2 ,σ22 )
从两个总体中分别抽取容量为n1和n2的独立样本
两个样本方差比的抽样分布,服从分子自由度为(n1-1),分母自由度为(n2-1) 的F分布,即
2008年8月
2008年8月
统计量的标准误差
(standard error)
样本统计量的抽样分布的标准差,称为统计量的标准误,也称为标准误差
衡量统计量的离散程度,测度了用样本统计量估计总体参数的精确程度
样本均值和样本比例的标准误差分别为
2008年8月
估计的标准误差
(standard error of estimation)
当计算标准误时涉及的总体参数未知时,用样本统计量代替计算的标准误,称为估计的标准误
以样本均值为例:当总体标准差未知时,可用样本标准差s代替,则在重复抽样条件下,样本均值的估计标准误为
结 束
As a result of this class, you will be able to ...
As a result of this class, you will be able to ...
65
The sampling distribution is a function of the sample sizes upon which the sample variances are based.
Hint: Recall the formula for variance!
s2 = S(x -`x)2/(n-1)
38
In this diagram, do the populations have equal or unequal variances? Unequal.
As a result of this class, you will be able to ...