任务九 抽样推断
一、抽样估计的意义
二、抽样估计的基本概念
三、抽样误差
四、总体参数估计方法
五、抽样组织形式
主
要
内
容
(一)概念
抽样估计是按照随机原则从总体中抽取部分单位进行观察,
并依据调查所得的指标推断总体指标的统计方法。
(二)特点
1、遵循随机原则抽取样本单位。
2、用样本指标的数值推断总体指标的数值。
3、抽样误差可以计算和控制。
(三)抽样估计的作用
1、有一些无法或很难进行全面调查的现象,可以用抽样
估计进行。
2、 可以对全面调查的数据进行补充或修正。
3、可以用于大批量生产过程中产品的质量检验和控制。
一、 抽样估计的意义和作用
二、抽样估计中的基本概念
(一)全及总体和抽样总体
全及总体是指所研究现象的总体,简称总体。全及总体
的单位数用N表示。
抽样总体是从全及总体中按照随机原则抽取的那部分单
位的集合体,简称样本。抽样总体的单位数称样本容量,用n
表示。
样本按照样本容量的多少分为大样本和小样
本。若n≥30时,则称大样本,若n﹤30,则称小
样本。
(二)全及指标和抽样指标
全及指标是根据全及总体各单位标志值或标志特征计算
的综合指标,又称总体指标或总体参数。
1、全及平均数 (总体平均数)
(已分组资料)(未分组资料)
变量总体
2、总体标准差
(未分组资料)
(已分组资料)
1、全及成数 (总体成数)
总体成数是全及总体中具有某种属性的单位数在总
体单位数中所占的比重,用P表示。若N1代表具有某种
属性的单位数,则总体成本表现为:
抽样指标是根据样本总体各单位标志值或标志特征计算
的,用来估计总体指标的综合指标,又称样本指标。
1、抽样平均数 (样本平均数)
(已分组资料)(未分组资料)
2、抽样标准差 (样本标准差)
(未分组资料) (已分组资料)
1、抽样成数 (样本成数)
抽样成数是抽样总体中具有某种属性的单位数在抽
样总体单位数中所占的比重,用p表示。若n1代表具有
某种属性的单位数,则总体成本表现为:
(三)重复抽样和不重复抽样
重复抽样也称重置抽样或有放回抽样,是指从总体N个单
位中随机抽选第一个样本单位后,将它的标志记录下来后放
回总体再次参加抽选,重复这个步骤,直到抽满n个样本单
位为止。
1、每次抽选时,总体单位数是不变的。
2、各单位被抽中的可能性前后相同。
3、各单位有重复抽中的可能。
1、每次抽选时,总体单位数在逐渐减少。
2、各单位被抽中的可能性前后不断变化。
3、各单位没有被重复抽中的可能。
不重复抽样也称不重置抽样或无放回抽样,是指从总体N
个单位中随机抽选第一个样本单位后,将它的标志记录下来后
不放回总体,再从N-1个单位中抽选第二个样本单位,将它的
标志记录下来后也不放回总体,重复这个步骤,直到抽满n个
样本单位为止。
样本可能数目
样本可能数目又称样本个数,是指从一个总体中可能抽取
的样本个数。
注意样本个数和样本容量的区别
重复抽样条件下
不重复抽样条件下
设有一总体有4个单位,分别为A、B、C、D,现从
中抽取一个样本容量为2的样本。试确定在重复抽样和
不重复抽样下的样本个数并列示出各样本。
二 抽样误差
(一)抽样误差的概念
抽样误差
登记性误差
代表性误差
偏差(非随机误差)
随机误差
抽样实际误差
抽样平均误差
抽样误差是指在抽样中,用样本指标推断总体指
标而产生的误差。
影响抽样误差的因素
1、全及总体的标志变异程度
2、样本总体单位数
3、抽样方法
4、抽样调查的组织形式
样本容量样本容量 抽样方式抽样方式
总体差异程度总体差异程度
抽样方法抽样方法
二、抽样平均误差
抽样平均误差是一系列样本指标(样本平均数或
样本成数)的标准差。用于衡量抽样指标对于全及
指标代表性程度。
样本平均数的标准差(抽样平均数的抽样误差)
以样本平均数的标准差为例
1、概念
2、计算(抽样平均误差用 表示)
(1)抽样平均数的抽样平均误差( )
重复抽样条件下
不重复抽样条件下
不重复抽样的抽样平均误差小于重复抽样的抽
样平均误差;当N资料未知或N很大时,一般可用
重复抽样的抽样平均误差公式代替不重复抽样的抽
样平均误差公式。
(2)抽样成数的抽样平均误差( )
重复抽样条件下
不重复抽样条件下
抽样成数P即为是是非标志的平均数,而是非
标志的方差为P(1-P)。所以,将抽样平均数抽
样误差公式中总体数量标志的方差换成是非标志
的方差即可。
上述公式中,总体的方差和成数都是未知
的,所以,可以用以下四种方法解决。
(1)用过去调查所得的资料代替。
(2)用样本的方差代替总体的方差。
(3)用小规模调查资料数据代替。
(4)用估计的资料代替。
三、抽样极限误差
抽样极限误差是指抽样指标与总体指标之间抽
样误差的可能范围,也称为允许误差,通常用△
表示。
设 为抽样平均数的的抽样极限误差; 为抽样
成数的抽样极限误差。
四、抽样极限误差 与抽样平均误差的关系
抽样极限误差是用一定倍数的抽样平均误差表
示的抽样指标与全及指标之间的绝对离差。
其倍数通常用t表示, t称为概率度。即
在一定的条件下,概率度越大,抽样误差范围越
大,总体指标落在误差范围内的概率越大,从而抽
样估计的可信程度也就越高;反之,概率度越小,
抽样误差范围越小,总体指标落在误差范围内的概
率越小,从而抽样估计的可信程度也就越低。
概率度t 与概率保证程度F(t)之间的关系是
函数关系,可通过查正态分布表获得。
t=1 ,F(t)=%
t=2 ,F(t)=%
t=3 ,F(t)=%
F(t)=90%, t=
F(t)=95%, t=
F(t)=99%, t=
一般情况下,常用的概率度t 与概率保证
程度F(t)之间的关系如下:
第三节 总体参数估计方法
总体参数估计就是用抽样指标估计相应的
总体指标。比如,用抽样平均数估计总体平
均数,用抽样成数估计总体成数。
总体参数估计有点估计和区间估计两种。
一、点估计
点估计就是直接用抽样指标作为总体指标的
估计值。比如,预计的粮食产量、产品的合格
率、产品的使用寿命、汽车的标准油耗等。
二、区间估计
首先,应根据实际抽样资料计算抽样指标 和
;
其次,应对估计量给出允许的可能误差围 ,
提出估计的准确性要求;
第三,应考虑估计的可信程度 ,提出估计
的可靠性要求。
区间估计是根据抽样指标推断总体指标可
能范围的估计方法。
进行区间估计,应具备一定条件:
置信下限
置信上限
置信下限
置信上限
置信区间
置信区间
1、用抽样平均数估计总体平均数
某村播种小麦5000亩,收割前随机抽取100亩进
行实割实测,测得其平均亩产300千克,标准差为
15千克,试以%的概率保证程度估计全村小
麦的平均亩产量和总产量。
已知:
求:
解:
置信下限
置信上限
所以,小麦亩产量置信区间在297-303千克
之间。
小麦总产量置信区间在297×5000-303×5000千
克之间。
结果表明,该村小麦亩产量在297-303千克之
间,总产量在1485000-151000千克的概率保证程
度为%。
2、用抽样成数估计总体成数
某仓库保管员为了了解库存农机配件的锈蚀情
况,出售前随机抽取了200件,发现其中有80件
需要除锈,试以90%的置信度估计全部农机配件
需除锈的比例。
第四节 抽样组织形式
抽样的
组织方
式
简单随机抽样
类型抽样
机械抽样
整群抽样
多阶段抽样。
一、简单随机抽样
1、概念:简单随机抽样是按随机原则直接从总体
中抽选样本单位。
2、抽选样本的方法
直接抽选法
抽签法
随机数码表法
3、适用情况:适用于均匀分布的总体
4、抽样平均误差的计算
重复抽样:
不重复抽样:
5、必要样本容量的确定
(1)概念: 必要的样本容量是在保证抽样推
断能达到预期的可靠程度和精确程度下的一个
恰当的或最小的样本单位的数目。
(2)影响
因素
可靠程度 和精确程度△
总体标志的变异程度( )
抽样的组织方式和方法
(3)必要样本容量的计算
重复抽样
不重复抽样
∴
∵
公式推倒如下:
以重复抽样为例
二、类型抽样
1、概念
2、抽样方法
等比例类型抽样
类型抽样又称分类抽样或分层抽样,是指把总
体单位按一定标志加以分组,再从各组中随机抽
选样本单位,构成样本。
3、抽样平均误差的计算
影响类型抽样抽样平均误差的方差是组内方差。
重复抽样:
不重复抽样:
4、类型抽样的必要抽样单位数的公式
重复抽样:
不重复抽样:
三、机械抽样
1、概念
机械抽样又称为等距抽样或系统抽样,它是对研究
的总体按一定的顺序排列,每隔一定的间隔抽取一个或
若干个单位,并把这些抽取的单位组成样本进行观察的
一种抽样方法。
设总体有N 个单位,间隔为 ,若在第一个
间隔中抽取了随机数为i,则第n个单位数为i+(n-1)k.
机械抽样按排队标志不同,分为无关标志排队和有
关标志排队。
按样本单位抽选的方法不同,分为随机起点等距抽样、
半距起点等距抽样。
2、抽样误差的计算
无关标志排队的等距抽样近似于简单随机
抽样,因此,可以按简单随机抽样的方法计算
抽样误差。
有关标志排队的等距抽样相当于等比例
类型抽样,因此可用等比例类型抽样的公式
计算抽样误差。并用不重复抽样的公式。
四、整群抽样
1、概念
整群抽样是将总体划分为由总体单位所组成
的若干个群,然后,以群为单位,从总体中抽取
若干个群作为样本,而对中选群内的所有单位进
行全面调查的调查方式。
2、影响整群抽样抽样误差的因素
(1)抽出群数的多少
(2)群间方差
(3)抽样方法
3、抽样误差的计算
整群抽样均采用不重复抽样。
(1)抽样平均数的抽样误差
(2)抽样成数的抽样平均误差
4、样本容量的确定
如果缺少p的资料,可以用p=代替。