§ PU大小不等的2S抽样
与群规模不等的CL对照着来理解本节的方法体
系
自加权样本的构造模式及估计方法(计算的重点)
8/18/2022 1统计学专业必修课3学分
PU大小不等时解决问题的思路
思路一:
PU大小不等的问题可以转化为PU大小相等来讨论,
比如分层,将大小近似的PU分到一层,则层内的
2S抽样就可以按PU大小相等的方法来处理
思路二:
如果做不到上述转化,PU大小不等的处理就要复杂
得多,复杂性体现在两个方面:
抽样方法:
PU的抽取是否考虑PU不等的因素
估计方法:
选择估计方法是否要考虑PU规模不等的因素
8/18/2022 2统计学专业必修课3学分
§方法体系
类似于CL群规模不等的估计
(一)对PU进行srs
1、加权估计
2、比率估计
(二)对PU进行PPS抽样(WR)
1、H-H估计
2、构造自加权样本
8/18/2022 3统计学专业必修课3学分
一、符号说明
两个抽样比
两个均值
两个方差
8/18/2022 4统计学专业必修课3学分
讨论的前提
A个PU a个PU
M1个BU
M2个BU
Ma个BU
……
m1个BU
m2个BU
ma个BU
……
每个PU相
互独立地
抽取相应
的BU数
8/18/2022 5统计学专业必修课3学分
基本符号(Yij,i=1,2,…,A ; j=1,2,…,Mi)
(yij ,i=1,2,…,a ; j=1,2,…,mi)
含义 总体 样本
第i个PU的
个体均值
总的个体均
值
PU间方差
第i个PU内
BU间的方差
不需要再进
一步综合
8/18/2022 6统计学专业必修课3学分
二、均值估计量及其性质
8/18/2022 7统计学专业必修课3学分
(一)对PU进行srs
抽样方法的选择上没有考虑PU规模不等的因
素
估计方法的选择是否考虑PU规模不等的因素
呢?
8/18/2022 8统计学专业必修课3学分
讨论的前提
A个PU
srs
a个PU
M1个BU
M2个BU
Ma个BU
……
srs
m1个BU
m2个BU
ma个BU
……
每个PU相
互独立地
抽取相应
的BU数
8/18/2022 9统计学专业必修课3学分
等概抽样的加权估计量(P198 )
适应性:一般用于Mi相差不大的情况
是个无偏估计
8/18/2022 10统计学专业必修课3学分
(二)对PU进行放回的不等概抽样
抽样方法的选择上考虑了PU规模不等
的因素
选择与之配套的估计方法:H-H估计
8/18/2022 11统计学专业必修课3学分
1、抽选方法说明
A个PU
PPS
a个PU
M1个BU
M2个BU
Ma个BU
……
m1个BU
m2个BU
ma个BU
……
每个PU相
互独立地
抽取相应
的BU数
PPS抽样结果有可能重复。如果某
PU被重复抽到,比如被抽到2次,则
分别独立的进行2次BU的抽取。对样
本单元实施调查,相同的单元记录2次
?
8/18/2022 12统计学专业必修课3学分
2、H-H估计量及其性质
由H-H估计量的性质可知,这是无偏估计量
方差
(P199 )
(P200 )
8/18/2022 13统计学专业必修课3学分
说明
估计量方差的估计式仅与第一阶段有关,
与第二阶段无关
所以,一般对第二阶段抽样方法不做特
别的规定
8/18/2022 14统计学专业必修课3学分
3、构造自加权估计量
①理论上,要想构造自加权估计量,必须
——将估计量形式表示成关于样本观测值之和的常数倍
8/18/2022 15统计学专业必修课3学分
关于f0含义的理解
相当于总体中任一BU被抽中的概率
如果f0事先确定,则
8/18/2022 16统计学专业必修课3学分
②总结:
实践中自加权样本的构造模式
在2S中,自加权样本按如下模式构造:
第一阶段对PU实施与规模成比例的PPS抽样
第二阶段对BU按srs抽取,且mi=m
这时,总值的估计量及方差的估计为:
8/18/2022 17统计学专业必修课3学分
补例
某小区拥有10座高层建筑,每座高层建筑拥有的楼层数如下表:
用二阶抽样方法抽出10个楼层进行调查,第一阶抽样为放回的、
按与每座建筑拥有的楼层数成比例的PPS抽样抽取5座建筑,第
二阶按srs对每座建筑抽取2个楼层。对10个楼层居民人数的调
查结果如下表。估计小区的总居民数,并给出估计的精度。
高层建筑 A B C D E F G H I J 合计
楼层 12 12 16 15 10 16 10 18 16 20 145
一阶样本序号 1 2 3 4 5 合计
居民数 18,12 15,18 19,13 16,10 16,11 148
yi 15 16 13
y
8/18/2022 18统计学专业必修课3学分
解答
2S自加权样本的模式构造:
第一阶段对PU实施与规模成比例的PPS抽样
第二阶段对BU按srs抽取,且mi=m
本例的做法:用2S方法抽出10个楼层进行调查,第一阶
抽样为放回的、按与每座建筑拥有的楼层数成比例的PPS
抽样抽取5座建筑,第二阶按srs对每座建筑抽取2个楼层
这时,总值的估计量及方差的估计为:
8/18/2022 19统计学专业必修课3学分
解答
自加权的构造模式
a=5,m=2,M0=145
8/18/2022 20统计学专业必修课3学分
补充习题
某公司欲了解职工上班交通所需时间,该公司共有5个
部门,根据每个部门的人数采用PPS抽样抽出2个部门,
并在2个部门中采用srs分别抽出5名职工,调查的结果
如下:
试估计该公司职工上班交通平均所需时间,并给出估计
的标准差。
部门i 职工人数Mi 时间yij(分钟)
1 20 40,10,20,30,40
2 35 60,30,20,60,30
§结束
8/18/2022 21统计学专业必修课3学分
§其他问题
一、3S抽样
二、2S总样本量及最优样本量的配置
8/18/2022 22统计学专业必修课3学分
一、3S及MS抽样
8/18/2022 23统计学专业必修课3学分
(一)各阶单元大小相等的MS
(以3S为例)
1、含义
总体包含A个PU,每个PU含M个二级单元,每个二
级单元含G个BU
分别srs抽取a个PU、m个二级单元、g个BU
A
a
PU
srs
M
m
二阶单元
srs
G
g
BU
srs
8/18/2022 24统计学专业必修课3学分
2、估计量及其性质(P194 )
实践中,对于更高阶的情况,估计量的方差一般只需
计算到第二或第三阶就可以了
这是误差的
主要组成部分
amg一定时,提高a而减少m、
g会有效提高估计的精度
方差的
无偏估计
8/18/2022 25统计学专业必修课3学分
(二)各阶单元大小不等的MS(不要求)
以总值Y的估计为例来说明
通常有两种方法
1、各阶抽样采用PPS抽样
2、构造自加权样本
重点掌握:样本为自加权的条件
8/18/2022 26统计学专业必修课3学分
构造自加权样本
(样本为自加权的条件)
8/18/2022 27统计学专业必修课3学分
①抽样方法
前两个阶段PPS抽样,最后一个阶段srs
从第二阶开始,每一阶各下级样本单元数都相等
则,样本是自加权的
A
a
PU
PPS
Mi
m
二级单元
PPS
Gij
g
BU
srs
8/18/2022 28统计学专业必修课3学分
②估计量与方差估计
8/18/2022 29统计学专业必修课3学分
3阶以上的MS自加权样本的构造
类似地,对于更高阶的情况,除了最后一阶采用
srs(wor或wr都行),前几阶均采用PPS抽样;并且,
从第二阶开始,每一阶的样本量都相同,则样本是自
加权的
自加权样本的好处
估计量的形式及方差的估计都非常简单
抽样估计效果一般也不错
8/18/2022 30统计学专业必修课3学分
二、2S总样本量及最优样本量的配置
讨论的前提:PU大小相等的2S
背景说明
每个PU均包含M个BU
两个阶段均采用srs
A→a,M→m
各PU相互独立地抽取BU
8/18/2022 31统计学专业必修课3学分
(一)(am)的确定
两种思路:
1、费用
2、n2S=nsrs×Deff
Deff的确定是关键
实践中,一般,MS的Deff在~3之间
8/18/2022 32统计学专业必修课3学分
(二)最优样本量的配置
前提:
1、PU大小相等
2、(am)一定的前提下,合理分配a和m
的大小
相当于确定最优抽样比f1=a/A、f2=m/M
8/18/2022 33统计学专业必修课3学分
1、基本思想
①怎样算是最优配置
最优设计、最优分配
C一定的前提下,使估计精度最高
在一定精度的要求下,使C最省
2S费用函数形式: C=c0+c1a+c2am
②实践中的基本原则
8/18/2022 34统计学专业必修课3学分
②实践中的基本原则
a尽量大一些,m尽量小一些
两个阶段方差的大小
如果:PU间的方差S12大,PU内BU间的方差S22小
——则,a大一点,m小一点
如果:S12小,S22大
——则,a小一点,m大一点
两个阶段单位调查费用
如果:PU的单位调查费用c1大,BU的单位调查费用c2小
——则,a小一点,m大一点
如果:c1小,c2大
——则a多一点,m小一点
8/18/2022 35统计学专业必修课3学分
2、求a、m的最优分配法 (P202 )
结论:
其中:
将mopt代入V公式,可求得V给定的情况下,
使C→min的aopt ()
将mopt代入C公式,可求得C限定的情况下,
使V→min的aopt ()
问题:如何
确定aopt?
8/18/2022 36统计学专业必修课3学分
来历
有两种方法可以确定以上m的最优分配公式
①拉格朗日乘子法
②柯西——施瓦兹不等式
基本思想:
——借助方差函数和费用函数构造损失函数,求
使得损失函数达极小值的m
8/18/2022 37统计学专业必修课3学分
构造损失函数
利用方差函数和费用
函数构造损失函数
2S的方差函数为
最简单的费用函数
形式:
8/18/2022 38统计学专业必修课3学分
柯西——施瓦兹不等式
求解使损失函数达到极小值的m
这一求解过程借助C-S不等式完成
C-S不等式的内容:
——若a1、a2、b1、b2非负,则
(a12+a22)(b12+b22) ≥(a1b1+a2b2)2,当且仅当
a1/b1=a2/b2=k时,“=”成立
令
8/18/2022 39统计学专业必修课3学分
需要说明的问题
实际计算时,Su、S2、c1、c2都是估计值
mopt往往非整,怎么办?
——实践中常用卡梅伦规则来处理
8/18/2022 40统计学专业必修课3学分
3、实用规则
——卡梅伦(Cameron)规则(1951)
解决mopt非整的问题
令m’=[mopt],则按以下规则取m值
①当mopt2>m’(m’+1),则取m=m’+1
②当mopt2≤m’(m’+1),则取m=m’
③当mopt2>M或Su2<0,则取m=M,即CL
当M较小时,有可能出现第三种情况
§结束
8/18/2022 41统计学专业必修课3学分
CH9小结
MS的优点、估计推断原理的理解
PU大小相等的2S,是重点,均值估计和比例估计,典
型例题【】,【】
PU大小不等的2S,重点掌握自加权样本的构造及均值
估计问题,注意补充例题
3S或3S以上的重点掌握自加权样本的构造模式,不要
求计算
2S样本量分配的基本结论(),不要求计算
8/18/2022 42统计学专业必修课3学分
作业
思考:P196 ,
作业:P196 ,,
CH9结束
8/18/2022 43统计学专业必修课3学分