PU大小不等时解决问题的思路
思路一:
PU大小不等的问题可以转化为PU大小相等来讨
论,比如分层,将大小近似的PU分到一层,则层
内的2S抽样就可以按PU大小相等的方法来处理
思路二:
如果做不到上述转化,PU大小不等的处理就要复
杂得多,复杂性体现在两个方面:
抽样方法:
PU的抽取是否考虑PU不等的因素
估计方法:
选择估计方法是否要考虑PU规模不等的
因素2021/4/23 1统计学专业必修课3学分
§方法体系
类似于CL群规模不等的估计
(一)对PU进行srs
1、加权估计
2、比率估计
(二)对PU进行PPS抽样(WR)
1、H-H估计
2、构造自加权样本
2021/4/23 2统计学专业必修课3学分
一、符号说明
两个抽样比
两个均值
两个方差
2021/4/23 3统计学专业必修课3学分
讨论的前提
A个PU a个PU
M1个BU
M2个BU
Ma个BU
……
m1个BU
m2个BU
ma个BU
……
每个PU相
互独立地
抽取相应
的BU数
2021/4/23 4统计学专业必修课3学分
基本符号(Yij,i=1,2,…,A ; j=1,2,…,Mi)
(yij ,i=1,2,…,a ; j=1,2,…,mi)
含义 总体 样本
第i个PU的
个体均值
总的个体均
值
PU间方差
第i个PU内
BU间的方差
不需要再进
一步综合
2021/4/23 5统计学专业必修课3学分
二、均值估计量及其性质
2021/4/23 6统计学专业必修课3学分
(一)对PU进行srs
抽样方法的选择上没有考虑PU规模不等的因
素
估计方法的选择是否考虑PU规模不等的因素
呢?
2021/4/23 7统计学专业必修课3学分
讨论的前提
A个PU
srs
a个PU
M1个BU
M2个BU
Ma个BU
……
srs
m1个BU
m2个BU
ma个BU
……
每个PU相
互独立地
抽取相应
的BU数
2021/4/23 8统计学专业必修课3学分
等概抽样的加权估计量(P198 )
适应性:一般用于Mi相差不大的情况
是个无偏估计
2021/4/23 9统计学专业必修课3学分
(二)对PU进行放回的不等概抽样
抽样方法的选择上考虑了PU规模不等
的因素
选择与之配套的估计方法:H-H估计
2021/4/23 10统计学专业必修课3学分
1、抽选方法说明
A个PU
PPS
a个PU
M1个BU
M2个BU
Ma个BU
……
m1个BU
m2个BU
ma个BU
……
每个PU相
互独立地
抽取相应
的BU数
PPS抽样结果有可能重复。如果某
PU被重复抽到,比如被抽到2次,则
分别独立的进行2次BU的抽取。对样
本单元实施调查,相同的单元记录2次
?
2021/4/23 11统计学专业必修课3学分
2、H-H估计量及其性质
由H-H估计量的性质可知,这是无偏估计量
方差
(P199 )
(P200 )
2021/4/23 12统计学专业必修课3学分
说明
估计量方差的估计式仅与第一
阶段有关,与第二阶段无关
所以,一般对第二阶段抽样方
法不做特别的规定
2021/4/23 13统计学专业必修课3学分
3、构造自加权估计量
①理论上,要想构造自加权估计量,必须
——将估计量形式表示成关于样本观测值之和的常数倍
2021/4/23 14统计学专业必修课3学分
关于f0含义的理解
相当于总体中任一BU被抽中的概率
如果f0事先确定,则
2021/4/23 15统计学专业必修课3学分
②总结:
实践中自加权样本的构造模式
在2S中,自加权样本按如下模式构造:
第一阶段对PU实施与规模成比例的
PPS抽样
第二阶段对BU按srs抽取,且
mi=m
这时,总值的估计量及方差的估计为:
2021/4/23 16统计学专业必修课3学分
补例
某小区拥有10座高层建筑,每座高层建筑拥有的楼层数如下
表:
用二阶抽样方法抽出10个楼层进行调查,第一阶抽样为放回
的、按与每座建筑拥有的楼层数成比例的PPS抽样抽取5座建
筑,第二阶按srs对每座建筑抽取2个楼层。对10个楼层居民
人数的调查结果如下表。估计小区的总居民数,并给出估计的
精度。
高层建筑 A B C D E F G H I J 合计
楼层 12 12 16 15 10 16 10 18 16 20 145
一阶样本序号 1 2 3 4 5 合计
居民数 18,12 15,18 19,13 16,10 16,11 148
yi 15 16 13
y2021/4/23 17统计学专业必修课3学分
解答
2S自加权样本的模式构造:
第一阶段对PU实施与规模成比例的PPS抽样
第二阶段对BU按srs抽取,且mi=m
本例的做法:用2S方法抽出10个楼层进行调查,第一阶
抽样为放回的、按与每座建筑拥有的楼层数成比例的
PPS抽样抽取5座建筑,第二阶按srs对每座建筑抽取2
个楼层
这时,总值的估计量及方差的估计为:
2021/4/23 18统计学专业必修课3学分
解答
自加权的构造模式
a=5,m=2,M0=145
2021/4/23 19统计学专业必修课3学分
补充习题
某公司欲了解职工上班交通所需时间,该公司共有5个
部门,根据每个部门的人数采用PPS抽样抽出2个部门,
并在2个部门中采用srs分别抽出5名职工,调查的结果
如下:
试估计该公司职工上班交通平均所需时间,并给出估
计的标准差。
部门i 职工人数Mi 时间yij(分钟)
1 20 40,10,20,30,40
2 35 60,30,20,60,30
§结束
2021/4/23 20统计学专业必修课3学分
§其他问题
一、3S抽样
二、2S总样本量及最优样本量的配置
2021/4/23 21统计学专业必修课3学分
一、3S及MS抽样
2021/4/23 22统计学专业必修课3学分
(一)各阶单元大小相等的MS
(以3S为例)
1、含义
总体包含A个PU,每个PU含M个二级单元,每个二
级单元含G个BU
分别srs抽取a个PU、m个二级单元、g个BU
A
a
PU
srs
M
m
二阶单元
srs
G
g
BU
srs
2021/4/23 23统计学专业必修课3学分
2、估计量及其性质(P194 )
实践中,对于更高阶的情况,估计量的方差一般只需
计算到第二或第三阶就可以了
这是误差的
主要组成部分
amg一定时,提高a而减少m、
g会有效提高估计的精度
方差的
无偏估计
2021/4/23 24统计学专业必修课3学分
(二)各阶单元大小不等的MS(不要求
)
以总值Y的估计为例来说明
通常有两种方法
1、各阶抽样采用PPS抽样
2、构造自加权样本
重点掌握:样本为自加权的条
件
2021/4/23 25统计学专业必修课3学分
构造自加权样本
(样本为自加权的条件)
2021/4/23 26统计学专业必修课3学分
①抽样方法
前两个阶段PPS抽样,最后一个阶段srs
从第二阶开始,每一阶各下级样本单元数都相等
则,样本是自加权的
A
a
PU
PPS
Mi
m
二级单元
PPS
Gij
g
BU
srs
2021/4/23 27统计学专业必修课3学分
②估计量与方差估计
2021/4/23 28统计学专业必修课3学分
3阶以上的MS自加权样本的构造
类似地,对于更高阶的情况,除了最后一阶采用
srs(wor或wr都行),前几阶均采用PPS抽样;并且,
从第二阶开始,每一阶的样本量都相同,则样本是自
加权的
自加权样本的好处
估计量的形式及方差的估计都非常简单
抽样估计效果一般也不错
2021/4/23 29统计学专业必修课3学分
二、2S总样本量及最优样本量的配置
讨论的前提:PU大小相等的2S
背景说明
每个PU均包含M个BU
两个阶段均采用srs
A→a,M→m
各PU相互独立地抽取BU
2021/4/23 30统计学专业必修课3学分
(一)(am)的确定
两种思路:
1、费用
2、n2S=nsrs×Deff
Deff的确定是关键
实践中,一般,MS的Deff在
~3之间
2021/4/23 31统计学专业必修课3学分
(二)最优样本量的配置
前提:
1、PU大小相等
2、(am)一定的前提下,合理
分配a和m的大小
相当于确定最优抽样比f1=a/A、f2=m/M
2021/4/23 32统计学专业必修课3学分
1、基本思想
①怎样算是最优配置
最优设计、最优分配
C一定的前提下,使估计精度最高
在一定精度的要求下,使C最省
2S费用函数形式: C=c0+c1a+c2am
②实践中的基本原则
2021/4/23 33统计学专业必修课3学分
②实践中的基本原则
a尽量大一些,m尽量小一些
两个阶段方差的大小
如果:PU间的方差S12大,PU内BU间的
方差S22小
——则,a大一点,m小一点
如果:S12小,S22大
——则,a小一点,m大一点
两个阶段单位调查费用
如果:PU的单位调查费用c1大,BU的单
位调查费用c2小
——则,a小一点,m大一点
如果:c1小,c2大
——则a多一点,m小一点
2021/4/23 34统计学专业必修课3学分
2、求a、m的最优分配法 (P202 )
结论:
其中:
将mopt代入V公式,可求得V给定的情况下,
使C→min的aopt ()
将mopt代入C公式,可求得C限定的情况下,
使V→min的aopt ()
问题:如何
确定aopt?
2021/4/23 35统计学专业必修课3学分
来历
有两种方法可以确定以上m的最优分配公式
①拉格朗日乘子法
②柯西——施瓦兹不等式
基本思想:
——借助方差函数和费用函数构造损失函数,求
使得损失函数达极小值的m
2021/4/23 36统计学专业必修课3学分
构造损失函数
利用方差函数和费
用函数构造损失函
数
2S的方差函数为
最简单的费用函数
形式:
2021/4/23 37统计学专业必修课3学分
柯西——施瓦兹不等式
求解使损失函数达到极小值的m
这一求解过程借助C-S不等式完成
C-S不等式的内容:
——若a1、a2、b1、b2非负,则
(a12+a22)(b12+b22) ≥(a1b1+a2b2)2,当且仅当
a1/b1=a2/b2=k时,“=”成立
令
2021/4/23 38统计学专业必修课3学分
需要说明的问题
实际计算时,Su、S2、c1、c2都是估计值
mopt往往非整,怎么办?
——实践中常用卡梅伦规则来处理
2021/4/23 39统计学专业必修课3学分
3、实用规则
——卡梅伦(Cameron)规则(1951)
解决mopt非整的问题
令m’=[mopt],则按以下规则取m值
①当mopt2>m’(m’+1),则取m=m’+1
②当mopt2≤m’(m’+1),则取m=m’
③当mopt2>M或Su2<0,则取m=M,即CL
当M较小时,有可能出现第三种情况
§结束
2021/4/23 40统计学专业必修课3学分
CH9小结
MS的优点、估计推断原理的理解
PU大小相等的2S,是重点,均值估计和比例估计,
典型例题【】,【】
PU大小不等的2S,重点掌握自加权样本的构造及均
值估计问题,注意补充例题
3S或3S以上的重点掌握自加权样本的构造模式,不
要求计算
2S样本量分配的基本结论(),不要求计算
2021/4/23 41统计学专业必修课3学分