此处是大标题样稿字样十五
字以内
概述
一、整群抽样(cluster sampling)的定义:
由若干个基本单元所组成的集合称为群。将总体划分为若干
群,然后以群为抽样单元,从总体中随机抽取一部分群,对抽
中的群中的所有基本单元进行调查的一种抽样技术。
严格来讲也称为单阶整群抽样。
二、特点:
1.可以简化抽样框的编制。
2.实施调查便利,节省费用。
3.但通常比简单随机抽样的抽样误差大。
三、分群的原则:群内单元差异大,群间差异小。
这样,被抽到的群代表性好,整群抽样的效率就高。
群规模相等情形,对群进行简单
随机抽样时的估计量及其方差
一、符号:
总体群数:N
每群含有的单元数:M
总体第i群第j个单元的指标值:Yij
总体中单元总数:M0=NM
样本群数:n
样本第i群第j个单元的观测值:yij
二、估计量:
1.群规模相等时,对群的抽样采取简单随机抽样,将群和Yi作为群
的指标值
例:在一次对某寄宿中学在校生零花钱的调查中,以宿
舍作为群进行整群抽样。每个宿舍有6个学生。用简
单随机抽样在全部315间宿舍中抽取8间宿舍。样本数
据如下:
试估计该学校平均每个学生每周的零花钱,并给出置信
度为95%的置信区间。
宿舍1 宿舍2 宿舍3 宿舍4 宿舍5 宿舍6 宿舍7 宿舍8
学生1 58 91 123 99 110 111 120 96
学生2 83 83 89 105 99 100 115 80
学生3 74 79 94 98 132 116 117 63
学生4 82 111 109 107 87 99 99 130
学生5 66 101 79 129 99 107 106 105
学生6 87 69 80 90 124 105 120 86
解:
宿舍1 宿舍2 宿舍3 宿舍4 宿舍5 宿舍6 宿舍7 宿舍8
学生1 58 91 123 99 110 111 120 96
学生2 83 83 89 105 99 100 115 80
学生3 74 79 94 98 132 116 117 63
学生4 82 111 109 107 87 99 99 130
学生5 66 101 79 129 99 107 106 105
学生6 87 69 80 90 124 105 120 86
三、整群抽样的设计效应:
1.群内、群间差异的定量刻划:
2.群内相关系数:是表达总体中群内小单元间相关程度的一个指标。
定义:
3.整群抽样的设计效应:
四、样本容量的确定:
1.根据方差公式确定。
群规模不相等的一般情形
一、符号:
总体群数:N
总体第i群含有的单元数:Mi
总体第i群第j个单元的指标值:Yij
样本群数:n
样本第i群含有的单元数:mi
样本第i群第j个单元的观测值:yij
总体中单元总数:
二、按简单随机抽样抽群时,总体总和、均值的估计量
及方差:
设群的样本量为n,则对Y的估计有两种方法。
(1)方法1:加权估计
(2)比估计:
例:从某新村中抽了由38户组成的一个简单随机
样本,调查每户参加体育活动的人数,设第i户
有Mi个人,其中参加体育活动的有ai人。经计
算:
试估计该新村参加体育活动的人所占的比例及其
标准差。(不计算f)
解:
*利用比估计来估计总体均值,精度要求为V时,样本量
的确定:
例:调查预估计某城市的人均收入,该城市共
415个街区,从中随机抽取了25个进行试点调
查,调查每个街区的居民数Mi和总收入Yi
(单位:美圆),数据如下:
为了使估计量的最大绝对误差为500美圆(置
信度为95%),应抽多大的样本?
解:
三.按与群规模Mi成比例的PPS抽样抽取群:
例.某市建筑行业集团共有48个单位,有载货汽车186辆。
按每个单位的车辆拥有量成比例的概率进行放回的PPS
抽样,共抽10次。对抽中单位的所有车辆调查季度运
量(单位:吨)。样本数据如下:
试估计全集团的季度运量及标准差。
样本单位编号i 车辆数mi 单位运量总和yi 平均每车运量
1
2
3
4
5
6
7
8
9
10
5
8
5
4
6
9
5
3
7
3
14230
21336
13650
11568
15216
23094
13650
7443
16723
8391
2846
2667
2730
2892
2536
2566
2730
2481
2389
2797
THANKS