统计学
天津财经大学统计系
第六章 有限总体概率抽样
第一节 有限总体概率抽样的一般问题
第二节 有限总体简单随机个体样本对总体指标的估计
第一节 有限总体概率抽样的一般问题
一、有限总体概率抽样的概念和作法
二、有限总体概率抽样的目的
三、有限总体概率抽样的若干基本概念
一、有限总体概率抽样的一般问题
(一)什么是有限总体概率抽样
对有限总体的每一次观察(每一次抽取)都是一次随机试验,并且有和总体相同的分布,按这样的要求对总体观测(抽取)n次的抽样行为,称作容量为n的概率样本。
(二)概率抽样的作法
对有限总体作概率抽样要求作到:对于每一次抽取行为都应精心组织,使得此时尚留在总体中的所有单位都有可能被抽到,并且有确定的、不等于0的被抽到的概率。
满足上述要求的从有限总体中抽取单位的概率抽样方式,常见的有三种:简单随机抽样、不等概率抽样、等距抽样。
1.简单随机抽样
抽取单位时,把总体中的单位充分混匀,等概率地从中抽出一个单位。常用的操作方法是:列出总体全部单位的完整名单(这个名单叫作抽样框),在抽样框中将总体单位编号,然后读随机数表(见附录6),从数表的任意位置开始向任意方向逐一读数,当读到属于总体单位编号范围内的数字时,相应的单位便进入样本。若需要继续抽取单位,便继续读随机数表。
2.不等概率抽样
抽取单位时,使得总体中的各单位进入样本的概率与它的大小成比例。常用的操作方法是:
首先编制总体单位的完整名单(抽样框),在抽样框中将每个单位的名称及表示其大小的标志值列示出来,然后把这些标志值都按比例换算成用整数表示。再将这些数值逐次累计。
3.等距抽样
首先编制总体单位的完整名单(抽样框),在抽样框中将每个单位的名称和准备用来对单位排队的某种标志的标志值列示出来。然后,把总体单位按该标志的标志值顺序重新排队。对于排好队的总体按一定的距离把这些单位分段。在第一段简单随机抽出一单位,接着,从此单位开始,按上述距离找出第二、第三等等须进入样本的单位。
简单随机抽样和不等概率抽样各自可实行放回和不放回两种作法。
二、有限总体概率抽样的目的
抽取有限总体概率样本的目的有两个:
一是作为描述性调查,描述有限总体的现实状态;
二是作为分析性调查,认识作为有限总体的母体的无限总体的统计规律(这里包括对无限总体作参数估计和对无限总体作显著性检验)。
三、有限总体概率抽样的若干基本概念
(一)总体
在概率抽样中,被观测的标志所组成的总体。
(二)样本
对有限总体进行了n次随机试验,便可写出n个随机变量:y1,y2,…,yn,把这n个随机变量叫作“容量为n的概率样本”。
(三)样本统计量
概率样本(y1,y2,…,yn)的函数T = f (y1,y2,…,yn) 叫作样本统计量。
样本统计量简称作统计量。
由于y1,y2,…,yn是随机变量,因此,作为它们的函数的样本统计量也是随机变量。既然是随机变量,便同其他随机变量一样,我们也常常关心它的分布,数学期望和方差。
(四)估计量
用适当的样本统计量作为对有限总体指标的估计,这样的样本统计量叫作估计量。用样本值计算得到的估计量的具体数值叫估计值。
(五)估计量的偏倚情况
估计量是否有偏倚,是看估计量的数学期望是否等于被估计的总体指标
如果二者相等,称估计量是被估计的总体指标的无偏估计量;如果二者不相等,称估计量是被估计的总体指标的有偏估计量。
估计量的数学期望与被估计的总体指标真值之差称作偏差。无偏估计量的偏差是0,有偏估计量的偏差不是0。
(六)估计量的精度
估计量的精度是指在反复进行的抽样中所有可能产生的估计值散布的集中或分散程度。这些估计值散布得越集中,我们说估计量的精度越高。显然,估计量的精度要用估计量的方差来描述。
方差的平方根叫估计量的标准误差(标准误)
在抽样实践中,对于每一个估计量,都应在算出估计值的同时,把它的方差也算出来。因为,方差说明了估计值的数据质量。估计量的方差小(精度高),说明所有可能出现的估计值散布很集中;反之,如果估计量的方差大(精度低),说明可能出现的各个估计值散布很分散。显然,前者估计值数据可信度高,后者估计值数据可信度低。计算估计量的方差还有另外一个理由。
(七)估计量的准确度
估计量的准确度与它的偏差有关。
估计值散布得越集中,它的准确度越高。
用估计量的均方误差(MSE)来描述估计量的准确度。
(八)估计的表达方式
用样本资料估计有限总体的指标有点估计和区间估计两种表达方式。
点估计:用估计量及其观察值(估计值)来表达对总体指标的估计。作点估计时,必须同时计算估计量的方差(或标准误)。
区间估计:用一个取值区间来表达对总体指标的估计。
这个数值区间叫作置信区间,区间的两个端点分别叫作置信下限和置信上限。这个区间把总体指标包含在内的概率叫置信概率。
作区间估计须知道估计量的分布规律。如果估计量近似服从正态分布,那末置信区间可用式()确定。
()
第二节 有限总体简单随机个体样本对总体指标的估计
我们只介绍对有限总体以个体为抽样单位的简单随机不放回抽样方式抽取样本情形下的估计问题。今后若无特别的说明,所说的简单随机抽样都是指的不放回情形。
一、总体均值和总体总值的估计
(一)总体总值和总体均值的定义
设总体有N个单位,标志值为y1,y2,…,yN。总体总值(记作Y)
(二)总体均值的估计
估计量:
估计量的估计方差:
式中,是样本方差。它的定义及便于计算的表达式为
(三)总体总值的估计
估计量:
估计量的估计方差
同理有
(四)估计量的分布规律
二、总体比例和相应单位数目的估计
(一)总体比例和相应单位数目的定义
设总体有N个单位,划分为C和C'两类,C类单位数目为A,C'类单位数目为A',A+A'=N。C类单位的总体比例P定义为
C类单位数目A和比例P的关系是 A = NP
(二)总体C类比例的估计
估计量
估计量的估计方差
(三)总体中C类单位数目的估计
估计量 :
估计量的估计方差
(四)估计量的分布规律
第三节 关于用有限总体概率样本作无限总体推断的一个说明
一、无限总体随机样本的标准
无限总体的随机样本也叫做无限总体的简单随机样本,它应当满足如下两个标准:
ⅰ)代表性:要求样本的每个分量与所考察的母体(随机变量)具有相同的分布。
ⅱ)独立性:为相互独立的随机变量,也就是说,每个观察结果既不影响其它观察的统计规律,它自己的统计规律也不受其它观察结果的影响。
二、对无限总体的统计推断
(一)无限总体均值的估计
随机变量的均值(期望值) 的估计量为
估计量的估计方差为
式中
若的分布偏斜得不很厉害,统计量
近似服从自由度为 n-1 的 分布。
当分布的自由度 足够大时( 30), 分布与
标准正态分布已很接近,这时可查正态分布表作区间估计。即 的置信区间近似地为
(二) 随机试验中某种指定事件C发生概率的估计
把要估计的概率记作 ,它的估计量为
估计量的估计方差为
当充分大,且≤≤时,的置信区间可以近似地表示为