此处是大标题样稿字样十五
字以内
第一节 抽样法的概述
抽样法的概念与特点
总体参数与样本统计量
抽样的方法
非抽样误差和抽样误差
概念
抽样调查是一种非全面调查。它按随机的原则
从总体中抽出部分单位(简称样本)进行调查,
以获得有关的数据资料。
抽样推断是根据抽样调查所获得的样本信息,
对总体的数量特征做出具有一定可靠程度的估计
和推断。
按随机原则抽取样本;目的在于用样本
指标推断相应的总体指标进行估计、推断;
可以计算和控制抽样误差。
NEXT
总体参数— 描述总体数量特征的指标。总体是惟一的,
所以参数也是惟一的;
样本统计量— 描述样本数量特征的指标,由样本计算而
得。由于样本是随机的,所以样本统计量是随机变量。
总体参数 样本统计量 样本统计量公式
总体平均数 样本平均数
总体成数 样本成数
总体方差 样本方差
总体标准差 样本标准差
NEXT
概率抽样— 按随机的原则,从总体抽出样本。
每一个总体单位有一定的可能性被抽中。
非概率抽样—不遵循随机原则,而是按照人们
的主观愿望抽选样本。
重复抽样:抽一个容量为 的样本时,每次抽出
一个单位进行登记。再放回下总体中继续下次抽
选,直至抽够个样本点 为止。
特点是:每个总体单位可能被重复抽中;
有个可能的样本 ;
每个总体单位被抽中的可能性为 。
不重复抽样:抽一个容量为 的样本时,每次抽
出一个单位进行登记。不再放回总体中,继续进
行次抽选,直至抽够个 样本点为止。
特点是:
每个总体单位不可能被重复抽中;
不考虑顺序的情况下,有个可能的样本 ;
每个总体单位被抽中的可能性为1/ 。
NEXT
非抽样误差—在统计调查中,由于主客观原因
而引起的诸如测量、登录、计算等误差。该误差
可以避免。
抽样误差—在抽样调查中由于抽样的随机性而
产生的样本指标对总体指标的代表性误差。样本
虽然是总体的缩影,但是还不足以完全代表总体,
从而产生了误差。抽样误差是随机抽样固有的,
可以计算并加以控制,但不可以避免。
NEXT
第二节 抽样分布
本节所要讨论的问题是统计
推断的基础。
要解决以下问题:
样本均值服从什么分布?
两个样本均值之差服从什么分
布?
样本成数服从什么分布?
两个样本成数之差服从什么分
布?
样本方差服从什么分布?
两样本方差之比服从什么分布
?
一、样本均值及样本
均值差的抽样分布
样本均值的抽样分布
样本均值差的抽样分布
假设A、B、C、D、E5位同学的统计学成绩分别为:
80、 86、90、92、96。可计算得总体均值为,总体方
差为。现在随机从中抽容量为2的样本。
重复抽样的所有可能的样本:
样本(AA)(AB)(AC)(AD)(AE)
均值 80 83 85 86 88
样本 (BA)(BB) (BC) (BD)(BE)
均值 83 86 88 89 91
样本 (CA)(CB)(CC)(CD)(CE)
均值 85 88 90 91 93
样本(DA)(DB)(DC) (DD) (DE)
均值 86 89 91 92 94
样本 (EA) (EB)(EC)(ED) (EE)
均值 88 91 93 94 96
非重复抽样的样本:
样本(AA)(AB)(AC)(AD)(AE)
均值 80 83 85 86 88
样本 (BC)(BD)(BE)
均值 88 89 91
样本(CD)(CE)
均值 91 93
重复抽样样本均值平均数为,方差为。。
不重复抽样样本均值平均数为,方差为。
重复抽样:
样本均值的数学期望
方差
不重复抽样:
样本均值的数学期望
方差
定理:设总体服从正态分布 ,从总体
中随机容量为 的样本 。样本平均数 服从正态
分布 。
在重复抽样条件下:均值为 ,方差为
。进而有 ;
在不重复抽样条件下:均值为 ,方差为
NEXT
用途:估计总体的均值。
样本均值差的分布
用途:当讨论两个总体的均值是否相等时,常用此统
计量。
定理: 和 是两个正态总体,均值分别
为 和 ,方差分别为 和 。采用重复抽样
方法从两个总体中分别抽出容量为 和 独立样
本,样本均值差 服从正态分布,且均值为
- ,方差为 ,则
服从标准正态分布。
特别:若两总体的方差未知,可以用样本的方
差 和 替代。当样本容量足够大,
渐近服从标准正态分布。
如果: 和 是两个非正态总体,当和样本容
量足够大,
渐近服从标准正态分布。
NEXT
二、样本成数及成数差
的抽样分布
成数的概念
样本成数的分布
两个总体样本成数差的分布
成数的概念
若总体单位的某种标志只有两种表现,
总体成数是指具有某种特征和属性的单位在
全部总体单位重所占比重。记为p。
以 代表个总体单位中具有某种特征
的单位数, 代表个总体单位中不具有某种
特征的单位数,N=N1+N0。有
从总体中随机抽出 容量为的样本,具有某
种特征的单位数为 ,则样本的成数为 。
例如,某工厂生产某种电子元件,某批产品
共10000件,其中不合格品100件,则不合格品所
占的成数 。若从中按随机的原则抽100件,
其中有3件不合格品,则样本的成数为 。
NEXT
样本成数的分布
用途:推断或估计总体的成数。例如某项改
革方案工人的支持率,产品的正品率等。
定理:在一个容量为 样本中,具有某种特征的总
体单位数 是服从二项分布的随机变量,当样本容量
足够大,且 根 据中心极限定理的
结论,有
其中
NEXT
样本成数差的分布
用途:比较两个总体的成数。比如,比较两个企业的同
类产品的市场占有率,比较新旧工艺生产出的产品废品率
是否有显著性差异。
定理:设有两总体,总体的成数分别为 和 。从中分别
抽出容量为 和 的样本。当样本容量足够大,样本的
成数之差近似服从正态分布,均值为 ,方差为
,的正态分布。
NEXT
三、由正态分布导出的几个重要的分布
分布 :
用途:讨论某种工艺生产的产品质量是否
稳定,是估计总体方差的问题。对总体的方
差进行估计时,必须利用样本的方差
那么样本的方差服从什么分布?
定理:设 是 个相互独立的服从标准正
态分布的随机变量,记他们的平方和为
则 服从自由度 为的 分布。
服从自由度为 的 分布。
定理:若 是来自正态总体的一个样本,
则其样本均值为 ,样本的修正方差为
则
用Excel计算分布的概率
给定值 计算大于的概率:
/统计/Chidist/按对话框的提示键入值和自
由度;
给定上侧概率值 计算:
/统计/Chiinv/按对话框的提示键入概率值
和自由度。
NEXT
分布:
用途:对总体的均值进行推断时,通常情况下
总体方差是未知的,这就意味着,统计量
中含有未知的参数,如果我们用样本的修正方
差 代换总体的方差,则上式
变为
它不服从标准正态分布,而服从 分布。在总体
方差 未知时,推断总体均值,需考虑 统计量。
定理:设 是服从标准正态分布, 服从自由
度为 的 分布,且相互独立,则
服从自由度为 的 分布。
定理:若 是来自正态总体 的
一个样本,其样本均值为 ,样本的修正
方差为 , 则 服从
自由度为 的 分布。
定理:若 和 是分别来自
正态总体 和 的样本,且相互独
立,则
其中
服从自由度 为的 分布。
给定值 计算单侧或双侧的概率:
/统计/Tdist/(tails处,单侧键入1,双侧键
入2)。
给定双侧概率值 计算区间点:
/统计/Tinv/按对话框的提示键入相应的变
量。
NEXT
F分布
用途:在实际的统计分析工作中,我们常常遇到
讨论两个总体的方差是否相等的问题。比如某个
工厂采用两种不同的工艺生产某种产品,欲了解
哪一种工艺的质量稳定,则需要讨论起质量指标
的方差是否相等。
定理:设 和 分别服从自由度为 和
的 分布,则
服从第一自由度为 , 第二自由度为
的 分布。
定理:设若 和 分别是来自正
态总体 和 的样本,且相互独立。
样本修正方差分别为
则 服从第一自由度为 和
第二自由度为 的F分布。
查表求概率F分布的上侧百分位点
用Excel计算F分布的概率:
给定变量值 求大于的概率:
/统计/Fdist/按对话框的提示键入相应
的变量。
给定概率值 求相应的值:
/统计/FINV/按对话框的提示键入相应的
变量。
NEXT
第三节 抽样的组织方
式
简单随机抽样
分层抽样
等距抽样
整群抽样
多阶段抽样
简单随机抽样:简单随机抽样又称纯随机抽样,
是直接从总体中按随机的原则抽容量为 的样本,
每一个总体单位有相同的可能性被抽中。
特点:在差异较大的总体中,简单随机抽样的
样本不一定能保证样本的代表性。
NEXT
分层抽样
概念:分层抽样又称类型抽样。首先将总体单
位按某一个标志分层;然后在各层按随机抽样的
方法分别抽出各层的样本。
特点:分层抽样在层内是抽样调查,层间是全面
调查,所以分层时应该尽量让每层内的变异程度
小,而层间的变异程度大。分层抽样的抽样误差
较简单随机抽样小,样本具有很好的代表性。
抽样平均误差的计算公式:
通常情况下,分层抽样的抽样平均误差小于
简单随机抽样的平均误差)。
方法:
1、比例分配法;
考虑每层中的总体单位数,按比例在每层中抽
出相同比例的样本,即
每层的样本容量
是各层的标准差。
2、奈曼最佳分配法;
考虑每层中总体单位的变异程度不同,在样本
容量一定的条件下,变异大的层样本容量也大,
变异小的层样本容量也小。每层的样本容量为
3、经济分配法。
既考虑每层中总体单位的变异程度不同,又考
虑每层的调查费用。所以在样本容量一定的条件
下,标志变异大的层样本容量也大一些,调查费
用大的层,样本容量相对小些。则
NEXT
等距抽样
概念:首先将总体单位按某标志排队,排队的
标志可以与调查有关,也可以与调查无关;然后
计算抽样的距离 ;然后随机确定抽样起点
最后等距离抽出样本点构成样本。
抽样误差的计算:有关标志排队用分层抽样的
公式估计抽样误差;无关标志排队等同于简单随
机抽样,所以用简单随机抽样的方法计算。
NEXT
整群抽样
概念:首先将总体划分为群 ;然后按随机的
原则不重复抽出群 ,在每群中进行全面调查。该
调查方法适用于单位较多的总体。
与分层抽样相反的,整群抽样在群内是全面调
查,在群间是抽样调查。
计算抽样平均误差的公式:
NEXT
THANKS