Sampling and Sampling Distribution
抽样与抽样分布
Chapter 4
主要内容
Simple Random Sampling 简单随机抽样
Point Estimation 点估计
Sampling Distributions 抽样分布
Sampling Distribution of
的抽样分布
Sampling Distribution of
的抽样分布
Properties of Point Estimators
点估计的特征
Other Sampling Methods其他抽样方法
Simple Random Sampling
简单随机抽样
有限总体(Finite Population)
从容量为N的有限总体中抽取容量为n的样本,如果样本中的每个样本点以相等的概率被抽出则称该样本为简单随机样本.
在抽下一个元素前将抽到的元素放回去,这种形式的抽样称为放回抽样(Sampling with Replacement).
在抽下一个元素前将抽到的元素不放回去抽样称为不放回抽样.
计算机产生的随机数是常用的自动取样过程
Simple Random Sampling
简单随机抽样
无限总体(Infinite Population)
无限总体的简单随机样本满足条件:
每个个体都来自同一个总体.
每个个体的抽取相互独立.
对于无限总体不能进行标号,抽样过程不能用随机数.
Point Estimation
点估计
为了估计总体的某个参数值,计算对应样本的特征来进行估计
我们用 来点估计总体均值 .
s 来点估计总体标准差 .
来点估计总体比例 p.
Sampling Distributions
抽样分布
Example:
总体由5个数据组成: 6 ,9, 12, 15, 18
现从中抽取n=3的样本, 求样本均值的分布
Sampling Distribution of
的抽样分布
的抽样分布是样本均值所有可能取值的概率分布
总体均值=?
总体中抽取样本
计算样本均值
用样本均值推断
总体均值
的标准差
有限总体 无限总体
如果n/N < .05 ,有限样本可看做无限总体.
是有限总体矫正因子.
是指均值标准差
E ( ) = 这里 = 总体均值
的数学期望
Central Limit Theorem中心极限定理
当样本容量很大(n≥30)时, 样本均值的抽样分布可以近似看成正态分布
的抽样分布
若总体 或非正态总体,但n≥30
则
对于非正态总体,当样本容量很大(n≥30)时, 样本均值的抽样分布可以近似看成正态分布
Sampling Distribution of 的抽样分布
的抽样分布是样本比例所有可能取值的概率分布
总体比例P=?
总体中抽取样本
计算样本比例
用样本比例推断
总体比例
的标准差
有限样本 无限样本
Sampling Distribution of 的抽样分布
这里 p = 总体均值
的数学期望
当样本容量很大(np≥5, n(1-p) ≥5)时, 样本比例 的抽样分布可以近似看成正态分布
的抽样分布
Properties of Point Estimators
点估计的特征
无偏性(Unbiasedness)
如果样本统计量的数学期望等于所估计的总体参数的值,则称该样本统计量为总体参数的无偏估计量
有效性(Efficiency)
点估计有最小的标准差
一致性(Consistency)
当样本增加时,点估计越来越接近总体参数
Unbiasedness 无偏性
P(X)
m
有偏
无偏
X
Efficiency有效性
m
样本分布
样本分布
X
P(X)
Consistency一致性
m
较大样本
较小样本
X
P(X)
A
B
Other Sampling Methods
其他抽样方法
Stratified Random Sampling
分层随机抽样
Cluster Sampling
整群抽样
Systematic Sampling
系统抽样
Stratified Random Sampling
分层随机抽样
将总体中的成员按某种原则划分成若干个子总体,每个子总体称为一个层,在每层中独立进行抽样,称为分层抽样。
如:小学1—6年级学生身高,按每年级分为一个层。
分层抽样优点:
抽取的样本在总体中分布得更均匀,更合理
各层内单位之间差异程度相对减少,使在该层内抽取的样本对该层的代表性得到提高。
层内成员差异较小,而层间成员差异较大时,分层抽样可以提高估计的精度。
Cluster Sampling
整群抽样
将总体成员分为若干个群(组),从这些群(组)中抽取部分群(组),调整对象是抽取的这些群(组)中的所有成员。
优点:调查单位地理位置集中时,实施起来较方便。
缺点:准确性较差。
Systematic Sampling
系统抽样
将总体中调查单位按次序排列,随机选取初始单位,然后按相等的间距抽取其它样本单位。
例:N=1000,n=200
抽取间隔:k=1000/200=5
Chapter Summary
本章小结
介绍了简单随机抽样和抽样分布的概念,说明了如何抽取一个简单随机样本,如何根据样本中所收集到的数据建立总体参数的点估计
和 估计量都是随机变量,这些随机变量的概率分布称为抽样分布
还描述了样本均值和样本比例的抽样分布
简单介绍了中心极限定理
最后介绍了其他一些抽样方法
The End of Chapter 4