统计、抽样方法
一、教学目标
1.随机抽样。
2.用样本估计总体。
3.变量的相关性。
二、知识提要
1.抽样
当总体中的个体较少时,一般可用简单随机抽样;当总体中的个体较多时,一般可用系
统抽样;当总体由差异明显的几部分组成时,一般可用分层抽样,而简单随机抽样作为一种
最简单的抽样方法,又在其中处于一种非常重要的地位.实施简单随机抽样,主要有两种方
法:抽签法和随机数表法.
系统抽样适用于总体中的个体数较多的情况,因为这时采用简单随机抽样就显得不方便,
系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均匀分后的每一段进行
抽样时,采用的是简单随机抽样;与简单随机抽样一样,系统抽样也属于等概率抽样.
分层抽样在内容上与系统抽样是平行的,在每一层进行抽样时,采用简单随机抽样或系
统抽样,分层抽样也是等概率抽样.
2.样本与总体
用样本估计总体是研究统计问题的一种思想方法.当总体中的个体取不同数值很少时,
其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的条形图,
当总体中的个体取不同值较多,甚至无限时,其频率分布的研究要用到初中学过的整理样本
数据的知识.
用样本估计总体,除在整体上用样本的频率分布去估计总体的分布以外,还可以从特征
数上进行估计,即用样本的平均数去估计总体的平均数,用关于样本的方差(标准差)去估
计总体的方差(标准差).
3.正态分布
正态分布在实际生产、生活中有着广泛的应用,很多变量,如测量的误差、产品的尺寸
等服从或近似服从正态分布,利用正态分布的有关性质可以对产品进行假设检验.
4.线性回归直线
设 x、y 是具有相关关系的两个变量,且相应于 n 组观察值的 n 个点大致分布在一条直
线的附近,我们把整体上这 n 个点最接近的一条直线叫线性回归直线.
三、基础训练
1.一个总体中共有 10 个个体,用简单随机抽样的方法从中抽取一容量为 3 的样本,则
某特定个体入样的概率是( )
A. B. C. D.
2.(2004 年江苏,6)某校为了了解学生的课外阅读情况,随机调查了 50 名学生,得到
他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.根据条形图可得这
50 名学生这一天平均每人的课外阅读时间为( )
3
10C
3
8910
3
10
3
10
1
h h h h
3.如果随机变量ξ~N(μ,σ2),且 Eξ=3,Dξ=1,则 P(-1<ξ≤1)等于( )
Φ(1)-1 B.Φ(4)-Φ(2)
C.Φ(2)-Φ(4) D.Φ(-4)-Φ(-2)
4..为考虑广告费用 x 与销售额 y 之间的关系,抽取了 5 家餐厅,得到如下数据:
广告费用(千元)
销售额(千元)
现要使销售额达到 6 万元,则需广告费用为______.(保留两位有效数字)
四、典型例题
【例 1】 某批零件共 160 个,其中,一级品 48 个,二级品 64 个,三级品 32 个,等外
品 16 个.从中抽取一个容量为 20 的样本.请说明分别用简单随机抽样、系统抽样和分层抽样
法抽取时总体中的每个个体被取到的概率均相同.
【例 2】 已知测量误差ξ~N(2,100)(cm),必须进行多少次测量,才能使至少有一
次测量误差的绝对值不超过 8 cm 的频率大于 ?
五、达标检测
1.对总数为 N 的一批零件抽取一个容量为 30 的样本,若每个零件被抽取的概率为 ,
则 N 等于( )
2.设随机变量ξ~N(μ,σ),且 P(ξ≤C)=P(ξ>C),则 C 等于( )
B.σ C.-μ D.μ
3.(2003 年全国,14)某公司生产三种型号的轿车,产量分别为 1200 辆、6000 辆和 2000
辆,为检验该公司的产品质量,现用分层抽样的方法抽取 46 辆进行检验,这三种型号的轿
车依次应抽取______辆、______辆、______辆.
4.某厂生产的零件外直径ξ~N(,)(mm),今从该厂上、下午生产的零件中各
随机取出一个,测得其外直径分别为 mm 和 mm,则可认为( )
A.上、下午生产情况均为正常 B.上、下午生产情况均为异常
C.上午生产情况正常,下午生产情况异常D.上午生产情况异常,下午生产情况正常
5.随机变量ξ服从正态分布 N(0,1),如果 P(ξ<1)=,求 P(-1<ξ<0).
6.公共汽车门的高度是按照确保 99%以上的成年男子头部不跟车门顶部碰撞设计的,如
果某地成年男子的身高ξ~N(173,72)(cm),问车门应设计多高?
20
15
10
5
人数(人)
时间(h)0
基础训练
1.解析:简单随机抽样中每一个体的入样概率为 .
答案:C
2.解析:一天平均每人的课外阅读时间应为一天的总阅读时间与学生数的比,即
= h.
答案:B
3.解析:对正态分布,μ=Eξ=3,σ2=Dξ=1,故 P(-1<ξ≤1)=Φ(1-3)-Φ(-1-3)
=Φ(-2)-Φ(-4)=Φ(4)-Φ(2).
答案:B
4.解析:先求出回归方程 =bx+a,令 =6,得 x= 万元.
答案: 万元
典型例题
【例 1】剖析:要说明每个个体被取到的概率相同,只需计算出用三种抽样方法抽取个
体时,每个个体被取到的概率.
解:(1)简单随机抽样法:可采取抽签法,将 160 个零件按 1~160 编号,相应地制
作 1~160 号的 160 个签,从中随机抽 20 个.显然每个个体被抽到的概率为 = .
(2)系统抽样法:将 160 个零件从 1 至 160 编上号,按编号顺序分成 20 组,每组 8 个.
然后在第 1 组用抽签法随机抽取一个号码,如它是第 k 号(1≤k≤8),则在其余组中分别抽
取第 k+8n(n=1,2,3,…,19)号,此时每个个体被抽到的概率为 .
(3)分层抽样法:按比例 = ,分别在一级品、二级品、三级品、等外品中抽取 48
× =6 个,64× =8 个,32× =4 个,16× =2 个,每个个体被抽到的概率分别为 , ,
, ,即都是 .
综上可知,无论采取哪种抽样,总体的每个个体被抽到的概率都是 .
评述:三种抽样方法的共同点就是每个个体被抽到的概率相同,这样样本的抽取体现了
公平性和客观性.
思考讨论:现有 20 张奖券,已知只有一张能获奖,甲从中任摸一张,中奖的概率为
,刮开一看没中奖.乙再从余下 19 张中任摸一张,中奖概率为 ,这样说甲、乙中奖的
概率不一样,是否正确?
【例 2】解:设η表示 n 次测量中绝对误差不超过 8 cm 的次数,则η~B(n,p).
其中 P=P( |ξ |<8)=Φ( )-Φ( )=Φ()-1+Φ(1)=-
1+=.
由题意,∴P(η≥1)>,n 应满足 P(η≥1)=1-P(η=0)=1-(1-p)n>,
N
n
50
ŷ ŷ
160
20
8
1
8
1
160
20
8
1
8
1
8
1
8
1
8
1
48
6
64
8
32
4
16
2
8
1
8
1
20
1
19
1
10
28
10
28
∴n> = =.
因此,至少要进行 3 次测量,才能使至少有一次误差的绝对值不超过 8 cm 的概率大于 .
达标检测
1.解析:∴ =,∴N=120.
答案:C
2.解析:由正态曲线的图象关于直线 x=μ对称可得答案为 D.
答案:D
3.解析:因总轿车数为 9200 辆,而抽取 46 辆进行检验,抽样比例为 = ,而
三种型号的轿车有显著区别.根据分层抽样分为三层按 比例分别有 6 辆、30 辆、10 辆.
答案:6 30 10
4.解析:根据 3σ原则,在 8+3×=(mm)与 8-3×=(mm)之外时为异常.
答案:C
5.解:∴ξ~N(0,1),∴P(-1<ξ<0)=P(0<ξ<1)=Φ(1)-Φ(0)=-
=.
6.解:设公共汽车门的设计高度为 x cm,由题意,需使 P(ξ≥x)<1%.
∴ξ~N(173,72),∴P(ξ≤x)=Φ( )>.
查表得 >,∴x>,即公共汽车门的高度应设计为 190 cm,可确保 99%
以上的成年男子头部不跟车门顶部碰撞.
)(
)(
1
N
30
9200
46
200
1
200
1
7
173x
7
173x