第九章 假设检验
生活中的统计 检验的例子生活中可谓无处不在、无时不有:买
件日常用品要检验它的长度、重量;产品出厂要检验它的性能、
质量;升学要检验学习成绩的优劣、功底的深厚……等等。与参
数估计不同的是,对检验的对象我们并不是事先一无所知,而是
已经得到过一些“宣称”,我们的工作是对此“宣称”进行核实,
这便是“检验”的由来。检验过程开始后,首先需要抽取一定大
小的样本,算出对应统计量大小然后加以判断,但众所周知,样
本并非总体的严格反映,不少情况下会发生总体“合格”而样本
“不合格”或者总体“不合格”而样本“合格”的矛盾现象,如
何从往往只能一次试验中进行判断,这便是“假设检验”的任务
重点:假设检验的基本思路、工作原理、方法特点;
难点:检验时所用的繁杂公式以及公式之间的细微差别
零假设和择假设
对研究性假设的检验
对陈述正确性的检验
对决策情况下的检验
零假设和备择假设类型
设 表示在零假设和备择假设中考虑的某一特定数值。一般来说,对
总体均值的假设检验采取下面的三种形式之一:
第一类和第二类错误
第一类和第二类错误 拒绝正确的原假设,简称“拒真”;
第一类和第二类错误 接受错误的原假设,简称“纳伪”
如下所示:
总体
H0 正确 H0 错误
接受 H0 正确结论 第二类错误
结论 拒绝 H0 第一类错误 正确结论
我们把两类错误发生的概率表示如下:
α——第一错误发生的概率;
β——第二错误发生的概率;
大样本情况下总体均值的单侧检验
单个总体均值的单侧检验
p-值的运用
假设检验的步骤
总结:单个总体均值的单尾检验
大样本情形(n ≥30) 时单个总体均值的如下形式的单尾检验
T-统计量:σ 已知
T-统计量: σ由 s估计出
拒绝法则: 使用T-统计量检验法:拒绝 H0 如果 z<-zα
使用p值检验法:拒绝 H0 如果 p值<α
大样本情形(n ≥30) 时单个总体均值的如下形式的单尾检验
T-统计量:σ 已知
T-统计量: σ由 s估计出
拒绝法则: 使用T-统计量检验法:拒绝 H0 如果 z>-zα
使用p值检验法:拒绝 H0 如果 p值<α
假设检验步骤
1. 建立零假设和备择假设.
2. 选定显著性水平 α.
3. 选定用于检验的检验统计量.
使用统计量检验法
4. 使用显著性水平来决定拒绝原假设的临界值并叙述H0 检
验法则
5. 收集样本数据并计算统计量值.
6. 使用统计量的计算值并根据检验法则做出接受还是拒绝原
假设H0的决定.
使用p值检验法
4.收集样本数据并计算统计量值.
5. 运用统计量的计算结果计算p值
6. 拒绝原假设 H0 如果 p值 <α.
例题:联邦贸易委员会定期惊醒调查,目的是检验生产商们对自己产品
的陈述。例如,大听的Hilltop咖啡的标签标明:听内至少装有3磅的咖
啡,我们用假设检验来检验标签的陈述是否正确。
第一步,建立零假设和备择假设:
第二步,随机抽取36听咖啡作为样本
假设36听咖啡样本的均值为 磅,总体标准差为
,用 ,检验统计量的值为:
第三步,确定拒绝域:
如果,
则拒绝 H0
第四步,作出判断:
在的显著性水平下, 负责人员就有统计证据来采取行动,处理该
公司的产品不足的问题
当然,如果在第二步计算出的均值发生改变,则结论应该随之也改变。比如:
则此时统计量的值不再拒绝域内,我们不能拒绝原假设。
大样本情形(n ≥30) 时单个总体均值的双侧检验
双侧假设检验于单侧假设检验不同,因为前者的拒绝与分布在抽样
分布的两侧。
用于双尾检验的p值
总结:单个总体均值的双尾检验大样本情形(n ≥30) 时单个总体均值
的如下形式的双尾检验
T-统计量:σ 已知
T-统计量: σ由 s估计出
拒绝法则: 使用T-统计量检验法:拒绝 H0 如果 z<-z或 z>zα
使用p值检验法:拒绝 H0 如果 p值<α
区间估计和假设检验间的关系
小样本情形(n <30) 时单个总体均值的双尾检验
样本容量较小时(n<30),用样本标准差s来估计总体标准差。入股总
体具有整台概率分布也是合理的,那么就可以用t分布来推断总体的
均值。在这种情况下,检验统计量是:
p值和T统计量
双尾检验
单个总体比例的检验
有如下三种形式
总体比例检验统计量为:
我们用 Pine Creek高尔夫球课程问题来说明总体比例的假设检验。
在过去的几个月里,在打高尔夫球的人中有20%是妇女,为了提
高女性高尔夫球的比例, Pine Creek采取了一项特殊的激励措施
来吸引女性高尔夫球手。一周以后,随机抽取了400名高尔夫球
手作为样本,结果有300名男性和100名女性,课程经理想知道这
些数据是否支持他们的结论: Pine Creek的女性高尔夫球手已有
所增加?
第一步,建立零假设和备择假设:
建立相应的统计量
先假设H0为真,即包括p=, 用样本比例来估计总体比
例的标准差由下式给出:
有了假定值p=,又已知样本容量n=400,则 的标准
差为:
由前面的理论我们知道,如果np和n(1-p)的值都大于或等于5
,那么的抽样分布就可以近似看成为正态概率分布。对于Pine
Creek的问题。使用以下统计量
我们假定检验的显著性水平为α=,查表可知
,所以检验的拒绝域拒绝规则如下:
如果 z>,则拒绝零假设H0
由于Pine Creek在激励措施期间,400个球手中有00个女球手,
所以得 ,又知道 ,所以检验
统计量的值为:
可见我们应当拒绝零假设。
一些重要的随机变量及其统计量的概率密度函数
如果 x1,x2,…,xn~N(0,1), 则有:
χ2 ~χ2(n)
如果 x ~N(0,1), y~χ2(n),则有
t ~t(n)
如果 x ~ χ2(m), y~χ2(n),则有
F ~F(m,n)
随机变量特征值的一些重要规律
(1) E(x+y)=E(x)+E(y) (2)E(ax)=aE(x)
如果 x,y 是 的,则有
(3) E(xy)=E(x)*E(y)
(4) D(x+y)=D(x)+D(y)
(5) D(ax)=a2 *D(x)
第十章 均值的比较
生活中的统计:经常需要对两个班级同一学科考试平均成绩进行比
较而不计较成绩的绝对高低;又如:对男女两组人群进行肺活量大
小的比较以鉴别二者是否存在显著差异但也不计较每组人群肺活量
的绝对高低等等问题都属于均值的比较问题
难点:有关公式的理解,特别是两总体联合方差的表达形式
重点:均值比较的区间估计法
两个总体均值差异的估计:独立样本
的抽样分布
μ1-μ2的点估计 :
两总体均值之差的抽样分布的形式:如果两个总体的样本大小都
足够大,可以以正态分布来近似
μ1-μ2的区间估计:大样本情形且σ1,σ2 的值已知
的点估计
μ1-μ2的区间估计:大样本情形且σ1,σ2 的值由s1, s2 估计
μ1-μ2的区间估计:小样本情形
σ2 的合并估计
当 时
的点估计为
则估计出的区间为:
式中,t的值基于自由度为 的分布,为置信度
μ1-μ2的区间估计:小样本情形且σ1,σ2 的值已知
的点估计
μ1-μ2的区间估计:大样本情形且σ1,σ2 的值由s1, s2 估计
假设:
(1)两个总体都具有正态分布;
(2)两总体方差相等.
σ2 的合并估计
当 时
的点估计为
则估计出的区间为:
例题:以克里夫兰国家银行所进行的一个样本研究问题为例,对
该银行的两个支行顾客的独立随机样本的帐户余额进行核查,
得如下结果:
支行 样的帐户序号 样本平均余额 样本标准差
Cherry Grove n1=12 美元 美元
Beech Mont n2=10 美元 美元
用这些数据我们来建立两个支行帐户余额样本均值差异的置信度为90%
的置信区间。假定两个支行检查帐户余额服从正态分布,且两个支行检查
帐户余额的方差相等。用式()可以看到方差合并成:
s2=[(n1-1)s12+(n2-1)s22]/( n1+n2-2)
=18855
则有:标准差的对应估计值为
适合该区间估计过程的t分布的自由度为12+10-2=20,当α=时,查t分
布表可得 。因此,根据前面的式子,我们看到区间估
计变成:
第十一章 比例的比较
生活中的统计 生活中比例问题的比较例子也不少:两个班一场考试
之后的及格率需要比较;两批同样生产线不同操作流程或不同生产
者生产出来的产品出厂前的合格率需要比较;饲养同样品种但方法
有所不同的动物的死亡率或生存率也需要比较。从某种意义上说,
比例的比较问题就是均值的比较问题,后者是前者的特例,但侧重
点又有所不同,值得单独加以研究。
两个总体比例之差的推断
的抽样分布
的抽样分布为
期望值:
标准差
—— 来自总体的简单随机样本的样本容量
—— 来自总体的简单随机样本的样本容量
的区间估计
的点估计量为
两个总体比例之差 的区间估计:大样本情况下,
并且 、 、 及 时
式中,1-α为置信系数
关于 的假设检验
合适的零假设和备择假设是:
大样本情况下,抽样分布可近似为正态分布,两个总体比例之差的
假设检验统计量为:
拒绝规则是:如果 或者 ,则拒绝
实践中不知道 、 的值,所以需要估计, , 一
般使用合并估计量法,又在零假设这种特殊情况下总体比例不存在差
异,即 所以我们可以不使用
而先由下式给出 的估计
再用 代替 、 ,式(11-4)就可以改写成如下形式
多项总体比例的假设检验
拟合优度的检验统计量
式中 fi ——第i类的观察频数
ei ——假设为真时,第i类的期望频数
多项分布拟合优度检验小结:
(1)建立零假设和备择假设。
H0 总体服从类中每类都指定了概率的多项概率分布;
H1总体服从类中每类都指定了概率的多项概率分布。
(2)抽取一个随机样本,记录各类的观察频数fi
(3)假设零假设为真,将每类的概率乘以样本容量计
算期望频数ei
(4)计算检验统计量的值
(5)拒绝规则
如果, 则拒绝 H0
式中,α是检验的显著性水平,自由度为(k-1)
独立性检验:
列联表假设独立性为真时,列联表的期望频数
eij=(第行的总数×第列的总数)/(样本容量)
独立性的检验统计量
式中 fij ——列联表中第行和第列这一类的观察频数;
eij —— 基于假设独立性为真时,列联表中第列这一类的观察
频数。
独立性检验小结
(1)建立零假设和备择假设。
列变量和行变量相互独立
列变量和行变量不相互独立
(2)抽取一个随机样本,记录列联表中各方格的观察频数
(3)利用式(11-10)计算每个方格的期望频数。
(4)利用式(11-11)计算 检验统计量的值
(5)拒绝规则
如果, 则拒绝 H0
式中,α是检验的显著性水平,对于n列m行的列联表,自由度为(n
-1)(m-1)