第四章 假设检验
第一节
第二节
第三节
假设检验的基本概念
正态总体参数的假设检验
非正态总体的假设检验
第四节
第五节
检验的p值
分布拟合检验
【教学目的与要求】
通过本章的教学,使学生理解假设检验的基本思想;熟练掌握关于单个和两个正态总体均值与方差的假设检验。
第四章 假设检验
引 言
制药公司开发研制新的药物时,药物筛选成为需要面临的一个极其重要的决策问题
药物筛选过程中有两种可能的行为
“拒绝”开发的新药,这意味着所检验的药物无效或只有微弱的效果。此时采取的行动就是将该药物废弃
暂时”接受”开发的新药,此时需要采取的行动是对该药物进行进一步的细致试验
根据两种可能出现的研究结果,人们提出了如下相应的假设形式
H0:新药对治疗某种特定疾病无效(或效果微弱)
H1:新药对治疗某种特定疾病有效
假设检验是对总体的未知参数或总体服从的分布等,首先提出
某种假设,例如假设未知参数为某一常数或总体服从某已知分布
等,然后由样本提供的信息,对所做假设的“真实性”做出否定还
是不否定,即拒绝还是接受的判定。
假设检验问题分为如下两大类:
参数假设检验:对总体中某个数字特征或分布中的参数提出假设检验。
非参数假设检验:对总体的分布、总体间的独立性以及是否同分布等方面的检验。
本章主要介绍假设检验的基本概念、思想方法,讨论正态与非正态总体参数的检验、检验的P值、分布拟合检验等。
引 言
第一节 假设检验的基本概念
问题的提出
假设检验的基本步骤
假设检验的两类错误
检验函数与势函数
一
二
三
四
五
假设检验的原理与思想
一、问题的提出
先看如下例子
检验是对假设而言的。假设是对事物的某种“看法”或“陈述”,假设检验是要根据样本值去判断一个 假设是否成立。假设分如下两种:
原假设(或零假设) H0 :通常将不应轻易加以否定的假设做为原假设。
备择假设H1:在原假设被拒绝后可供选择的假设。备择假设H1是和原假设H0不相容的。备择假设比原假设还重要,这要由实际问题来确定,一般把期望出现的结论作为备择假设。
原假设与备择假设选取以便于数学处理为宜。
一、问题的提出
什么是小概率?
在随机抽样的前提下,小概率事件在一次试验中是几乎不可能发生的。
若在一次试验中小概率事件发生了,则我们就有理由怀疑试验的前提。
小概率由研究者事先确定。
概率意义的反证法?
先假设一个命题成立,在该命题之下若能导出小概率事件发生了,则怀疑原命题。
以一定的概率保证度,来推翻或保留命题。
不是一定不发生!
假设检验的基本思想:带有概率特征的反证法。
即逻辑上运用反证法,统计上依据小概率原理。
二、假设检验的原理与思想
三、假设检验的基本步骤
第一步:建立假设
依据实际问题建立一对假设,【例】的假设为
关于未知参数的某个命题(又已知信息得到)
研究者想收集证据予以反对的假设
又称“0假设”
总是有符号 , 或
表示为 H0
研究者想收集证据予以支持的假设
也称“研究假设”或“替换假设”
总是有符号 , 或
表示为 H1
原假设和备择假设是一个完备事件组,而且相互对立
在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立
先确定备择假设,再确定原假设
等号“=”总是放在原假设上
因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)
提出假设(结论与建议)
三、假设检验的基本步骤
用单侧检验还是双侧检验,使用左侧检验还是右侧检验,
决定于备择假设中的不等式形式与方向。
备择假设没有特定的方向性,并含有“”符号的假设检验,称为双侧检验或双尾检验(two-tailed test)
备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailed test)
备择假设的方向为“<”,称为左侧检验
备择假设的方向为“>”,称为右侧检验
三、假设检验的基本步骤
第一步:建立假设
单侧检验(例子)
例如,采用新技术生产后,将会使产品的使用寿命明显延长
到1500小时以上
属于研究中的假设
建立的原假设与备择假设应为
H0: 1500 H1: 1500
例如,改进生产工艺后,会使产品的废品率降低到2%以下
属于研究中的假设
建立的原假设与备择假设应为
H0: 2% H1: < 2%
三、假设检验的基本步骤
第一步:建立假设
提出原假设: H0: 10000
选择备择假设: H1: < 10000
例如,该批产品的平均使用寿命超过10000小时吗?(属于检验声明的有效性,先提出原假设)
单侧检验(例子)
提出原假设: H0: 25
选择备择假设: H1: : 25
例如, 学生中经常上网的人数超过25%吗?(属于研究中的假设,先提出备择假设)
三、假设检验的基本步骤
第一步:建立假设
三、假设检验的基本步骤
第二步:选择检验统计量,给出拒绝域形式
在 与 两者中做出一个选择,也即完成一次判断,必须建立一个检验法则,而由样本对原假设进行判断总是通过一个统计量完成的,该统计量称为检验统计量。
一般而言,检验统计量的选择应该使在 、 分别成立时,统计量的值有较大差异,从而能够做出判断。
根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量
对样本估计量的标准化结果
原假设H0为真
点估计量的抽样分布
检验统计量(test statistic)
标准化的检验统计量
三、假设检验的基本步骤
第二步:选择检验统计量,给出拒绝域形式
第二步:选择检验统计量,给出拒绝域形式
什么是显著性水平?
1. 是一个概率值。当原假设为真时,拒绝原假设的概率。
被称为抽样分布的拒绝域
2. 通常值取, ,
3. 由研究者事先确定
三、假设检验的基本步骤
第三步:选择显著性水平
三、假设检验的基本步骤
第四步:确定临界值,给出拒绝域 W
给定显著性水平,查表得出相应的临界值u或u/2, t或t/2
将检验统计量的值与 水平的临界值进行比较
作出决策
双侧检验:|统计量| > 临界值,拒绝H0
左侧检验:统计量 < -临界值,拒绝H0
右侧检验:统计量 > 临界值,拒绝H0
第五步:根据样本做出判断
三、假设检验的基本步骤
提出
假设
根据统计调查的目的, 提出
原假设H0 和备选假设H1
作出
决策
抽取
样本
检验
假设
对差异进行定量的分析,
确定其性质(是随机误差还
是系统误差。 为给出两者
界限,找一检验统计量T,
在H0成立下其分布已知.)
拒绝还是不
能拒绝H0
显著性
水平
P(T W)=
犯第一类错误的
概率,W为拒绝域
如果H0成立,但统计量的实测值落入否定域,从而作出否定H0的结论,那就犯了“弃真”的错误。
如果H0不成立,但统计量的实测值未落入否定域,从而没有作出否定H0的结论,即接受了错误的H0,那就犯了“取伪”的错误。
四、假设检验中的两类错误
假设检验会不会犯错误呢?
H0: 无罪
正确
错误
有罪
错误
正确
无罪
有罪
无罪
实际情况
裁决
陪审团审判
正确决策
1-
弃真错误
拒绝H0
取伪错误
正确决策
1-
未拒绝H0
H0为假
H0为真
实际情况
决策
H0 检验
假设检验就好像
一场审判过程
统计检验过程
四、假设检验中的两类错误
五、检验函数与势函数
五、检验函数与势函数
五、检验函数与势函数
由此可知,两类错误有如下的关系:
和 的关系就像翘翘板,小 就大, 大 就小
五、检验函数与势函数
五、检验函数与势函数
一、单个正态总体均值的假设检验
1、方差已知时关于均值的u检验
2、方差已知时关于均值的t检验
二、两个正态总体均值差的检验
1、方差已知时均值差的u检验
2、方差未知但相等时均值差的t检验
3、方差未知时均值差的近似检验
三、单个正态总体方差的假设检验
四、两个正态总体方差比的检验
第二节 正态总体参数的假设检验
一、单个正态总体均值的假设检验
设 是来自正态总体 的样本,对均值 考虑如下的检验:
称(1)、(2)为单侧检验,(3)为双侧检验。
主要分三种情况讨论。
一、单个正态总体均值的假设检验
对单侧检验(1)
1、方差已知时关于均值的u检验
一、单个正态总体均值的假设检验
1、方差已知时关于均值的u检验
例 题 分 析
【例1】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,
标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的
饮料中随机抽取了40罐进行检验,测得每罐平均容量为。取显
著性水平= ,检验该天生产的饮料容量是否符合标准要求?
双侧检验
解:
临界值(c):
检验统计量:
决策:不拒绝H0
结论:样本提供的证据还不足以推翻“该天生产的饮料符合标准要求 ”的看法。
一、单个正态总体均值的假设检验
2、方差已知时关于均值的t检验
【例2】一种机床加工的零件尺
寸绝对平均误差为。生产厂
家现采用一种新的机床进行加工以
期进一步降低误差。为检验新机床
加工的零件平均误差与旧机床相比
是否有显著降低,从某天生产的零
件中随机抽取50个进行检验。利用
这些样本数据,检验新机床加工的
零件尺寸的平均误差与旧机床相比
是否有显著降低?(=)
50个零件尺寸的误差数据 (mm)
例 题 分 析
左侧检验
【例2】解:
临界值(c):
检验统计量:
决策:拒绝H0
结论:新机床加工的零件尺寸的平均误差与旧机床相比有显著降低。
【例3】某一小麦品种的平均产量为5200kg/hm2 。一家研究机构
对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量
是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均
产量为5275kg/hm2,标准差为120/hm2 。试检验改良后的新品种产
量是否有显著提高? (=)
右侧检验
解:
临界值(c):
检验统计量:
结论:改良后的新品种产量有显著提高 。
决策:拒绝H0 (P = < = )
例 题 分 析
是否已知
小
样本容量n
大
是否已知
是
u 检验
否
u 检验
是
u 检验
否
t 检验
一、单个正态总体均值的假设检验
二、两个正态总体均值差的检验
设 是来自总体服从 的样本,
是来自总体服从 的样本,且两样本相互独立,考虑如下的三种检验:
主要分两种情况讨论。
二、两个正态总体均值差的检验
1、方差已知时均值差的u检验
二、两个正态总体均值差的检验
2、方差未知但相等时均值差的检验
二、两个正态总体均值差的检验
2、方差未知但相等时均值差的检验
【例】 为比较两种农药残留时间(单位:d)的长短,现分别取12块地施甲种农药,10块地施乙种农药,经一段时间后,分别测得结果为:
例 题 分 析
假设两药的残留时间均服从正态分布且方差相等,试问两种农药的残留时间有无显著差异?(=)
解 此为12 =22= 2但未知时,两个正态总体均值差的t检验。
H0:1= 2; H1: 1≠ 2
所以在显著性水平=下接受H0,认为两种农药的残留时间无显著差异。
例 题 分 析
二、两个正态总体均值差的检验
更多的情况是总体分布未知,要对两个总体的均值差进行检验。要解决这类问题,通常的方法是取两个大样本,由中心极限定理知,当H0:μ1=μ2为真时
当12, 22未知时,分别用s12, s22代替它们,有
这就是说,尽管两个总体的分布未知,但只要是大样本,无论方差知否,均可用u 检验进行均值差的显著性检验。
3、方差未知时均值差的近似检验
由于u=,所以拒绝H0接受H1,即认为作物甲的产量比作物乙的低。
【例】 甲乙两种作物分别在两地种植,设管理条件相同,收获时得以下结果:
甲:n1=400, 1hm2平均产量
乙:n2=550, 1hm2平均产量
问甲的产量是否比乙的低?(=)
解 这是两个总体分布及其方差均未知,对总体均值差的检验,由于是大样本,故为u 检验。H0: μ1=μ2; H1:μ1<μ2
例 题 分 析
三、单个正态总体方差的假设检验
设总体 来自该总体的样本,对方差 考虑如下的三种检验:
主要分两种情况讨论。
三、单个正态总体方差的假设检验
1、 未知时方差 的 检验
三、单个正态总体方差的假设检验
2、 已知时方差 的 检验
三、单个正态总体方差的假设检验
2、 已知时方差 的 检验
【例6】 已知某种棉花的纤度服从N(, ) ,2003年从中任取8个样品,测得纤度为, , , , , , , .问2003年棉花纤度的方差与已知纤度的方差是否相同?(=)
解 这是未知情况下,对总体方差的双侧检验.
H0: 2 =02 (=)
由于n = 8,02 = ,且由样本观察值计算得
=, S2 = =
对=,查 2 分布表得
所以接受H0,认为2003年棉花纤度的方差与无显著不同。
例 题 分 析
四、两个正态总体方差比的检验
设 是来自总体服从 的样本,
是来自总体服从 的样本,且两样本相互独立,考虑如下的三种检验:
四、两个正态总体方差比的检验
四、两个正态总体方差比的检验
解 此题是两正态总体方差未知,亦不知是否齐性的情况下对两总体均值差的检验。须先作方差齐性检验,再用 t 检验 。
(1)假设H0: 12 =22,H1: 12 ≠ 22
所以接受H0,即认为方差是齐性的。
若含氮量都服从正态分布,问其含氮量是否相同?(=)
【例】 甲乙两种氮肥,其含氮量的抽样数据分别为:
例 题 分 析
已得到方差齐性的结论,已经满足t 检验的条件。进而检验
H0: μ1=μ2
统计量的值
所以接受H0,认为两种氮肥的含氮量基本相同(无显著差异)。
例 题 分 析
第三节 非正态总体参数的假设检验
一、大样本下参数的假设检验
1、大样本下样本均值的渐近分布
2、大样本下样本均值的假设检验
二、 0-1总体参数的假设检验
1、单个总体参数(比率)的检验
2、两个总体参数(比率)的比较检验
若总体X的分布未知,均值和方差2存在,(x1, x2, …, xn)是来自总体X的一个大样本(n≥50),由独立同分布的中心极限定理,对任意实数x,都有
当2已知,且H0 : = 0为真时
一、大样本下参数的假设检验
【例】某果园,苹果树剪枝前平均每株产苹果52kg,剪枝后任取50株单独采收,经核算平均株产量为54kg,标准差s=8kg,试问剪枝是否提高了株产量?
解 此为总体分布未知且方差亦未知的大样本下,对μ的假设检验问题。
H0: μ=52;H1: μ>52
查表得=, =. 故当
=时拒绝H0接受H1;=时接受H0。
例 题 分 析
在产品检验,森林树木病害率调查以及药效对比等试验中,常用到总体比率的检验,本节就大样本的情况下,讨论总体比率差异性的检验。
设p为总体X的比率, 是来自总体X的样本,
是样本均值,p0(0<p0<1)为已知常数,要检验的假设为
H0:p=p0
由中心极限定理,当H0为真时
于是检验过程完全同于u检验,不再赘述。
二、 0-1总体参数的假设检验
1、单个总体参数(比率)的检验
【例】 某种子站有一批种子,按规定发芽率不低于95%才可出售,今从中任取500粒作发芽试验,有480粒出芽,问这批种子可否出售?(α=)
解 设这批种子(总体)的发芽率为p,则要检验的假设为
H0:p=; H1:p<。
故接受H0,认为该批种子的发芽率不低于95%,可以出售。
例 题 分 析
在分析对比试验结果时,常用到两个总体频率差异性的检验,设p1和p2分别是独立总体X和Y的频率, 分别X和Y的样本均值,n1和n2分别是X和Y的样本容量。检验假设为
二、 0-1总体参数的假设检验
2、两个总体参数(比率)的比较检验
二、 0-1总体参数的假设检验
2、两个总体参数(比率)的比较检验
什么是 P 值:拒绝原假设的最小显著性水平
第四节 检验的P 值
P值告诉我们:如果原假设是正确的话,我们得
到目前这个样本数据的可能性有多大,如果这个可能
性很小,就应该拒绝原假设;
P值被称为观察到的(或实测的)显著性水平;
决策规则:
1. 单侧检验
若p值 ,保留 H0
若p值 < , 拒绝 H0
2. 双侧检验
若p值 /2, 保留 H0
若p值 < /2, 拒绝 H0
一、P值的概念
双侧检验的P 值
第四节 检验的P 值
二、基于p值的假设检验
左侧检验的P 值
第四节 检验的P 值
二、基于p值的假设检验
右侧检验的
P 值
第四节 检验的P 值
二、基于p值的假设检验
原假设的可信度有多高?如果H0所代表的假设是人们多年来一直相信的,就需要很强的证据(小的P值)才能说服他们
拒绝的结论是什么?如果拒绝H0而肯定H1 ,就需要有很强的证据显示要支持H1。比如,H1代表要花很多钱把产品包装改换成另一种包装,你就要有很强的证据显示新包装一定会增加销售量(因为拒绝H0要花很高的成本)
显著性检验的目的是要描述样本所提供不利于原假设的证据有多强。P值就在做这件事。但是,要证明原假设不正确,P值要多小,才能令人信服呢?这要根据两种情况来确定
第四节 检验的P 值
有了P值,我们并不需要用5%或1%这类传统的显著性水平。P值提供了更多的信息,它让我们可以选择任意水平来评估结果是否具有统计上的显著性,从而可根据我们的需要来决定是否要拒绝原假设
只要你认为这么大的P值就算是显著了,你就可以在这样的P值水平上拒绝原假设
传统的显著性水平,如1%、5%、10%等等,已经被人们普遍接受为“拒绝原假设足够证据”的标准,我们大概可以说:10%代表有“一些证据”不利于原假设;5%代表有“适度证据”不利于原假设;1%代表有“很强证据”不利于原假设
固定显著性水平是否有意义?
第四节 检验的P 值
1、用P值进行检验比根据统计量检验提供更多的信息
2、统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少
比如,根据统计量进行检验时,只要统计量的值落在拒绝域,我们拒绝原假设得出的结论都是一样的,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际的显著性是不同的。比如,统计量落在临界值附近与落在远离临界值的地方,实际的显著性就有较大差异。而P值给出的是实际算出的显著水平,它告诉我们实际的显著性水平是多少
P 值决策与统计量的比较
第四节 检验的P 值
1、与其人为地把显著性水平固定按某一水
平上,不如干脆选取检验统计量的P值;
2、与其大致知道犯第Ⅰ错误的概率,不如干
脆知道一个确切的犯第Ⅰ类错误的概率(P值);
3、与其为选取“适当的”的而苦恼,不如
干脆把真正的 (P值)算出来。
P 值决策与统计量的比较(结论)
第四节 检验的P 值
一、非参数检验方法简介
非参数统计是一种不要求变量值为某种特定分布和不
依赖某种特定理论的统计方法,或者是在不了解总体分布
及其全部参数的情况下的统计方法。非参数统计方法开始
于20世纪中期,早期的符号检验可以追溯到18世纪。实际工
作中,有许多资料常不能确定或假设其总体变量值的分布,
因此参数统计不宜使用,不知道总分布,就不能比较参数,
而只能比较非参数。所谓非参数,即指数据的正负符号,大
小顺序号,综合判断所划分的名次、严重程度、优劣等级
等,利用直接说明或比较两个或几个样本的非参数的方法均
属于非参数统计法。
第五节 分布拟合检验
参数检验:指总体分布服从正态分布或总体 分布已知条 件下的统计检验。
非参数检验:指总体分布不要求服从正态分布或总体分布情况不明时,用来检验数据资料是否来自同一个总体的统计检验方法。
一、非参数检验方法简介
第五节 分布拟合检验
通常非参数统计方法适用于以下几种情况:
未知分布型,或样本数太少(n6)而使得分布状况尚未显示出来
非参数性,只能以严重程度、优劣等级、效果大小、名次先后以及综合判断等方式记录其符号或等级
分布程度偏态
组内个别随机变量偏离过大。
一、非参数检验方法简介
第五节 分布拟合检验
(1)对总体分布函数F(x)的假设检验
(2)对随机变量的独立性、相关性的假设检验
H0: F(x)= F0(x), H1: F(x)≠ F0(x)
【例如】 1、考察某一产品的质量指标打算用正态分布模型
2、考察一种元件的寿命打算用指数分布模型
3、一个骰子是否是均匀的?
假设 H0:X~N(, 2)
假设 H0 :X服从参数为的指数分布
假设 H0 :这个骰子是均匀的
这里主要介绍拟合优度检验(卡方检验法)和正态性检验。
一、非参数检验方法简介
第五节 分布拟合检验
设 X为未知总体,(x1,x2,…,xn)为大样本(n≥50),欲检验
H0: F(x)= F0(x), H1: F(x)≠ F0(x)
把实数轴(-∞,+∞)分成k个互不相交的区间:
(-∞, a1], (a1, a2], …, (ak-2, ak-1], (ak-1, +)
记a0=-∞, ak=+, Ii=(ak-2, ak-1] (i=1,2,…,k-1) , Ik=(ak-1, +),
ni为样本观测值(X的取值)落在第i个小区间Ii 的个数,
pi 为X取值落入第i个小区间Ii的概率,0<pi<1, i=1,2, …,k,
则 pi= P{ ai-1<X< ai } = F0(ai)—F0(ai-1),i=1,2,…,k.
二、 拟合优度检验
第五节 分布拟合检验
构造统计量:
K. Pearson和联合证明了:
定理 不论F0(x)是何分布函数,只要n充分大(n≥50),当假设H0成立时,上述2统计量都近似地服从自由度为k-r-1的2 分布。其中r是F0(x)中未知参数的个数。
称ni为实测频数,vi=npi为理论频数。称这类检验为拟合优度检验。
对于给定的,查2分布表得临界值2(k-r-1),使
二、 拟合优度检验
第五节 分布拟合检验
由样本值计算出2 统计量的值,当
2 ﹥2(k-r-1) 时拒绝H0
2 ≤2(k-r-1) 时接受H0
可见,皮尔逊定理(准则)适用于实测频数与理论频数相比较的问题。
二、 拟合优度检验
第五节 分布拟合检验
几点注释
①若分布函数F0(x)的类型未知,可由实际问题分析或由样本观察数据的直方图来推测。
②若已知F0(x) 分布类型,还有r个参数未知时,须先用极大似然估计法求出未知参数的估计值,然后再作假设。
③此检验要求一定是大样本,一般n≥50。至于k的大小,对于正态总体,样本容量n与区间个数k要满足渐近最优关系
k=(n-1)
74
56
30
22
16
12
9
k
10000
2000
1000
500
200
100
50
N
二、 拟合优度检验
第五节 分布拟合检验
④ 若理论频数vi=npi<5时,则将相临的小区间合并,直至全部npi ≥5(合并区间的同时,也将实测频数合并),合并后的小区间数设为k*,则此时2统计量的由度变为
df = k*-r-1
⑤手工计算时常采用公式
二、 拟合优度检验
第五节 分布拟合检验
例1 设从总体X中抽取120个样本观察值,经计算整理得下表,试检验X服从正态分布。(=)
120
∑
6
(219,+∞)
9
8
(216,219]
8
14
(213,216]
7
22
(210,213]
6
23
(207,210]
5
20
(204,207]
4
14
(201,204]
3
7
(198,201]
2
6
(-∞,198]
1
ni
小区间
组号
例 题 分 析
解 这里只给出了分布类型,有两个待估参数与2。 用极大似然法对与2作出估计,得到
故提出假设
H0: X 服从N( 209 , )
H1: X不服从 N(209, )
=()-()=.
类似地算得:
p3=, p4=, p5=,
p6=, p7=, p8=, p9=.
例 题 分 析
由 n =120,算得统计量的值
由于
所以接受H0,认为X 服从N(209 ,).
=, k=9, r=2. 查表得临界值
例 题 分 析
【例2】 对200个电池做寿命试验,(ti-1,ti)表示以小时计的时间区间(i=1,2,…,6),在=下,试检验电池寿命X服从指数分布。
200
∑
1
(25, 30)
6
2
(20, 25)
5
4
(15, 20)
4
15
(10, 15)
3
45
(5, 10)
2
133
(0, 5)
1
ni
(ti-1, ti)
组序
解 首先,用样本观察值对未知参数作极大似然估计。以xi表示区间(ti-1, ti)的中点(也称为组中值),则
例 题 分 析
故提出假设 H0:X服从 =的指数分布。当H0为真时,有
类似地算出:
p3 =, p4 =, p5 =, p6 =.
各vi=npi分别为:
, , , , , .
由于v5和v6都小于5,且合并后仍小于5,故与v4合并.
例 题 分 析
由= 得
由于2﹤2(k-r-1),故接受H0,即认为X服从参数= 的指数分布。
200
200
-
7
4
-
15
3
-
45
2
133
1
(ni-npi)2/npi
ni-npi
vi=npi
ni
组序
例 题 分 析
【例3】 从同类产品中,任取n = 200 批,质检结果如下表,其中xi表示各批产品中次品数,ni表示有xi件次品的批数,试在显著性水平 =下,检验次品件数X 服从泊松分布。
200
2
4
22
56
116
ni
4
3
2
1
0
xi
5
4
3
2
1
序号
解 先用极大似然估计法求估计值
于是认为F0(x)是参数为=的泊松分布的分布函数,分布律为
检验假设为H0: X服从=的泊松分布
例 题 分 析
当 H0成立时,算得
2 =,
由于2< 2(k―r―1),所以接受H0,即认为X服从=的泊松分布。
类似地算出
p3=, p4=, p5=.
再算出理论频数npi分别为
,,,,.
例 题 分 析
统计量
实质是
适合性检验是用样本提供的信息去推断总体分布是否适合某种已知的规律。
适合性检验
二、 拟合优度检验
【例4】 某地区1993年新生婴儿1284个,其中男婴692个,试问婴儿的性别比是否正常?( =)
解 检验假设为 H0:男:女=1:1 , H1:男:女≠1:1
当H0为真时,有
对于=,查表得临界值
由于
所以拒绝H0,即认为该地区1993年新生婴儿性别的比例失调。
例 题 分 析
【例5】 按孟德尔遗传学说,将两种豌豆杂交后,可产出数量之比为 9:3:3:1 的 A、B、C、D 四种不同的种子。今在一试验中共收了189粒种子,A、B、C、D各类型的分别为102粒、30粒、42粒和5粒。问在 =下,该结果是否符合孟德尔遗传学说的结果?
解 检验假设为
H0:A:B:C:D=9:3:3:1,即试验结果适合孟德尔学说
实测频数为102,30,42和15,且当H0成立时理论频数为
同样可计算出B、C、D型种子的理论频数依次为
vB=,vC=,vD=.
例 题 分 析
由=得临界值
由于
于是有
故接受H0,即认为试验结果与孟德尔学说的结果相符合。
例 题 分 析
独立性检验是对两个总体,或两组资料,或一总体的两种指标(分类、特性、特征)等之间的独立性所进行的检验。因此,若设X和Y是两个总体(或一个总体的两个指标),则其假设应为:
H0:两总体X与Y相互独立
将X和Y的可能的取值范围分成互不相交的r个组和s个组:A1, A2, …, Ar和B1, B2, …, Bs. 在总体(X, Y)中随机抽取样本
(x1, y1), (x2, y2), …, (xn, yn).
记Ai与Bj的每一个搭配(Ai, Bj)所包括的样本个数为cij(i=1,2,…, r; j=1,2,…,s), cij即为实测频数且
列联表的独立性检验
二、 拟合优度检验
由cij构成r×s列联表。(X, Y)落入(Ai, Bj)概率的估计值为
当H0成立时,则有
于是理论频数的估计值为
根据皮尔逊准则,对于给定的 ,查表得临界值
列联表的独立性检验
用于判断总体分布是否为正态分布的检验称为正态性检验。正态检验的方法很多,Wilk-Shapiro的W检验和Epps-Pulley的EP检验是最好的,它们犯第二类错误的概率最小。
(1)小样本( )场合的W检验
三、正态性检验
第五节 分布拟合检验
三、正态性检验
(2)大样本( )场合的EP检验
三、正态性检验
As a result of this class, you will be able to ...
Rejection region does NOT include critical value.
Rejection region does NOT include critical value.