假设检验
第三章
上一章介绍的点估计理论,是利用已知的样本构造适当的统计量对总体的未知参数进行估计。
在实际应用中,有另一类问题是要求对总体参数的特性,总体分布的类型等提出一个命题,然后根据样本对该命题的真假性作出判断。
如自动包装机的工作是否正常;
如有关早稻的平均亩产量的某一命题是否为真;
如判断某种产品的次品率是否符合要求;
再如人造纤维的长短是否服从正态分布等等。
若合理则承认假设的正确性,
利用样本提供的信息,构造适当的“统计量”,然后再根据样本值对所作的假设判断其是否合理。
这种处理问题的方法,称为“假设检验”。
用数理统计的方法判断假设是否合理,称为检验。
下面介绍第三章假设检验。
这类问题处理的方法和估计理论不同,乃是先把一些结论即总体分布形式或参数具有某种特性的命题当作某种假设,
否则便否定原先的假设。
例
分布,按规定袋装糖果的重量的均值应为(千克)。
9袋,重量分别为:,,,,,,,, 。问这一批袋装糖果是否合格?(显著水平为 )
生产流水线上的袋装糖果的重量服从正态
一批袋装糖果出厂前进行抽样检查,抽查了
总体 分布,参数未知。
问题是:
要根据抽得的样本值对命题:该批袋装糖果合格,
,记作
即
对 作出“是”或“否”的判断。
计假设,具体的判断规则称为该假设的一个检验。
就称为一个统
即要检验假设 :次品率 是否成立。
例
某厂有一大批产品,按规定次品率不得超过3%才能出厂。今从中随机地抽取50件,发现有4件
次品。问这批产品能否出厂?
整批产品的次品率是否超过了3%。
关心的问题是:
,来推断
如何根据样品的次品频率
例
粒子的个数。
计数器上记录的某种铀放射出的 粒子的个数
在一实验中,每隔一定时间间隔观察一次
独立观察100次的数据如下:
其中
是观察到有 个
试问 是否服从泊松分布。
该例题要检验的假设
是总体 服从“泊松
分布”是否成立?
第一节 假设检验
一、假设检验的基本思想方法
⒈“实际统计推断原理”(小概率原理)——即认为概率很小的事件在一次实验中几乎(一般)是不会发生的。
⒉具有概率性质的反证法
可推出
由大数定律
这是在长期大量实践中总结出来的原理,是人们在实践中广泛采用的着一个原理。
用了反证法的思想
不同于确定性数字中的反证法
解:先假设,记
例如:设有一大批产品,要检验这批产品的次品率
是否是?从这批产品中随机的取出五件产品检查有4件次品,1件正品,依此样本如何判断 是否是。
在 为真的条件下计算
看出 很小,但在一次试验中 就发生了,这与“小概率原理”矛盾。
P(五件产品中有4件次品1件正品)
在 为真的条件下上述计算是正确的,这矛盾产生就认为是由 而造成的,故否定 ,认为
由讨论看出:
带有概率性质的反证法是以“小概率原理”为基础的
由样本计算使小概率事件 发生了,与“小概率原理”矛盾,这说明假设 是不正确的,就拒绝 。这就是假设检验的基本思想。
二、假设检验
某餐厅每天的营业额服从正态分布,按照
以往的老菜单营业,营业额的均值为8000元,标准差为640元。目前,该餐厅试用一种新菜单。经过九天的运营,发现平均每天的营业额为8400元,经理想知道这个差别是否是由于新菜单而引起的。
例
假设按照新菜单营业,营业额 。
(假定按照新菜单营业,营业额的标准差依然为
640元。)
为九天的营业额,即是来自总体 的样本。
下面先通过一个例子来说明什么是假设检验以及如何进行假设检验。
㈠建立假设——即提出一个关于总体分布的命题
如:按照新老菜单运营,平均营业额没有差别——记该命题为
即
为原假设或零假设。
称
一般我们把需要检验的假设称为原假设。常把没有充分理由不能轻易否定的命题作为 。只有理由充足时才拒绝它,否则,应予保留。
即
⑶按照新菜单运营的平均营业额比按照老菜单运营的平均营业额低。
我们从中选择一个命题作为拒绝 后可供选择的命题,记为
⑴按照新老菜单运营,平均营业额有显著差别。
⑵按照新菜单运营的平均营业额比按照老菜单运营的平均营业额高。
当我们能确认 为假时,这时我们面临如下三个命题的选择:
它可以是原假设对立面的全体,或其中的一部分,一般常把没有把握不能轻易肯定的命题作为 。我们采用 与 对立面的设法。
称 为备择假设:它是在拒绝原假设后,可供选择的一个命题,称为备择假设,
㈡寻找检验统计量
——假设检验的任务是判断 是否为真。
我们的做法是:先假定 为真,然后用样本去判断其真伪。由于样本 所含信息较分散,因此要构造一个统计量 来做判断,称其为检验统计量。
为了判断 的真伪,即要在 和 之间作一抉择,就需要有个行动规则,对任意一组样本值
要找的规则必须能告诉我们是接受 还是否定 ,这样的规则称为检验规(法)则。
要检验 是否为真,关键是要找个小概率事件,
使 是小正数。
令 ,称其为检验的接受域。
它的边界点称为检验的临界点。
检验法则:
当 时拒绝 ,否则接受 。
令 ,称其为检验的拒绝域,
当假定 为真时,即 时, 的 观测值 应该围绕在 附近。
如果 远离 那么就有理由怀疑 不真。
这里 是未知的,理应找 的无偏估计作参考,与 进行比较。
要检验的问题是:
例
我们知道样本均值 是 的无偏估计。
现今样本均值 离 算近还是算远?
或者差别多远,才能拒绝 ?这就需要一个界限,记为
当 时,接受 H0 ;
这里 c 是检验的临界值,
拒绝域为
在本例中,当假定H0 为真时,即 H0: = 8000 时, 的观测值 应该围绕在8000附近。如果 远离8000,那么就有理由怀疑H0不真。如今8400离8000算近还是算远?或者, 离8000差别多远,才能拒绝H0 ?这就需要一个界限,记为c:
接受域为
当 时,拒绝 H0 ;
在假设检验中,人们总是关心拒绝域,这是因为我们现在手中只有一个样本值,用一个样本值去证明一个命题是正确的,这在逻辑上是不充分的;
但若用一个反例(如样本)去推翻一个命题,理由是充分的。这就是我们前面所讲的“概率性质 的反证法”。
当不能否定原假设 时,只能将原假设 当作为真保留下来。
此时保留的含义有两点:一是 可能为真,二是保留进一步检验的权利。
㈢显著水平与临界值
由于是依据一个样本对H0真假与否作出判断的,当实际 H0为真时仍有可能作出拒绝H0的判断,这是一种错误。我们无法排除犯这类错误的可能性,因此自然希望将犯这类错误的概率控制在一定的限度内,即给出一个较小的数(0< <1),使
P(拒绝H0| H0为真 ) 称为检验的显著水平
根据上式确定检验的临界点
在本例中, 要使
P(拒绝H0| H0为真 )=
我们看其中的含义:这里 “H0: =0=8000”为真,即指样本 X1,…,X9 实际来自总体 N(8000, 6402),
根据检验法则:
P(拒绝H0| H0为真)
本例检验法则:当 | 8000 | c 时,拒绝 H0
此时
由此可知
根据标准正态分布双侧 分位数的概念有:
若给定 ,则在 为真时,事件
是小概率事件。
一般在一次试验中,小概率事件难以发生。
若小概率事件在一次试验中发生了,这就与“小概率原理矛盾”。
这一矛盾导致人们不相信 为真,从而否定
于是本例的检验法则为:
当 时,拒绝 。
当 时,接受 。
我们把使原假设 被拒绝的样本观测值所组成的区域称为检验的拒绝域(也称为 的拒绝域)
H0
本例 拒绝域为:
简记为 ,
边界点 称为检验的临界点。
我们把保留原假设 的样本观测值所组成的区域称为检验的接受域。
如本例记为
计算
例
若给定显著水平
判断
样本值计算 ,即样本值落在
拒绝域内。也就是小概率事件发生了,我们就拒绝
有显著差异。
。认为新菜单营业额 与原菜单营业额
查表得:
假设检验中的基本概念
⑴假设:关于总体分布的某个命题
⑵原假设:把需要检验的假设称为原假设,记为H0
⑶备择假设:在拒绝原假设后,可供选择的 一个命题称为备择假设,它可以是原假设对立面的全体,或其中的一部分,记为H1
小结:
⑷检验统计量:用于判断原假设成立与否的统计量称为检验统计量。
⑸拒绝域:使原假设H0 被拒绝的样本观测值所组成的区域称为检验的拒绝域
接受域:保留原假设H0的样本观测值所组成的区域称为检验的接受域
⑹显著水平:控制P(拒绝H0| H0为真 ) 中的 称为检验的显著水平
假设检验的一般步骤
我们要求 与 有且仅有一个为真。
(1)根据问题提出假设,原假设 ,备择假设 。
(2)写出检验统计量。根据 的内容选取适当
的统计量,且能确定其分布。
(3)写出拒绝域 。按问题的具体要求,由给
定的显著水平 ,根据统计量的分布和 的形式确定对应于 的临界值,从而得到对原假设 的拒绝域。
(4)由样本值算出检验统计量的值,看其是否在拒绝域中。
(5)做出判断,是否接受原假设。
若样本值落入拒绝域 内,则认为 不真,拒绝 ,接受备择假设 。否则,接受 。
注意:
1. 由于样本有随机性,所以判断结果也会有不同。
如:例,如果我们又重新抽取九天的一个样
本值,计算得 ,
这样
给定
样本值没有落入拒绝域
承认 ,
认为
2. 检验结果与显著性水平有关。
如:例,样本值仍是
若给定
讨论说明检验判断结果会犯错误。
3. 产生错误与“小概率原理”有关
样本值未落入拒绝域,故
∵
承认 ,
认为
三、两类错误
第一类错误:原假设H0为真,但由于样本的随机性,使样本观测值落入拒绝域,从而作出拒绝H0的结论,这类错误称第一类错误,它发生的概率称为犯第一类错误的概率,也称为“拒真概率”。
——不大于显著水平
P(拒绝H0| H0为真 )
= P{T(x1,…, xn) C| H0为真}
第二类错误:原假设H0为假,但由于样本的随机性,使样本观测值落入接受域,从而作出保留H0的结论,这类错误称第二类错误,它发生的概率称为犯第二类错误的概率,也称为“取伪概率”。
P(接受H0| H0为假 )
= P{T(x1,…, xn) C| H1为真}
第二类错误
(存伪错误)
承认 认为
第一类错误
(拒真错误)
否认 认为
正 确
否认 认为
正 确
犯错误的概率
性 质
判断结果
真实
情况
原假
设
承认 认为
两类错误列表如下:
实际情况在 为真时,不妨设 ,
于是
以例为例考察 与 。
总体 ,样本均值
当 和 固定时,要使 小,由甲式知应使 大
这就可以知道要使 小必要使 大。反之要使
大就会使 小
从乙式可知当 增大时, 也随之增大。
由于 是严格增函数,故必要求 大。
说明:
(1)一个好的检验法总是希望犯两类错误的概率
和 都很小。
的计算与 有关,可以证明:一般情况,当样本容量固定时,若 减少会导致 大,反之,若要 小,必导致 大。(证明略)
但这在一般场合很难实现。这是
(3)一般来说,我们总是控制犯第一类错误的概率,使它不大于 。再在这一限制下使第二类的错误发生的概率尽可能地小。
控制第一类错误的原则。
(2)要同时降低两类错误的概率,或者要在第一类的错误概率 不变的条件下,降低第二类的错误概率 ,需要增加样本容量。
㈠拒绝 说服力强,接受 说服力弱。
四、检验结果的含义
接受 实际应叫
相容,是在没有充足理由
拒绝 情况下采取的态度。
带有概率性质的反证法。这就必然要“找出矛盾”,才能“拒绝 ”的结论。若小概率事件在一次试验中发了,这在概率意义下与“小概率原理”矛盾,从而拒绝 ,这时“拒绝 ” 说服力强。
由于假设检验是某种
但由于当 固定,减少 必导致 增大。所以 取多少为宜,还要看检验问题的背景,由经济效益的情况而定。
时, 越小说服力越强,因此通常取 较小,一般取 等为宜。
㈡由于 是犯第一类错误的最大概率。当拒绝
如在检验药品的毒性问题,毒性过大会导致病人死亡,必须严格控制 。这可用增大 来实现,这类问题,可取 或 。
假设检验问题的类型有:
参数检验
总体均值、均值差的检验
总体方差、方差比的检验
分布拟合检验
符号检验
秩和检验
非参数检验
正态性的图检验法
第二节参数的假设检验
一、一个正态总体的均值的假设检验
⑴
㈠已知方差
条件下,关于均值的假设检验
⑵选取检验统计量
设总体 为来自总体 的样本
⑶给定显著水平
的拒绝域为:
1.双侧检验
⑷查表
,计算
⑸判断:如果 ,则 相容,认为
若 ,则拒绝 ,承认 ,认为
例 某鸡场用某种饲料饲养肉鸡3个月,平均体重,标准差为。现改为复合饲料饲养肉鸡64只,3个月平均体重。若假设用复合饲料饲养3个月后肉鸡体重服从正态分布N(, ) 。问是否可以认为复合饲料同样利于肉鸡生长?(=)
⑵选取检验统计量H0 成立时
~ N(0,1)
解:
H0: =0 =
H1: ≠ 0=
⑴提出假设
H0成立时
~ N(0,1)
H0: =0 =
H1: ≠ 0=
⑷查表得=, 计算得
⑶H0的拒绝域为
⑸因为 接受原假设,认为复合饲料与原饲料对肉鸡生长无显著差异。
前面的检验,拒绝域取在两侧,称为双边检验。下面看关于均值的单侧检验。
⑴假设
控制第一类错误,即
正态总体均值的单侧检验
2.右侧检验
利用统计量 构造拒绝域
⑵从 的一个(好的)点估计 出发,根据备择假设 确定拒绝域的形式应为:
已知
当 为真,即 成立,有关系
所以
要求
利用统计量 构造拒绝域
故而
要求
要使
因为
故知
只要
所以可知 的拒绝域为:
简写为
右侧检验
由于
解:⑴提出假设
⑶查表
由样本值计算
⑷由于
⑵ 的拒绝域为
落入拒绝域
注意 中不等式符号与 相同
例.某织物强力指标 的均值 公斤。改进工艺后生产一批织物,今从中取30件,测得 公斤。假设强力指标服从正态分布 ,且已知 公斤,问在显著性水平 下,新生产织物比过去的织物强力是否有提高?
所以拒绝原假设 ,在显著水平 下承认 ,
认为新生产织物比过去的织物强力有提高。
(1)假设
利用统计量 构造拒绝域
(2)从 的点估计 出发,根据备择假设 确定拒绝域的形式为:
控制第一类错误,即
3.左侧检验
要求
利用统计量 构造拒绝域
已知
当 为真,即 成立,有关系
所以
故而
要求
要使
只要
由于
因为
故知
所以可知 的拒绝域为:
简写为
左侧检验
(二)总体 ,方差 未知。均值的假设检验
正态总体方差未知均值的假设检验与已知方差均值的假设检验,检验步骤相同。只是由于条件不同所选取的检验统计量不同。由第一章定理可知,正态总体方差未知有
1.双侧检验
解:(1) 提出假设
(2) 选取检验统计量
有
由于
未知,要选取有关
的统计量由第一章定理知道,选
给定,
控制第一类错误
(3) 给定显著水平
的拒绝域为
(4) 查表
, 计算
(5) 判断
若
,拒绝 承认 ,
认为
若 , 相容,即承认 ,
认为
(2) 选取检验统计量
(1) 提出假设
解:
例
, , , , ,
问这批产品是否合格?
某工厂生产的一种螺钉,标准要求长度是
毫米。实际生产的产品,其长度 假定服从正
态分布 未知,现从该厂生产的一批产
品中抽取6件, 得尺寸数据如下:
(4) 查表
将样本值代入算出
.
的拒绝域为
(3)
认为
下,拒绝
,所以在
(5) 由于
下面看关于均值( 2未知)的单边检验。
( 2未知)
控制第一类错误,
我们看H0成立时,相关事件的概率
利用统计量
构造拒绝域
已知 ,且
2.右侧检验
由于当H0成立时,
所以
故而
要使
只要
拒绝域为
所以,假设H0的拒绝域为
简记为:
解:①
② 的拒绝域为
例
根据某地环境保护法规定,倾入河流的废
物中某种有毒化学物质含量不得超过 。该地区环境组织对某厂连日倾入河流的废物中该物质的含量测试纪录为 ,经计算得知 。试判断该厂是否符合环境保护法的规定? (设该有毒化学物质含量 服从正态分布)
③查表 ,
计算
∴
所以在显著水平 下,拒绝 ,认为
该厂不符合环境保护法的规定。
,
7766
.
1
15
436
.
0
3
2
.
3
=
-
∵
④
0
0
=
-
=
n
S
X
T
m
⑴假设:
按照控制第一类错误的原则,应当有
3.左侧检验
不等号方向同
⑵给定 ,推知 的拒绝域
据备择假设确定拒绝域的形式应为:
推导过程如下:从 的一个好的点估计 出发,根
当 为真时,有
要使
故而有
所以
只要
拒绝域为:
⑷判断
⑶查表,计算
所以, 拒绝域为:
左侧检验
简记为:
该问题是检验的均值问题,正态总体,方差未知。由于若不接受这批玻璃纸需作退货处理,这就要慎重。我们没有充分理由不能轻易否定这批产品,所以要检验 ?
分析:
提出假设检验
例
某厂生产需用玻璃纸做包装,按规定供应
商供应玻璃纸的横向延伸率不应低于65。已知该指
个样品,得样本均值 ,样本标准差
标服从正态分布 。从近期来货中抽查100
试问在 下,能否接受这批玻璃纸。
⑴
的拒绝域为:
⑵
计算
⑶
查表
⑷
所以在显著水平 下,拒绝 ,不能
接受这批玻璃纸。
∵
⑸
从 2 的一个点估计 出发 ,根据备择假设确定拒绝域的形式
控制第一类错误,即
⑴
当H0 成立时,
因此
二、正态总体方差的假设检验
设总体 是样本。
㈠未知 ,关于 的假设检验
1.双侧检验
又当H0为真,
按照控制第一类错误的原则,为了计算方便,取
因此有
所以等价地,该拒绝域可写为
或
简写为:
的拒绝域为
(2)选取检验统计量
符合规定即是
或
(3)给定 的拒绝域为:
(1)提出假设:
解:
某纺织厂生产的细纱支数服从正态分布,
规定标准差是。从某日生产的细纱中抽取16根
纱,测量其支数,计算得标准差为。问细纱的
均匀度是否符合规定?
例
计算
(5)判断:因为
落在拒绝域
(4)查表
所以拒绝 ,在显著水平 下认为细纱的均匀度不符合规定。
关于方差的单侧假设检验, 未知
利用统计量
构造拒绝域
且控制第一类错误,
我们看H0成立时,相关事件的概率
当H0成立时,
且知
2.右侧检验
有
当H0成立即 时
故而
要使
只要
拒绝域为
所以,假设H0的拒绝域为
简写为:
分析:由题意知:
或写为:
的拒绝域为:
例.某种导线的电阻服从 未知。该种导线其中一个质量指标是电阻标准差不得大于 。现从中抽取了9根导线,测得其电阻 ,经计算样本标准差 ,试问在 水平下,能否认为这批导线的电阻波动合格。
例 解:(1)
(2) 的拒绝域为:
(3)查表知 ,
在 水平下,认为这批导线的电阻波动不合格。
计算
(4)
关于方差的单侧假设检验, 未知
利用统计量
构造拒绝域
且控制第一类错误,
我们看H0成立时,相关事件的概率
3.左侧检验
有
所以
当H0成立即
故而
要使
只要
又因为
所以,假设H0的拒绝域为
的拒绝域为
简写为:
例. 某厂生产的某种电缆的抗断强度的标准差为240kg,这种电缆的制造方法改变以后取8根电缆,测得样本抗断强度的标准差为205kg,假设电缆抗断强度服从 分布。给定 ,试问电缆的制造方法改变后电缆的抗断强度的标准差是否显著变小?
分析:因为肯定一种新的生产方法是要慎重的,所以要用保守设法,就是原假设为标准差没有变小。
所以提出假设:
或
的拒绝域为
(2) 的拒绝域为
(3)查表
计算
(4)
在显著水平 下, 相容,认为标准差没有显著变小。
例.解:
(1)
(二) 已知 ,关于 的假设检验
已知 关于 的假设检验与 未知 的假设检验仅是选取(或借用)的检验统计量不同,其他检验步骤,拒绝域 的寻找方法相同。
已知 关于 的检验,所选取(或借用)的检验统计量是:
⑵选取检验统计量:
⑸判断
⑶给定 ,根据备择假设 可推出
的拒绝域 或
⑴假设 是定数,已知。
⑷查表 ,
计算
1.双侧检验
⑷判断
⑴假设 , 已知。
⑶查表
计算
⑵ 的拒绝域为
2.左侧检验
⑷判断
⑴假设 , 已知。
⑶查表 ,
计算
⑵ 的拒绝域为
3.右侧检验
三、两个正态总体的均值差、方差比的假设检验
设总体Y~
,Y1,Y2,…,Yn为来自总体Y
的样本,样本均值为 ,样本方差为
X与Y 独立。
设总体X~
, 为来自总体X
的样本,样本均值为 ,样本方差为
㈠两个正态总体方差比的假设检验
该问题有两种情况: 都是未知的, 都是已知的。
注意到这两种情况讨论方法都相同,所不同的是在 成立的条件下所选取的检验统计量稍有所不同。
对于 已知的情况,可由 分布的定义知道
对于 未知的情况,选取的检验统计量是由
第一章定理可知是
在实际应用中,两个正态总体方差比的假设检验问题常见的形式有三种:
第一种:
第二种:
第三种:
这三种情况的假设检验一般步骤的讨论与一个正态总体的情况的讨论类似。
并控制第一类错误,
由于当H0成立时,
㈠关于方差比的假设检验, 与 未知
1.双侧检验
依据 的一个点估计 ,由备择假设 确定拒绝域的形式应是:
按照控制第一类错误的原则,为了计算方便,取
H0拒绝域为
的拒绝域简写为
或
练习
见书例
并控制第一类错误,
由于当H0成立时,
且
所以
2.左侧检验
利用检验统计量 ,由 确定拒绝域的形式
故而
要使
只要
要求
当H0成立时,
拒绝域为:
简写为:
并控制第一类错误,
由于当H0成立时,
且
所以
3.右侧检验
利用检验统计量 ,由 确定拒绝域的形式
故而
要使
只要
要求
当H0成立时,
的拒绝域为:
简写为:
练习见 例()
故知
在实际
应用中,两个正态总体均值差的假设检验问题也有
三种常见的形式:
差 但有方差齐性 成立的条件。
和未知方
㈡两个正态总体均值差的假设检验
这个问题有两种情况:已知方差
第一种: 即
第二种: 即
第三种: 即
下面我们举例先讨论第一种假设的两种情况的
见表3—5。
假设检验。其他各种情况的讨论类似一个正态总体
情况的讨论,学生可自我练习。我们以表格的形式
给出各种情况的检验统计量及分布和 的拒绝域
已知 ,检验 是否等于
由第一章定理知
从 12 的一个(好的)点估计 出发 ,
并控制第一类错误,
1.双侧检验
由 形式确定拒绝域的形式为:
由
并控制第一类错误,
可知当 成立时,
是寻找的
检验统计量
所以
故 的拒绝域为:
练习见 例
简写为:
检验 是否等于
未知方差,有方差齐性的条件,即
由第一章定理知
拒绝域的形式:
并控制第一类错误:
其中
从 12 的一个(好的)点估计 出发,由 确定
当 为真时,有:
是寻找的检验统计量
并控制第一类错误,
所以要使
由此, 的拒绝域形式为:
练习 见例
第一步检验
若 相容,认为
这二步检验的显著水平都可用
若拒绝了 ,承认 ,问题不再讨论,认为
两个总体所讨论的量不同。
第二步再检验
差齐性的条件。在这种情况下必须要先判断是否有 ,只有当 时才能用 检验法检验
是否等于 。
二个正态总体,方差未知,没有告知是否有方
注意:
四、成对数据下均值差的假设检验
应用该种假设检验方法的条件是以在相同的条件下,做对比试验所获得的成对数据,作为一组样本值。
可以记为 。它是来自两个互相独立的正态总体 的样本,方差 未知。(不要求 )。
在实际中,有些数据是天然相关成对的。为了需要,有时也设计试验使之成为相关成对的。这时两总体均值差的检验,可以按下面方法进行。
这里特别注意,并不是两个总体的样本容量相同即 所得的数据就叫成对数据。必须是在相同条件下作对比试验所得的数据。
书例中数据就是成对数据。它是在同一架飞机(相同)条件下,对一对两种轮胎作耐磨性对比试验所得的数据。
书例所给的数据就不是成对数据,它是不能用下面的解题方法。
正态总体成对数据检验均值差问题的一般方法是:
检验的一般步骤:
(1)提出检验假设
设总体 与 互相独立且
是分别来自总体 的一组成对数据。
令 视为是一个正态总体。
其中 未知。
看作总体Z 的样本值。
(2)选取检验统计量
由第一章定理知 。
(5)判断
(3) 的拒绝域为
(4)查表 , 计算 的值
成立时有
例 现要比较甲、乙两种橡胶制成的轮胎的耐磨性。今从甲乙两种轮胎中各取8个,然后进行配对,再随机选8架飞机,将配对后的8对轮胎随机地装在8架飞机上,做耐磨性试验。测得轮胎磨损量数据如下:
甲 5110 5500 4900 6030 6410 7600 8650 4870
乙 5020 5420 4930 5950 6320 7670 8590 5010
试问两种轮胎的耐磨性有无显著差异?设轮胎的磨损量服从正态分布。 显然该题是成对数据的假设检验。
解:见书
五、总体比例的检验
总体比例是指总体中具有某种特性的个体所占的比例,记为 。例如某种产品的总体的次品率就是总体中次品所占的比例。
即
且 。
若从总体抽取样本容量为 的样本
则子样中具有该特征的个体的数目就是 。
如果用随机变量 表示个体的某项特征指标,而且规定当一个个体具有该项特征指标时,则记该项指标为 ,否则,记为 。
显然 服从0—1分布,
而样本均值 称为样本的比例。
先看下面的例题
某厂生产的产品长期以来不合格品率不超过。某天开工后,为检验生产过程是否稳定,随机抽检了100件产品,发现其中有2件不合格品,试判断该厂生产是否稳定。
设总体 X 为抽检一件产品不合格品的件数,则
于是判断该天工厂生产是否稳定可转化为检验如下假设
当生产稳定时, 。当生产不稳定时,
检验用的统计量可以从未知参数的点估计出发去寻找,在该例中一个常用的 p 的点估计为
我们用其作为检验统计量,当 n 确定时,也可以用
作为检验统计量。当H0为真时, 不应过大,即T 不会过大;当H0不真时, 较大,即T 会取较大的值。
由此,拒绝域形式如下:
为了在给定显著水平后确定临界值c,先研究T 的分布。由于T 是 n 次独立试验下不合格的件数;而一次试验下不合格的概率为p,根据二项分布的意义,有 T~B(n, p)。 于是犯两类错误的概率分别为
其中 c 是临界值。
下表列出若干 p 值下,不同 c 对应的 (p) 与 (p)的值。
()
() () ()
1 2 3 4 5 6
c
()
()
()
()
1 2 3 4 5 6
c
由这几个值可见,对固定的 c ,在 p值时, (p) 随 p 的增大而增大;
综上,在 时,可取临界值
在 p> 时, (p)的值随 p 的增大而减小。
所以在 p 值时,可选择 p=时满足 (p) 的 c 即可;
又从上表可见,对固定的p>,随着c 的增大 , (p) 也将增大。因此应该选取使 () 时对应的最小 c 值,
以控制第二类错误的概率。
从而拒绝域为
在本例中,由样本观测值知不合格品数T=2。
由于T=2<3,故H0相容,认为该天生产稳定。
上例所给出的检验实际上是关于(0—1)分布总体中参数 p 的检验问题。这里我们作一般陈述。
设样本X1,…,Xn来自总体B(1, p).关于参数p的检验问题也有三种类型:
在上例中已指出可用 作检验统计量。
针对上述三个检验问题拒绝域应分别取如下形式:
常用的方法有利用二项分布、利用F分布和大样本情况下用正态分布来确定临界值。下面先介绍用二项分布确定临界值。
㈠利用二项分布来确定临界值
上例已指出,对检验问题 ,
犯第一类错误的概率 (p)=P(Tc) 是p 的增函数,因而只要求(p0),且拒绝域不能再扩大。
由于当 p= p0 时统计量T~B(n, p0), 故c 是满足下式的最小整数:
同理可得其他检验问题的拒绝域,结果如下:
对检验问题
拒绝域为W={Tc},犯第一类错误的概率(p)=P(Tc)是p的减函数,因而要求(p0)。另外,随着c 的增大, 第二类错误 (p)=P(T>c)将减小。由于当 p= p0 时统计量T~B(n, p0), 故c是满足下式的最大整数:
对检验问题
拒绝域为W={Tc1 或 Tc2},犯第一类错误的概率为(p)=P(Tc1)+P(Tc2),若要求
且犯第二类错误 (p)=P(c1<T<c2)尽可能地小,则要求c1越大越好,c2越小越好,于是c1是满足(*1)式的最大整数, c2是满足(*2)式的最小整数。
㈡利用F分布来确定临界值 (略)
由中心极限定理知
在大样本情况下,
当 为真时,可选取的检验统计量是:
因此,实际应用中当样本容量 较大(一般 ),该统计量近似服从正态分布 。
㈢ 大样本情况下总体比例 的假设检验
类似上述讨论方法可推知大样本情况下,总体比例 的拒绝域如下表:
选取的检验统计量及其分布
的拒绝域
例题见书
某地区主管工业的负责人收到一份报告,
书例
该报告中说他主管地区的工厂执行环境保护条例的
厂家不足70%,而这位负责人认为应不低于70%,于
是他在该地区的工厂 中随机抽取了80个厂家,结
果发现有44家执行了环保条例。那么由他本人的调
查结果能否证明那份报告中的说法有问题?
分析:该报告中说 ,而该负责人是说应该 ,这就是想要证明 是否属实?一般情况认为负责人说话是有一定根据的,要否定他就要有说服力。所以该检验所提出的假设是
解:
(1)
(2) 的拒绝域为
(3)查表 ,计算
(4)
∵
在显著水平 下,拒绝 ,即
∴
可以认为执行环保条例的厂家是低于70%。
⑵ 的拒绝域为
⑶查表知 ,计算
⑷
出厂,今从这批产品中随机的抽取了81件,检查到8件废品,试问这批产品能否出厂?( )
某厂产品要求废品率不得超过3%才能
书p98例
解:
⑴
在显著水平 下,拒绝 ,认为这批产品不能出厂。
∴
㈣大样本情况下两个总体比例的比较
两个样本相互独立。
当 充分大
设总体 ,样本是
总体 ,样本是
易知 且
且
这里
知 与 独立,故
1.对于假设 或 ,当n,m都较大时,在 为真时,近似地有:
可推知 的拒绝域
2.对称的得到假设
的拒绝域为
3.对于假设
在 为真下有
于是近似地有
因为两个样本独立同分布,所以
为真,当n,m都较大近似地有
以上方法叫正态逼近法
于是得到 的拒绝域
注意:正态逼近法适用条件是
n,m都较大
至少使
其中
例:为确定A,B 两种肥料的效果是否有显著差异,取1000株植物做实验,在施A 肥料的100株植物中,有53株长势良好,在施B 肥料的900株植物中有783株长势良好。在 水平上检验这两种肥料的效果有无显著差异?
解:设施 A 肥的植物中长势好的比例为
很大
故可用正态逼近法
施 B 肥的植物中长势好的比例为
1.检验假设
2.总体X是施A肥植物任一株良好的个数,且知 总体Y是施B肥植物任一株长势良好的个数,且知
法一:检验统计量用
4.计算
3. 的拒绝域
5.由于
所以拒绝 ,在 水平下认为A与B两种肥料效果有显著差异。
法二:检验统计量用
3. 的拒绝域
5.由于
所以拒绝 ,在 水平下,认为A,B两种肥料的效果差异显著。
4.
③给定显著水平 ,找出 的拒绝域
④查表知上分位点值,由样本值计算统计量的值
1、假设检验的一般步骤:
小结:
②选取适当的检验统计量。
①根据题意合理的提出检验假设 。
⑤作出判断。
说明:单侧检验不写第②步
2、注意:
一个“小概率事件发生”。表明 不真,从而拒绝
检验是以“实际统计推断原理”为判
断假设的理论根据。检验法是设法通过样本值导致
可得到有说服力的结论。
是对立事件。
在统计假设的检验中,第一步如何合理的提出
原假设 和备择假设 是个重要问题。规定 与
如何提出 ,一般总结几点:见 。
将双边检验写成单侧检验,或将单侧检验写成双侧检验都是错误的。
选择统计量是否有条件可依?其条件是:
②选用的统计量 要能揭示 与抽样试验结果之间的矛盾。
①在 成立条件下,统计量
的分布已知。
前一节讨论的检验都是推断总体的参数,在推断总体的参数时一般都是对总体做了一些限制性假设。
非参数检验中的假设可以是参数假设,也可以是非参数假设。
本节只介绍常用的非参数检验中的符号检验法,秩和检验法,分布函数皮尔逊 -检验法。及正态性的图检验法。
第三节 非参数检验
称这类检验为参数检验。其他的检验称为非参数检验,或叫无分布检验。
例如:已知总体服从正态分布或(0—1)分布等。
如果已知总体分布的类型,要推断的只是总体的某一个或某几个参数。
一、皮尔逊 -检验法
㈠皮尔逊定理
设 是完备事件组,即
①
②
( 是已知的)
是 次独立重复试验中
发生的次数。
的极限分布是
则当
时
设总体 的分布是:
① 是已知量
②
试验模型看作:
个数(频数)。
样本值是 , 是样本值中取值为 的
⑴试验 视为 次独立重复试验。
⑵事件 ,每次试验只能
出现 中之一。
⑶ 是 次独立重复试验中 出现的频数,
是 个随机变量,且
第一次试验
0
1
0
0
第二次试验
1
0
0
0
且
1
0
0
0
第三次试验
0
0
0
0
第 次试验
要验证:
它们的关系,如下表:
理论频数
实际频数
实际频率
概率
卡尔·皮尔逊首先提出选用统计量
他证明了该统计量的极限分布是自由度为 的 分布。
在实用上,当 很大时,一般 时
给定显著水平 ,由 分布表可查得临界值
使
这样可知 的拒绝域为:
⑶列表计算见教材.
书例
机床号
次品件数
有七台自动车床在相同的条件下,
独立的生产同一种产品。在某一段时间内,统计产生了238件次品,其情况如下表:
试问次品的产生是否与机床有关?
⑴
其中 表示第 台机床产生次品。
⑵ 的拒绝域为:
解:设 表示首次取到白球所需抽取次数。由题意知
服从参数为 的几何分布。
盒中有白球和黑球,用有放回地抽样方式取球,直到取到白球为止,记下抽样次数,试验进行100次,其结果如下:
书例
试问该盒中的白球与黑球的个数之比是否是
抽样次数
。
⑴提出假设
⑵找出 个完备事件组。由题意可设
当
为真时,计算
⑶列表计算见,
计算得
给定 ,查 —分布表得
⑷因为
与黑球之比不是1:3 。
∴在显著水平 下,拒绝 。认为白球
参考书例. 在一实验中,每隔一定时间间隔观察一次计数器上记录的某种铀放射出的 的粒子的个数 X 。
皮尔逊定理开始适用的情况是:
总体离散可分为有限类,且总体分布中不含未知参数。
独立观察100次的数据如下:
试问X 是否服从泊松分布。
其中 是观察到有 个 粒子的个数。
虽然泊松分布的随机变量取值是非负整数,但取大量值的概率是非常小的,可以忽略不计。在实际观察时也只能观察到有限个不同值,故总体分类是有限类。
但此类问题还有个困难,即总体中含有未知参数。
该难题是1924年 解决的,他将皮尔逊定理进行了推广。
要检验总体是否服从泊松分布 ?
㈡皮尔逊定理的推广定理
从总体X 中抽取容量为n 的样本x1,…,xn. 在H0为真的条件下,用最大似然估计法得到
不论总体 服从什么分布,检验假设
统计量
当n 时
于是拒绝域为
其中:m 是组数,r 是未知参数个数
⑴样本容量 n 要求很大,一般 n50
使用该定理检验时注意:
⑶由于我们主要采用检验统计量的近似分布来确定拒绝域。
因而要求各组内 不能过少,通常要求 (实用中要求 即可)不满足条件要将其与邻组合并,直到满足条件为止。
这表明小区间的个数不是一开始就确定不变了。
⑵划分小区间 ,其个数不宜太少,也不宜过多,实际应用中一般取 6 m 20。
例解:
⑵根据所给数据情况分组
⑴检验假设
在H0为真的条件下,用最大似然估计法得到
检验假设为
分法一.
或写成
将组内不满足条件 (或 )的组合并。合并为m = 8个组。
写法一.
写法二.见参考书
计算各组(小区间)上的
⑶H0的拒绝域
将计算的数据列表,见书表3-7
数出各组
⑷查表
计算
⑸判断 由于
所以在显著水平 下,接受 ,认为
参考书.例
(1)根据问题提出假设
一般检验步骤是:
是总体为连续的情况,其检验步骤同上,只是注意分组(区间)问题。
在 为真条件下用最大似然估计法,估计
检验假设为:
(2)①把X 的取值范围分成 m 互不相交的区间
而区间的划分方法要视具体情况而定。
各区间为
②计算概率
并可计算出 ,称其为理论频数。
③计算样本观测值 落在
中的个数 ,称其为实际频数。
选取 个实数,
⑶一般采用表格形式来计算出统计量 的值
注意:区间内不满足条件 的要与邻近区间合并,至满足条件为止。
例
⑷对给定的显著水平 ,查临界值 。
的拒绝域为
⑸判断。
若 ,则拒绝
若 ,则接受
说明:上述 公式也可变成如下形式进行计算:
(注 )
此表为2×3的列联表,这六种互不相同的类叫做格。
赞成
反对
态度
性别
弃权
女
1080
443
364
男
1154
474
244
下面介绍 检验法的一种应用:
二、列联表的独立性检验
列联表的独立性检验。
在社会调查中,调查人员可能要研究男同
志和女同志对某种提案反映是否相同?他们将其调查
例如:
情况列成下面表格形式:
要检验的原假设 群众的态度与性别是互相
独立 (即无关)。
该表为2×2的列联表,也叫做四格表。
患慢性气管炎者
未患慢性气管炎者
不吸烟
吸烟
43
13
162
121
例.
慢性气管炎病的关系如下表。
要调查339名50岁以上有吸烟习惯与患
试问吸烟者与不吸烟者患慢性气管炎患病率
是否相同?
一般情况,假设考察一个二元总体,或者考察
总体中诸元素的两个指标写成
1.将 指标的取值范围分成 个互不相交的区
间,
2.将 指标的取值范围分成 个互不相交的区
间, 。
记
且
表3—10
列表为:
要检验的问题是 与 是否独立?
提出原假设 与 互相独立。
如果 为真,则应有
独立的未知参数有 个。
设总体中抽取一个容量为 的样本
用该样本值估计未知参数。
3.当 为真时用最大似然估计法估计未知参数。
将样本值中样本点落在 中的个数记为
又记
且
表3—11列联表
表3-11表示元素的上述分类,这种表称为列联表。
①建立似然函数的方法是:
过程见书
②得到
故似然函数为
所以 个样本点落在 上的概率为
由于每个样本点落在 的概率是
落在 中的样本点的个数为 。
它们是独立的。
由皮尔逊推广定理可知该统计量当 时,
渐近服从自由度为
的 分布。
4.故知 的拒绝域为
皮尔逊定理:
6.判断
要注意:
列联表独立检验的用处是两个:
例
5.由样本值计算 值,查表知临界值
一是检验 是否独立?
可得到参数的最大似然估计。
二是若判断 为相容时,即认为 独立,
。
下面我们介绍在实际应用中计算简便的二种检验方法:符号检验法及秩和检验法。
也就是说虽然 ,但在这种划分下,它不影响统计量 的观察值。因而也容易犯第二类错误:
把 不真的假设接受了。为了克服这一缺点,还有柯尔莫哥洛夫检验等其他检验法,在此我们不做介绍了。
但是该方法是要分组处理样本的观察值,有时虽然
是不成立的,但在某一种划分下,可能出现有
上面介绍的非参数检验是分布函数的 拟合优度检验,
该检验方法使用范围广,不论总体是一维的还是多维的,是离散的还是连续的;总体分布中的参数是已知的,也可以是未知的,都可以用此检验法。
三、符号检验法
㈠单个总体的符号检验法
在有些实际问题中对总体的分布不一定感兴趣,而只关心总体分布的分位数。
设总体
称满足 的数 为 的 上侧分位数
例如:对电视机寿命,关心的是99%的电视机的寿命是否不小于10000小时,
本例问题即是寿命 的上侧分位数
是否是10000。
对于这类分位数检验问题可用符号检验法。
设寿命为 ,问题是
?
1.提出检验问题:
其中 为某一已知数。
转化成概率检验问题等价于:
,
令: ,
证明:
当 为真时,即当 时,
有
反之,若 时,
又因为分布函数 的非降性
则有
有
所以有
记 为样本中大于 的样品个数,
每个样品只有二个可能,大于 或小于 ,
由此试验可以视为伯努利概型。
∵
这时拒绝域取
显然, 越小对 越有利,若 过大则应拒绝
则
或
为样本中小于 的样品个数,
注:样本值中等于 的个数不计入 。
的最小整数。
的取法:
对给定的显著水平 ,可由二项分布定出C
易知 值是满足
上面是单侧检验右侧检验,同样也有左侧检验
和双侧检验。
⒉检验问题:
其中 x0 为已知数。
证明:
当H0 为真时,即当xp x0 时,
转化成概率检验问题等价于
令:
有
每个样品的指标只有二个可能,大于等于x0或小于x0 ,由此试验可以视为伯努利概型。
显然n+ 越大对H0越有利,若 n+过小则应拒绝 H0 。这时拒绝域取
易知c 值满足使
c 的取法:对给定的显著水平 可由二项分布定出,
的最大整数。
记n+为 次试验中, 指标值大于等于 x0 的样本个数,则
⒊检验问题:
其中 x0 为已知数。
转化成概率检验问题等价于
令:
每个样品的指标只有二个可能,大于等于x0或小于x0,由此试验可以视为伯努利概型。
显然n+ 过大或过小对H0都不利,这时拒绝域取
对给定的显著水平可由二项分布定出C:
c2为满足
的最小整数
的最大整数
c1为满足
记n+为 次试验中, 指标值大于等于x0的样本个数,则
的最大整数
是满足
的最小整数
是满足
表3—12
拒绝域
临界值的计算
2
或
的最大整数
的最小整数
是满足
是满足
C
142 134 119 98 131 102 154 122 93 137
86 119 161 144 158 165 81 117 108 103 113
试在 水平上作出检验。
解:提出检验问题:
⑴
圆钢的出厂标准规定,其硬度低于
21根圆钢做硬度试验,结果如下:
意味着要检验圆钢硬度的分位数 不小于
103。为检验一批圆钢的硬度是否合格,随机抽取
的根数不允许超过批量的10% 。这
书例
⑶拒绝域为
c值满足
的最大整数。
由于
⑵由题意知
故知在 时,
为求样本 的观察值,将 的符号依次记录如下:
+ + + - + - + + - + - + + + + + - + + +
可知 ,样本值落入 。
拒绝 ,认为硬度的分位数小于103。
∴
不同的 计算麻烦。
上面介绍的是已知 对分位数 的检验,这对
实用中对中位数检验( 大约为 )是有表可查。
问该厂生产的红砖的抗断强力是否为40?
从某砖厂生产的红砖中抽取12块红砖作抗断强
力试验,测得数据如下:
例
书.
问强力是否是40?
即是问 是否成立?
解:提出检验问题:
题中 不计
我们只研究 。
问题转化为检验:
拒绝域为:
(双侧检验)
的最大整数
的最小整数
c1值满足使
c2值满足使
且 的关系为:
具体证明推导过程如下:
故
知 ,
即
的关系:
查.附表Ⅵ ,是双侧表。
知
故
∴ 相容,认为红砖的抗断强力是40。
有
∵
的符号
解:
在作两个总体比较时,有时样本是成对出现的(注意:什么叫成对数据?),
(二)两个总体的符号检验
成对观察数据差的符号为基础的,因此也叫成对数据的符号检验。
此时符号检验是以
下面通过例子研究将二个总体检验归结为分布的中位数检验。
例 工厂有两个化验室,每天同时从工厂的冷却水中取样,测定水中的含氯量 。下面是11天的记录。试问两个化验室的测定结果在显著水平 下有无显著差异。
本例所给出的数据属于成对数据,这里所得到的测定值 与 是不同化验室测得的结果。
对数据进行建模,有
i 是第 i 天A试验室测量的误差,
处理这种成对数据的一个想法是要消除 i 的影响,
一个简单的想法便是用其差值。
其中i 是第 i天水的含氟量的均值,
i 是第 i 天B试验室测量的误差。
(这表明样本实际上来自不同的分布)
令
此时 仅与两个化验室的化验误差有关,
①
虽是两个总体成对数据的
差,但现在问题是它们的分布不是正态分布,也不知道是什么分布,故不能用前叙两正态总体均值差检验法。
现用 分别表示两个化验室的化验误差,
问题是如何提出检验假设?
考虑方法:
若两个化验室的化验有系统误差时,可设
进一步设
从而
②测量误差
与
不能测量,
可测量的是X, Y
与Z
有关的问题来讨论。
可观测,故可将问题转化成
于是
故在无系统误差时,则 ,即 。
这意味着有
∴ 上例的检验假设可归结为:(分布函数检验)
从而 与 发生是等可能的。
即当 时,有 ,说明 与 同分布,
由上述讨论,问题归结为检验 分布的中位数是否为 0 ,即
得到解决问题的方法如下:
设
为样本中
的样品个数
为样本中
的样品个数
为样本中
的样品个数
不计,
,用
检验问题
的拒绝域
或
查表知 ,
得到
解
①
②查附表Ⅵ知,
+ – – – + – – – – – – –
符号列出为:
③由
。因
落入拒绝域,故在水平
上认为两个化验室的测量结果有显著差异。
∴
书 例
①
②
的拒绝域
查附表Ⅵ知
接受 ,在 下,两种配方的
效能无显著差异。
③
,满足
给定 后,查附表 得 ,使
如何确定 ?
说明:附表Ⅵ列出 从 的情况,如果
当 较大时,
由中心极限定理知:
其均值是 方差是
于是当 时对于检验问题 当
时拒绝拒绝原假设 。
为真时 成立,检验统计量为:
查表 得 ,使
特别地,当
当 时拒绝 。
于是当 对于检验问题
注:⑴看出符号检验是将非参数检验利用符号转化成参数性的检验问题。
其优点:① 用符号代替数值计算简单;
② 不需要考虑总体的分布类型。
缺点是:遗弃了数据的真实数值进行检验,精度较差。
注意该法使用范围:书
⑵符号检验本要求是成对数据,一般
⑶此法是总体分布未知,若已知是正态总体问题还是用正态总体检验。
但若试验条件相同只是 ,但 与 相差甚少,而样本容量相同的部分是成对数据,可将容量大的样本值保留至使 是成对数据,去掉多余的数据,也可以用此法。
1.设 是两两互不相同的实数,
在 中的秩为
中恰有 个元素的值不超过 ,则称
若在
四、秩和检验法
若有几个实数相同,则用它们的平均值作为其秩。
(一)秩的定义和求法
例如:
分别为
写出各个数的秩
若 ,则 的秩为 。
2.求秩的方法
将 按从小到大的次序排列为
,
则其秩为
当 个值 相同时,不妨设
(二)考虑如下检验问题:
秩以及秩的函数都是统计量,基于秩的检验方法称为秩和检验。
秩和检验是一种检验两个总体分布是否一致的检验方法。
假定有两个相互独立的连续型总体X和Y,它们的分布函数分别为FX 和FY。
1.
独立
总体Y:
Sj是Yj
在混合顺序子样
中的秩,
子样中的秩和;
为该样本在顺序
称为该子样
在顺序子样中的秩和;
显然
总体X:样本
在混合顺序子样
Ri是Xi
中的秩,
顺序子样记为 不妨设
将两子样混合在一起,按其由小至大排序得到混合后的
2.混合子样的秩和
所以Tx和Ty中只要有一个确定后,另一个就随之确定了。
不妨设m<n。为减少计算量,选用Tx作统计量。
当H0成立时,根据对称性
所以(X1,…,Xn)的秩和Tx取值不会太大,也不可能太小,即考虑Tx取太大或太小的那些值作为拒绝域
附表Ⅶ是秩和检验界域表,它就显著水平 和不同子样容量m和n(mn)给出了秩和Tx的界域(T1, T2)。
的拒绝域
当 时,则认为两个总体具有相同的分布。
当 或 时,则认为两总体具有显著差异。
说明:①附表Ⅶ列出了 的情况
当 时拒绝 。
选取
②当 时可以利用
的界域
例 为了比较野生和人工培植的某种药材的有效成分含量,某中药厂对这种野生和人工培植的药材分别作了5次和7次试验,测得有效成分的含量如下:
野生(Xi ):
人工(Yi ): 试问两种药材有效成分的含量有无显著性差异?(=)
地区甲
地区乙
1 2 3 4 5 6 7 8 9 10 11 12
序号
解:首先将两组数据按从小到大的顺序混合排列如下表所示。
为减少计算量,取数据少的一组计算秩和,其样本容量用m表示,另一组样本容量选用n表示,本例中m=5,n=7,取野生药材样本计算秩和
就 = ,查附表得界域(22,43)。
现TX=>43, 拒绝原假设,认为两种药材有效成分含量 差异显著。
对检验问题
H0: FX(x)=FY(x) H1: FX(x)FY(x)
拒绝域
例 为了鉴别甲、乙两厂的生产的同一种化肥的质量,分别从两厂生产的化肥中抽取容量为 m = 11,n =12的样本,测得某种有效成分的含量分别为:
甲:8,51,48,15,23,25,39,39,35,25,53
乙:15,39,22,25,9,18,5,11,21,5,20,18
试问能否判别两厂的化肥质量有显著差异?(=)
将数据混合按由小到大的顺序排列于下表
22
12
21
11
20
10
18
9
18
8
15
7
15
6
11
5
9
4
8
3
5
2
5
1
乙厂
甲厂
秩
53
23
51
22
48
21
39
20
39
19
39
18
35
17
25
16
25
15
25
14
23
13
乙厂
甲厂
秩
计算
就 ,查表得 。
对检验问题
拒绝域
在显著水平 下
认为二厂生产化肥的质量差异显著。
因为 ,对甲厂样本计算秩和
现 故拒绝 ,
五、正态性的图检验法
正态分布N(, 2)中有两个参数 和 ,分别称为“平移参数”(或“位置参数”)和“刻度参数”。
若U服从分布 ,则 服从分布 。
记U的分布函数为(x) ,则X的分布函数为
即
F(q)=P(Xq)=q
也即(q -)/=q,这里q为U 的下q分位数
记 X 的“下 分位数”为q,
此时有 ,
((q -)/)=q, ((q)=P(Uq)=q), (q -)/=q,
这里q为U 的下q 分位数。
有时,也将q记为q= -1 (q)。
(q -)/=q也等价于q =q+。
假定有一组来自同一总体G(x)的样本观测值x1,…,xn,要根据这些数据来检验它们是否来自正态总体。
根据该样本,我们可以估计总体的分布函数G(x), 该估计为
则 的下i/n分位数为x( i ) 。
G(q)=q
通常,用 估计G(x),用 的下i/n分位数估计G(x) 下i/n分位数,即 。
其中x(1) ,…, x(n)是将x1,…,xn自小到大重新排序,并重新编号后,得到的统计量。也称为次序统计量。若定义 的下q分位数为
当“样本x1,…,xn来自正态总体”假设成立时,
G(q)=q
ei 表示一个小的误差变量。
……上述公式是许多正态检验方法的出发点。
即“G(x)为正态总体N(, 2)”假设成立时,
有
于是有,
检验步骤:
(1)在忽略掉误差项 ei 后,
x(i) , i=1,…,n与i/n,i=1,…,n成线性关系。
(2)把数据对(x(i) , i/n), i=1,…,n 作成平面坐标系中的点,则这些点应该大致呈一条直线散布。
(3)为了估计的精确性,一般做如下修正。把数据对(x(i) , ()/n), i=1,…,n作成平面坐标系中的点。
(4)如果可以判断这些点大致呈一条直线散布,则认为数据是取自正态分布总体。
(5)该直线的斜率是参数 的粗略估计,位置是参数 的粗略估计。