第七章 假设检验
教学目的
1、使学员牢固掌握统计假设检验的基本思想和步骤。
2、使学员牢固掌握正态总体参数的假设检验及区间估计。
3、使学员掌握非参数检验中的-拟合检验法及秩和检验,了解正态概率纸检验、柯尔莫哥洛夫一斯米尔诺夫检验。
4、使学员能熟练将本章所学知识应用到中学数学教学、教改和教育科研中。
§假设检验的基本思想和概念
所谓统计假设检验,就是对母体的分布类型或分布中某些未知参数作某种假设,然后由抽取的子样所提供的信息对假设的正确性进行判断的过程。现以实例说明
例 在进行一项教学方法改革实验之前,我们可以在同一年级随机抽取30人的样本进行短期(如只讲一章)的微型试验。试验之后对全年级进行统一测验,取得全年级的平均成绩μ0,标准差σ和30人样本的平均分。根据这些资料,如何决断是否应进行这项教改实验。
我们可以把30人的实验组看成来自广泛进行实验的总体中的一个样本,这个假定的总体在统一测验中的平均成绩是μ,是一个未知数,而标准差与全年级的实测标准差视为一样,均为σ。我们的目的是要判断实验总体的平均分μ与全年级实际总体的平均分μ0是否不同。出于数学模式的考虑,可先假设μ=μ0,这个假设称为待检检验,通常又称为零假设,记为H0。当H0为真时,表明实验总体与实际总体无区别,也就没有进行这项教改实验的必要,当H0不真(μ≠μ0)且μ>μ0时,表示这项教改有成效,实验可进行下去,而μ<μ0时,则表明实验是失败的。
例 (书P306) 设某厂生产的一种灯管的寿命~N(μ,40000),从过去较长一段时间的生产情况来看,灯管的平均寿命μ0=1500小时,现在采用新工艺后,在所生产的灯管中抽取25只,测得平均寿命=1675小时,问采用新工艺后,灯管寿命是否有显著提高?
这里的问题,也只需检验是否有μ>μ0,仿上面的例,我们先作待检假设:
H0: μ=μ0 (1500) 并称 H1: μ>μ0 (为备选假设)
我们是想根据抽取的样本(这里抽取的是容量为25的样本)来检验H0是否为真,如不真则接受备择假设H1。
上面两个例子的共同特点是,对母体分布的数字特征(或参数)作出待检假设H0,然后根据从总体中抽取的一个样本对H0是否为真作出推断,像这样的一个过程称为统计假设检验,简称假设检验,在假设检验中,希望通过研究来加以证实的假设,常作为备择假设,用H1表示。而H1的对立面称为零假设或待检假设,正如上所述,用H0表示。像本例H0这种能完全确定母体分布的假设称为简单统计假设或简单假设,否则称为复合统计假设或复合假设,比如这里的H1。由于直接检验H1的真实性一般是比较困难的,因此我们总是通过检验H0的不真实性来证明H1的真实。当我们推断出H0不真时,就认为H1是真实的,从而拒绝H0,接受H1,而认为H0为真时就接受H0,认为H1不真。像上面两例这类只对总体分布中未知参数或数字特征作假设检验称为参数的假设检验。这类问题一般对总体分布的类型有一定了解。有时候,我们对总体分布的情况了解不多,需对其分布类型进行假设检验,称为拟合检验,这类检验属于非参数检验。
下面我们从讨论例出发,来讨论假设检验的思想及步骤。
例 H0:μ=μ0 (1500) H1: μ>μ0
分析与解:直接利用所取的样本来推断H0是否为真当然较困难,必需对子样进行加工,把子样中包含未知参数μ的信息集中起来,即构造一个适用于检验H0的统计量。此处自然地想到选用μ的无偏估计量比较合适,据已知的观察值为=1675>1500造成这种差异有两种可能,一种可能是采用新工艺后,确实有μ>μ0,另一种可能是纯粹由随机抽样引起,属随机误差。若是后者,-μ0不应太大,如-μ0大到一定程度,就应怀疑H0不真。也就是说,根据-μ0的大小就能对H0作检验。在数理统计中,就是要按一定的原则找一个常数K作为界,当-μ0>K时就认为H0不真,而接受H1,反之若-μ0≤K,则接受H0,这就是假设检验的基本思想。那么又如何确定K呢?由于是的观察值。自然想到应由的分布来确定K,若H0为真,~N(μ0,),将其标准化,所得的统计量记为:
EMBED N(0,1) ()
U统计量可用来检验H0,常称它为检验统计量。当H0为真时U偏大的可能性应很小,我们就取一个较小的正数α,按P(U>K)=α来确定K值,对于确定的K值,样本观察值算出检验统计量U的观察值u,只要“u>K”,则认为“小概率事件在一次观察下就发生了”,违背了一般的实际推理原理,而违背常理的原因是因为假设H0成立,从而从反面认为应否定H0,接受H1,反之若u≤K,则接受H0,由此可见,假设检验的基本原理是小概率原则,它是一种概率意义上的反证法。
再回到例 取α= 由
P{}=α 查表得=
我们称为该处临界值(它相当于上面的K值),将观察值代入()中算得U的观察值为 =>=
按“小概率原则”应否定H0,接受H1认为采用新工艺后,灯泡平均寿命有显著提高。
像上面那样,只对H0作接受或否定的检验,称作显著性假设检验。α则称作显著性水平,简称水平,它是判断零假设H0真伪的依据,一般取α为,,等(较规范)。按上面的讨论,我们由水平α确定出临界值后,实际上把检验统计量U的可能取的观察值划分成两个部分:
显然当U的观察值落入C,则拒绝H0,所以我们称C为拒绝域或临界域。
在应用上,假设检验解决的问题要比参数估计解决的问题广泛的多。根据具体问题设立不同的零假设,随之采用的检验统计量也不同,从而产生各种具体的检验方法,其中常用的方法将在本章逐一介绍。
综上,总结出显著性假设检验的一般处理步骤为:
(1)根据实际问题提出原假设H0及备择假设H1 。
(2)构造一个合适的检验统计量,此处不妨设它为U(其构造以能反映相对差异,且在H0为真时,较易确定其分布为准)。
(3)给定显著性水平α,并在 H0为真的假定下,由U的分布确定出临界值u0进而求出拒绝域C。
(4)由样本观察值计算出检验统计量U的值u,视其是否落入C作出拒绝或接受H0的判断。
根据上面的讨论,我们按小概率原则确定H0的拒绝域而达到检验H0的目的是有些武断,可能犯两类错误。
第一类错误——拒真错误,即H0本来正确,却拒绝了它,犯这类错误的概率不超过α,即
P{拒绝为真}≤α
第二类错误——受伪错误。即H0本不真,却接受了它,犯这类错误的概率记为β,即
P{接受为真}=β
我们自然希望α和β都很小,甚至都为0,但在子样容量n固定时,使α和β都很小是办不到的,一般是控制α,而使β尽可能小。
§正态母体参数的假设检验
本书介绍正态母体参数的假设检验
一、U-检验
设1,……, n为取自正态母体N(μ,σ2)的一个子样,σ2=为已知常数,
检验H0:μ=μ0 (μ0已知)(这里视H1: μ≠μ0)
选用统计量U= N(0,1) ()
对给定的水平α由=α,查表得临界值 ,确定出拒绝域为C={},其中u为()的观察值
例 (见书P315—316)
例 某区进行数学统考,初二年级平均成绩为分,标准差为分,从该区某中学中抽取50位初二学生,测得平均数学统考成绩为78分,试问该中学初二的数学成绩与全区数学成绩有无显著差异?
分析与解:该例中总体为全区初二的数学统考成绩,但是否服从正态分布我们并不知道,但由中心极限定理,如()构造的统计量的极限分布为N()分布,因此当样本容量较大时(一般是n≥30),无论母体是什么分布,仍可用U检验,为此,当取α=时
由 {}= 查表得
将μ0= σ0= n=50 =78代入()得
因
故应拒绝H0:μ=μ0 认为该中学初二数学成绩与全区成绩有显著差异。
我们注意到例与例的拒绝域C的区别,例的C={,+∞},这是因为备选假设为H1: μ>μ0,是单侧的,而例的C=[-∞,- ][ ,+∞],这是因为其H1 是H0的否定:μ≠μ0为双侧的,我们称例的U检验为单边(侧)检验(那里是右边检验)。例为双边(侧)检验。下面介绍的检验法亦有双侧,单侧之分,将不再重述。
二、T-检验
1、单个母体均值的检验
作单个母体均值的U检验,要求总体标准差已知,但在实际应用中,σ2往往并不知道,我们自然想到用σ2的无偏估计代替它,使得到t-检验法。1,……,n为取自母体N(μ, σ2)的子样,需检验,
H0:μ=μ0 H1: μ≠μ0
选用统计量
() 由给定的水平,由{ }=查表定出临界值,进而确定出拒绝域为C={}(t的分布表见书P520)
例(见书P317—P318)
例健康成年男子脉搏平均为72次/分,高考体检时,某校参加体检的26名男生的脉搏平均为次/分,标准差为次/分,问此26名男生每分钟脉搏次数与一般成年男子有无显著差异?(=)
分析 题意是问26名男生是否来自μ0=72的总体,由于总体方差未知,只能用T检验。
提出假设:H0 μ=μ0 H1: μ≠μ0
计算t值:
确定临界值:由~t(25) ( H0真时)
按P{
判断 由 ||< 故接受H0 认为……无显著差别。
2、二正态总体均值差的检验
(1)方差相齐的均值差检验
设1,……, n1是取自正态母体N (μ1,σ2)的子样,1, 2,……, n2是取自正态母体N(μ2,σ2)的子样,且两子样相互独立,σ2未知,检验
H0:μ1=μ2(或μ1-μ2=0), H1: μ1≠μ2,
记这两个子样的均值和方差的无偏估计分别为
选用检验统计量其中 ()
由的系3,()所示的检验统计量T t(n1+n2-2 )
对给定的水平,在H0为真时,按P{ }=
查表定出临界值.确定出拒绝域C={}
当T的观察值t则拒绝 H0,否则接受H0
例 (见书P319-P320)
(2)方差不齐的均值差检验:
由于方差不齐,不能用前面前述T检验来检验均值是否相等,可用下面的检验,即用统计量检验H0:
它的临界值为:
拒绝域为C=
(3)大子样的U检验:
在实际应用中,如遇两个独立子样的容量都较大(均超过30)这时可不管独立子样的分布是否为正态的,则可用U检验作近似(依据是中心极限定理),即选用检验统计量为:
U=
其中可以是或,可以是或
例对7岁儿童作身高调查结果如下所示,能否说明性别对7岁儿童的身高有显著影响?
性 别
人数(n)
平均身高()
标准差
男
384
女
377
检验步骤:
由 查表得
拒绝域为。
。
所以在=下,拒绝H0,接受H1,即认为性别对7岁儿童的身高有显著影响。
对于两个来自非正态总体的独立样本,其中至少一个的容量小于30时,则其均值差的检验只能采用非参数检验的秩和检验或符号检验(后面将作介绍)
三、-检验
以上讨论的U-检验和T-检验都是关于均值的检验,现在来讨论正态母体方差的检验。
设1,……, n为取自正态母体N(μ,σ2)的子样,需检验假设H0: (现分别对μ已知和μ未知两种情况进行行讨论)。
1、μ=μ0为已知常数(这时)是σ2的无偏估计。
选用检验统计量
EMBED ()
由给定的水平,由P{k1≤≤k2}=1-,查表定出临界值k1, k2及拒绝域,
一般情况下k1, k2是选用分位点。
即由 ,定出
2、母体均值μ未知的情形
(这时用μ的有效估计代()中μ0)
选用检验统计量为
EMBED ()
对于给定的水平,由
EMBED , EMBED
查自由度为(n-1)的-分布表,得临界值,从而确定其拒绝域为=()()
然后将样本观察值代入()计算出的观察值,视其是否落入拒绝域而作出拒绝或接受H0的判断。
例(书P322)此为单侧检验H0:σ2=: σ2>
四、-检验
前面介绍二独立母体均值差的T检验时,我们要求二母体方差相等要检验其方差是否相等,需用下面介绍的F-检验法。
~N(μ1,σ12),η~N(μ2,σ22)且相互独立,分别从, η中取得子样
(1,……,n1),(η,……,ηn2),检验
H0:σ12=σ22 H1: σ12≠σ22
易分析,可选用检验统计量
=
对给定的水平,由()= (
查分布表定出临界值,进而确定出拒绝域()()视统计量的观察值是否落入而作出拒绝或接受H0的判断。
例某中学从初二年级中各随机抽取若干学生施以两种不同的数学教改实验,一段时间后统一测试结果如下:
实验甲:n1=25, =88 =6
实验乙:n2=27, =82 =9
在测试成绩均服从正态分布的条件下,问两种实验效果差异是否显著(α=)
解:1、首先作方差齐性检验
(1)提出假设
: EMBED :
(2)定临界值
由 ()
查表得
于是拒绝域为C={f≥}(f≤)
(3)计算f值
(4)作出判决,因fC故拒绝H0,认为两子样取自方差有显著差异的总体。
2、检验均值是否有显著差异
因方差不齐,选用所示检验
(1)H0:μ1=μ2H1: μ1≠μ2
(2)计算临界值
由α= 查t-分布表 得(24)= (26)=
(3)计算值
故应拒绝H0认为两种试验效果有显著差异
综上可把上述关于正态母体参数的显著性检验总结为教材P325的表(书325)。
§正态母体参数的置信区间
在点估计中,我们求得的估计值(χ1,……,χn)是θ的一个近似,到底其近似程度有多大?也就是它的精确度是多少?并没有从估计量本身反映出来,因此有必要进一步探讨用估计量来估计θ的误差范围,比如说通过抽样调整,以的概率估计某市六岁男孩的平均身高在之间,这就指出了误差范围,它的可靠度是,一般而论,我们就是要通过子样构造一个随机区间(,)并指出该区间以多大的概率包含未知参数θ,这类问题称作区间估计问题,相应的区间称作置信区间。
定义 设母体~{f(χ,θ),θ},θ未知待估。(1, 2,……, n) 为取自的子样,若对于事先给定的α(0<α<1),存在两个统计量和,使得
()
则称()为参数θ的置信度(或置信系数)为1-α的置信区间,和分别称作置信度为1-α的置信下限和置信上限。
对上定义,我们应注意以下几点:
1、置信区间()是一个随机区间。
2、置信区间端点和区间长度都是子样的函数,都是统计量。
3、()是θ的置信度为1-α的置信区间的含义是:大量重复抽样下,将子样观测值代入,可求得许多确定的区间,其中大约100(1-α)%的区间包含θ在内,而观察得到的一个具体区间(,则可能包含,也可能不包含θ。
以下我们从一个具体的例子入手,讨论正态母体参数的置信区间的构造。
例(见教材P327)设轴承内环的锻压零件的高度~N(μ,)现从中抽取20只内环,其平均高度=,求μ的置信度为95% 的置信区间。
解:仿假设检验的分析,这里σ2=已知,构造一个含未知参数μ的子样的函数
~
由已知1-α=,即水平α= 根据
{}= 查N(0,1)分布表得分位点
代入上式得
{} ()
上式括号内作恒等变形 得{ }= ()
即μ的置信度为的置信区间为( )
将观察数据= 及,n=20代入计算得
于是μ的一个95%的置信区间为(, )
由上面的讨论,我们可以总结出构造未知参数θ的置信区间的步骤如下:
1、寻求一个子样的函数U(1, 2,……, n,θ)使其只含待估参数θ,但不含别的未知参数,并确定其分布(分布亦不能含未知参数)。
2、对于给定的置信度1-α,由1中U(, θ)的分布定出相应的分位点。
3、利用不等式的恒等变形求得θ的置信区间。
对于正态母体,构造未知参数的置信区间所选用的随机变量U(, θ)与假设检验中相应的检验统计量类似,见书P332—P333 表
例某市教科所进行初中数学教学实验,实验班是从全市初一新生中抽取的一个n=50的随机样本。初中毕业时该班参加全省毕业会考的平均分为,标准差为,如果全市都进行这种教学实验,并实验后全市毕业生的会考成绩服从正态分布,那么,全市初中毕业会考成绩的平均分不会低于多少(置信度为)?并将其与现在全市初中毕业会考成绩的平均分进行比较。
解:此处已知总体服从正态分布,且σ2未知,由表的估计μ的第二行的公式,查t(50-1)分布表得(49)=,
于是μ的的置信区间下限、上限分别为:
所以μ的置信度为的置信区间为(, )即当全市都进行这项教学实验时,全市初中毕业会考成绩有95%的把握其最低平均成绩为,比现在的高分。
(注:由于该例n>30,若总体不服从正态分布,也可用这种情形的第一类情况处理,事实,该例用表第一行公式计算的置信区间为(,)与现今接近,但若n<30,就只能用t分布的置信区间处理了)。
需要指出的是,置信区间并不唯一,如上例 我们由
{}=
来确定置信区间,只要选择λ1,λ2适合上式即可,显然这样的λ1,λ2有无穷多个,相应的置信区间()也就有无穷多个,比如,由α=α1+α2 取α1=
α2 =,则
则算得()的观察值为(, )(区间长度为,前面长为)。
我们总希望在同一置信度下,置信区间的长度越短越好,因为区间越短,估计的精确度越高。可以证明,像正态分布,t分布这类密度曲线为单峰对称的分布,对称的置信区间最短,也就是像我们原来那样,取α1=α2 ==,
构造的精度最高。
置信区间的长度也与子样容量n有关,一般来说,n越大,区间长度越短,但n大,又要增多试验的次数。
此外,置信区间长度与置信度也有密切的关系,置信度越高区间的可靠性越大,但样本容量一定时,提高了置信度,置信区间的长度又往往变大,即精确度又降低了,所以必须具体问题具体掌握。
关于正态母体均值和方差的联合置信区域的讨论参见教材P330—P331
§ 非参数假设检验
前面讨论的母体分布中知参数的估计和检验都是假定母体分布类型已知,比如为正态母体的前提下进行的,在实际应用时,母体的分布往往未知,首先应对母体分布类型进行推断,如何对母体的分布进行推断呢,不难想象,我们可以由子样作经验分布函数的提示,对母体分布类型作假设,然后再对所提的假设进行检验。由于所用的方法不依赖于母体分布的具体数学形式。在数理统计中,就把这种不依赖于分布的统计方法称为非参数统计法。非参数统计的内容十分丰富,在本节我们主要介绍非参数假设检验中最重要的一类——分布函数的拟合检验。主要介绍四种检验方法:概率图纸法、χ2-似合优度检验法、柯尔莫哥洛夫—斯米尔诺夫检验法及秩和检验法。
一、概率图纸法
这是一种比较直观、简便的检验法,适合于现场使用,目前常见的有正态、对数正态、二项分布、指数分布和威布尔分布等概率图纸,由于各类概率图纸的构造原理和使用方法都是类似的,我们这里只介绍正态概率图纸。
1、正态概率图纸的构造原理(参见材料P335—P336)……
2、检验步骤 若从母体ξ取得一组子样观测值χ1,χ2,……,χn
由上面的分析,当H0:{N(μ,σ2)}为真时,则有点(),
在正态概率纸上描出一条直线(或说应在一条直线上。)
因F(χ)未知,由格里汶科定理知,经验分布函数Fn(χ)与F(χ)之间有关系:
P{}=1
故用经验分布函数Fn(χ)代母体未知分布,应有(),在正态概率图纸上近似地在一条直线附近,否则,说明H0不真,由此得出用正态概率图纸检验H0的具体步骤如下:
整理数据并列表:将子样观察值按从小到大顺序排列并列成书P337表的形式(注意)的修正)。
描点:将点(,描在正态概率图纸上。
(3)目测点是否近似在一条直线上,而作出是否接受H0的判断。
3、未知参数μ与σ2的估计
由前面的讨论知
据此,若点(,)描出的直线为L,则在概率图纸上画F=的水平线与L交点的横标=
又由
得 , (其中 表F=与L交点的横标)
即
例(见书P338)
二、-拟合检验法
用概率图纸法来拟合母体分布,虽然直观而简便,但精度不高,且不能控制犯错误的概率,下面我们介绍皮尔逊提出的-似合检验法,它能像各种显著性检验一样控制犯第一类错误的概率。
1、设母体ξ~F(x),但F(x)未知,从ξ抽取子样(ξ1,……,ξn)的观测值为(x1,……,xn)据此检验:
H0:F(x)=F0(x) (其中F0(x)为某个已知的分布,不含未知参数),我们将ξ的可能取值范围R分成k个互不相交的区间:
(这些区间不一定长度相等。且a0可为-∞,ak可为+∞)。
以ni表示子样观测值x1,x2,……,xn中落入Ai的频数ni,称之为观测频数,显然有,而事件{}在n次观测中发生的频率为。
我们知道,当H0为真时,P()=F0(ai)-F0(ai-1) ()
于是得到在H0为真时,容量为n的子样落入区间Ai的理论频数为,且有
由大数定律知,当H0为真时, (n→∞)
即知,当n充分大时,与 的差异不应太大。根据这个思想,皮尔逊()构造出H0的检验统计量为:
()
并证明了如下的结论
定理(皮尔逊定理),当H0为真时,()所示的统计量的渐近分布是自由度为k-1的-分布,即
变量,当时。 ()
证:由于对一般k的证明要用到多元特征函数,(可参见教材P342—P345)这里仅对k=2证明,当k=2时, P(ξA1)=P1, P(ξA2)=P2, 有P1+P2=1 这时观测频数n1+n2=n
()所示的-统计量为:
()
令Y1=n1-nP1, Y2=n2-np2, 则有
Y1+ Y2= n1+ n2-n(p1+p2)=n-n=0
可见Y1=- Y2 且Y1、Y2不线性独立,于是
由德莫弗一拉普拉斯中心极限定理
由-分布的构造性定理:变量
对于给定的水平α,P{}查(k-1)分布表,确定出临界值,从而得H0的拒绝域C=[,∞],将子样观察值代入()所示的-统计量算出其观测值,视其是否落入C而作出拒绝或接受H0的判断。
上面的检验法称为皮尔逊拟合检验法,它适合下面更一般的情况。
2、母体ξ~F(x),其中F(x)未知,需检验:
H0:F(x)=F0(xi,θ1,……, θm),其中F0为已知类型的分布,但含有m个未知参数
θ1,……, θm
在这种情况,我们首先用θ1,θ2,……, θm的极大似然估计代替F0的θ1,……, θm ,再按情况I的办法进行检验,但这时()所示的-统计量的渐近分布将是 (k-m-1),即有:
定理 (Fisher定理) H。为真时,用θ1,……, θm 的极大似然估计代Fθ(xi,θ1,……, θm)中的未知参数θ1,……, θm,并用
()
代替()式中的Pi所得的统计量
( )
当n→∞时,有 (k-m-1)分布
例(见教材P343)
-检验作分布函数的拟合检验的一般步骤(见教材P347-P348)
三、柯尔莫哥洛夫拟合检验——Dn检验
前面我们讨论的-拟合检验虽能对任何类型的未知分布进行检验,但它依赖于区间的划分,实际上仅仅检验了是否有
故有可能接受到不真的H。有必要再来探讨一种更精确的检验法,本段来讨论如何用子样经验分布函数来作分布函数的拟合检验。
设母体~F(x),由取得一组子样观察(1,……, n),将它从小到大递增的次序排列得
≤(2)
如下构造的子样经验分布函数:
若记 ()
不难看出Dn为一统计量,格里汶科证明了
{}=1(即Dn依Pr1超于0)
也就是说,子样经验分布函数Fn(x)依概率1关于一致收敛到母体分布F(x)。
柯尔莫哥洛夫进一步讨论了统计量Dn的精确分布和极限分布。
定理 设母体的分布函数F(x)是连续的,从中抽取容量为n的子样,其经验分布函数为Fn(x)则
的分布函数为……(见书P349()())
由于Dn的精确分布和极限分布都不依赖于母体真分布F(x),由此提供了分布函数拟合检验的重要方法,即所谓柯尔莫哥洛夫检验法:设母体ξ~F(x)未知,从中抽取字样观察值( ),检验 (其中F0(x)为已知的连续分布函数)
将x1,……,xn由小到大排序为x(1)≤……≤x(n)设所作经验分布函数为Fn(x),取检验统计量为()所示:当H0为真时,上面的Dn具有如所述的精确分布和极限分布,而H0不真时,Dn便有偏大的趋势,因此,对于给定的水平α查附表8得临界值Dnα使
P(Dn>Dnα)= α
由子样观察值计算:
若Dn>Dnα则拒绝H0,否则接受H0
用上面的柯尔哥洛夫检验法作拟合格检验时,若n>100,则可由。查Dn的极限分布函数表得λ1-α,从而求得Dnα的近似值,(因附表8只能查n≤100的Dnα)
当F0(x)含有未知参数时,可用大容量子样来估计未知参数,或本来抽取的子样容量就较大,就用抽取的子样来估计未知参数;但这样Dn-检验是近似的,宜取水平α较大,比如α=或等。
综上,用Dn-检验的一般处理步骤如教材P350近所述。
例 设母体ξ~F(x),F(x)未知,从中抽取容量为50的子样,其观察值如书P349表中所示,在水平α=下检验
H0:F(x)=F0(x)~N(μ,σ2), 但μ,σ2未知
解;由于n=50已较大,就以此子样对μ,σ2作出估计
于是认为F0(x)~N( .)
为计算
将有关计算列成书P352表的形式,从表中看出Dn=
查附表8所示的柯尔莫哥洛夫检验临界值表得D50,=,因Dn<Dn.α故接受原假设,认为母体分布F(x)为N(,)。
四、柯尔莫哥洛夫——斯米尔诺夫的两子样检验
斯米尔诺夫遵循柯尔莫哥洛夫似合检验的思想,用比较两个子样经验分布函数的方法,得出检验两个子样是否来自同一母体的检验法。
从具有连续分布函数F1(x)和F2(y)的母体中分别抽取二独立子样ξ1,ξ2,……,ξn1和η1, η2,……, ηn2需检验假设
H0: F1(x)= F2(x), -∞<x<+∞
分别以F1n1(x)和F2n2(x)表两子样的经验分布函数
记 ()
显然Dn1n2是一个统计量,斯米尔诺夫证明了其极限分布具有如下所述的结果:
定理 当n1,n2分别趋于∞时,统计量Dn1n2有极限分布函数:
可见Dn1n2的极限分布不依赖于F1(x)和F2(x),可用它作为此处H。的检验统计量,显然当H。不真时,Dn1n2应有偏大的趋势。
若能查得P(Dn1n2>Dn1n2α)=α
则当Dn1n2统计量的观察值>临界值Dn1n2α时,拒绝H0否则接受H0
例(教材P353—P354)
五、秩和检验
1、秩和检验法的原理
前面介绍的柯尔莫哥洛夫一斯米尔诺夫检验是用两个子样的经验分布函数之差的绝对值上界为统计量,我们知道经验分布函数是与次序统计量密切相联的,本段介绍的秩和检验统计量也与次序统计量密切相关,而在应用和理论推导上,却比柯尔莫哥洛夫一斯米尔诺夫检验简单得多。
先来看什么是秩
定义 设(1,……, n)是取自母体的一个子样,(χ1,……,χn)为子样的观测值,将χ1,……,χn按由小到大的顺序排列:
χ(1)≤χ(2)≤……≤χ(n)
以Rj表示子样分量j的秩,它表示j在顺序统计量中的位置,即当χj=χ(k)时,则Rj=k(参见教材P356例)。
在重复取样中,Rj是子样的函数,是统计量。对一个容量为n的子样,它的秩(R1,R2,……,Rn)是(1,2,……,n)的一个排列,且
从两个中心值相等但分布未知的母体中,独立地分别抽取容量为n1和n2的两个样本,然后将其混合后按从小到大的顺序排列并记下其秩,将得到的秩代原来子样的观测值:
r1,r2,……,rn1,rn1+1,……,rn1+n2
然后将容量较小的子样(比如就是n1≤n2)的秩之和称为秩和T,(若n1=n2,则将平均值较小的样本的秩和记为T)即
()
如果反复无穷多次抽样,便可得一个对应于样本容量n1和 n2的秩和T的分布,这个分布是离散而对称的,其最小值和最大值分别为:
即
T的平均值为
秩和T的分布与母体分布形式无关,因而可用T来检验两个母体的分布是否相同(严格地说,只能检验两个母体分布的均值是否相同),这种用统计量T来检验两母体分布是否相同的方法称为秩和检验法。
显然当H0:两母体分布相同,成立时,秩和T不会过小或过大,对于给定的水平α按双侧检验的办法。
根据
查教材P523附表9,定出临界值,便可得到H0的拒绝域为:
C={t:(t≤t1) (t≥t2)}
而T的一个1-α的置信区间为(t1,t2)
2、小样本的秩和检验
对于两个容量都不大于10的独立样本,可借助于秩和检验临界值表(即附表9)来检验两母体分布是否有显著差异。例(见教材P357)
例为比较两个初中毕业班数学会考成绩有无显著差异,从两班随机抽取若干学生的成绩作样本如下表所示。
甲班成绩
88
96
83
80
90
63
52
93
69
乙班成绩
93
90
82
94
98
99
65
47
78
91
问甲、乙两班数学毕业会考成绩是否有显著差异?
检验步骤:
(1)提出假设
H0:甲、乙两班成绩无显著差异
(2)编排秩次
把两个样本数据混合按从小到大顺序排列将每个样本值的秩次记下,若两个样本值相等,则取两个数值所在序号的平均数为其秩次:
47
52
63
65
69
78
80
82
83
88
90
90
91
93
93
94
96
98
99
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
()
()
(13)
()
()
(16)
(17)
(18)
(19)
(3)计算秩和(取样本较小的甲班)
T=10+17+9+7++3+2++5=79
(5)进行统计推断(取α=)
查表得t1=66 , t2=114 因 66<T<114。 故接受H0,认为在α=下,甲乙两班数学会考成绩无显著差异。
3、大样本的秩和检验
当n1和n2都大于10时,秩和T的分布中秩次组合数
。 所具有的组数(T的可能取值个数)为: k=(n1n2+1)>10×10+1=101 此时,秩和T的分布接近正态分布,其均值μ和标准差分别为:
于是变量(n1→∞) ()
这时秩和检验变成用()作U-检验
例 从某班随机抽取11名女生,15名男生期末数学测验成绩如下表,问该班男、女学生之间,数学成绩有无显著差异,(α=)
女生
原始分
87
77
92
98
97
76
62
82
46
70
70
男生
原始分
90
71
79
94
95
82
53
95
97
96
93
85
88
78
96
(1)提出假设
解:H0:男、女学生数学成绩无显著差异
(2)编排序次
1 2 3 6 7 8 9 10 13 14 15
46 53 62 70 70 71 76 77 78 79 82 82 85 87 88
16 17 18 19 26
90 92 93 94 95 95 96 96 97 97 98
(3)计算秩和 T=14+8+17+26++7+3++1++=121
(4)计算检验统计量观测值
(5)进行统计决断
因。 故接受H0,认为该班男、女生数学成绩无显著差异。
最后,我们谈谈秩和检验的可靠性问题。秩和检验是威尔科克逊()于1945年提出的,由于它不依赖于母体的分布形式,因此在应用上更受欢迎,但人们也怀疑检验的可靠性,统计学家已经证明了如下结论:
1、在小样本的情况下,秩和检验的精度几乎与t检验一样。
2、在原始母体为偏态分布的情况下,秩和检验和可靠度比t-检验高。
3、在原始母体分布为“抛物线型”分布的情况下,秩和检验最为不利,其可靠性比t-检验低。
上述结论表明,在多数情况下,秩和检验并不比t-检验差。
PAGE
PAGE 17