假设检验
参数假设检验
非参数假设检验
这类问题称作假设检验问题 .
总体分布已
知,检验关
于未知参数
的某个假设
总体分布未知时的假设检验问题
我们将讨论不同于参数估计的另一类重要的统计推断问题. 这就是根据样本的信息检验关于总体的某个假设是否正确.
第7章 假设检验
假设检验的基本思想和概念
例1 工厂中自动打包机打包,每包重量
每包重应为50kg,由于机器存在误差,打包重量并不
是50kg,现从中任取9包,测得
问:打包机工作是否正常?
例2 学生的考试成绩是否服从正态分布?
例3 某研究所推出一种感冒特效药,为证明其疗效,
选择200名患者为志愿者。将他们均分为两组,分别
不服药或服药,观察 三日后痊愈的情况,得出下列
数据:
200
96
104
合计
100
44
56
服药者
100
52
48
未服药者
合计
未痊愈者
痊者
问:新药是否有明显疗效?
例1—例3所要解决的问题可转化下述问题:
例1
例2
例3
生产流水线上罐装可乐不断地封装,然后装箱外运. 怎么知道这批罐装可乐的容量是否合格呢?
把每一罐都打开倒入量杯, 看看容量是否合于标准.
这样做显然
不行!
罐装可乐的容量按标准应在
350毫升和360毫升之间.
一、基本概念和思想
每隔一定时间,抽查若干罐 .
如每隔1小时,抽查5罐,得5个容量的值 ,根据这些值来判断生产是否正常.
如发现不正常,就应停产,找出原因,排除故障,然后再生产;如没有问题,就继续按规定时间再抽样,以此监督生产,保证质量.
通常的办法是进行抽样检查.
在正常生产条件下,由于种种随机因素的影响,每罐可乐的容量应在355毫升上下波动. 这些因素中没有哪一个占有特殊重要的地位. 因此,根据中心极限定理,假定每罐容量服从正态分布是合理的.
现在我们就来讨论这个问题.
罐装可乐的容量按标准应在
350毫升和360毫升之间.
它的对立假设是:
称H0为原假设(或零假设);
称H1为备选假设(或对立假设).
在实际工作中,往往把不轻易否定的命题作为原假设.
H0:
( = 355)
H1:
这样,我们可以认为 是取自正态
总体 的样本,
是一个常数.
当生产比较稳定时,
现在要检验的假设是:
那么,如何判断原假设H0 是否成立呢?
较大、较小是一个相对的概念,合理的界限在何处?应由什么原则来确定?
由于 是正态分布的期望值,它的估计量是样本均值 ,因此可以根据 与 的差距
来判断H0 是否成立.
较小时,可以认为H0是成立的;
当
生产已不正常.
当
较大时,应认为H0不成立,即
问题归结为对差异作定量的分析,以确定其性质.
差异可能是由抽样的随机性引起的,称为
“抽样误差”或 随机误差
这种误差反映偶然、非本质的因素所引起的随机
波动.
然而,这种随机性的波动是有一定限度的,如果差异超过了这个限度,则我们就不能用抽样的随机性来解释了.
必须认为这个差异反映了事物的本质差别,即反映了生产已不正常.
这种差异称作
“系统误差”
问题是,根据所观察到的差异,如何判断它究竟是由于偶然性在起作用,还是生产确实不正常?
即差异是“抽样误差”还是“系统误差”所引起的?
这里需要给出一个量的界限 .
问题是:如何给出这个量的界限?
这里用到人们在实践中普遍采用的一个原则:
小概率事件在一次试验中基本上不会发生 .
现在回到我们前面罐装可乐的例中:
在提出原假设H0后,如何作出接受和拒绝H0的结论呢?
在假设检验中,我们称这个小概率为显著性水平,用 表示.
常取
的选择要根据实际情况而定。
提出假设
选检验统计量
~ N(0,1)
H0: = 355
H1: ≠ 355
由于 已知,
它能衡量差异
大小且分布已知 .
对给定的显著性水平 ,可以在N(0,1)表中查到分位点的值 ,使
故我们可以取拒绝域为:
也就是说,“
”是一个小概率事件.
W:
如果由样本值算得该统计量的实测值落入区域W,则拒绝H0 ;否则,不能拒绝H0 .
如果H0 是对的,那么衡量差异大小的某个统计量落入区域 W(拒绝域) 是个小概率事件. 如果该统计量的实测值落入W,也就是说, H0 成立下的小概率事件发生了,那么就认为H0不可信而否定它. 否则我们就不能否定H0 (只好接受它).
这里所依据的逻辑是:
不否定H0并不是肯定H0一定对,而只是说差异还不够显著,还没有达到足以否定H0的程度 .
所以假设检验又叫
“显著性检验”
如果显著性水平 取得很小,则拒绝域 也会比较小.
其产生的后果是:
H0难于被拒绝.
如果在 很小的情况下H0仍被拒绝了,则说明实际情况很可能与之有显著差异.
基于这个理由,人们常把 时拒绝H0称为是显著的,而把在 时拒绝H0称为是高度显著的.
在上面的例子的叙述中,我们已经初步介绍了假设检验的基本思想和方法 .
下面,我们给出假设检验的一般步骤 .
二、假设检验的一般步骤
Step1º : 根据问题提出原假设 和备择假设
Step2º : 选取检验统计量 且其抽样分
布中不含任何未知参数,可以查表或通过计算得其
分位数(临界值)
Step3º : 对于给定的显著性水平 找临界值,从而确定
拒绝域,使
Step4º : 判定。若
假设检验会不会犯错误呢?
由于作出结论的依据是下述
小概率原理
小概率事件在一次试验中基本上不会发生 .
不是一定不发生
三、假设检验的两类错误
如果H0成立,但统计量的实测值落入否定域,从而作出否定H0的结论,那就犯了“以真为假”的错误 .
如果H0不成立,但统计量的实测值未落入否定域,从而没有作出否定H0的结论,即接受了错误的H0,那就犯了“以假为真”的错误 .
请看下表
假设检验的两类错误
H0为真
实际情况
决定
拒绝H0
接受H0
H0不真
第一类错误
正确
正确
第二类错误
P{拒绝H0 |H0为真}= ,
P{接受H0 |H0不真}= .
犯两类错误的概率:
显著性水平 为犯第一类错误的概率.
两类错误是互相关联的, 当样本容量固定时,一类错误概率的减少导致另一类错误概率的增加.
要同时降低两类错误的概率 或者要在 不变的条件下降低 ,需要增加样本容量.
两类错误的概率的关系
提出
假设
根据统计调查的目的, 提出
原假设H0 和备选假设H1
作出
决策
抽取
样本
检验
假设
对差异进行定量的分析,
确定其性质(是随机误差
还是系统误差. 为给出两
者界限,找一检验统计量T,
在H0成立下其分布已知.)
拒绝还是不能
拒绝H0
显著性
水平
P(T W)=
-----犯第一
类错误的概率,
W为拒绝域
总 结
检验法
参数的假设检验
一、
例 1 在上节例1中,取=。 问检验打包机的
工作是否正常?
o
注:
1)检验步骤与1相同;
2)单侧(单尾)检验与双侧(双尾)检验。
例 2
假设某次考试数学分数
一中的16名学生其平均成绩为分,试判断该校
的数学成绩是否优于全市平均水平?(=)
,随机抽查市
二、 检验法
o
故的拒绝域为
例3某工厂生产的一种螺钉,标准要求长度是. 实际生产的产品,其长度 假定服从正态分布
未知,现从该厂生产的一批产品中抽取6件, 得尺寸数据如下:
, , , , ,
问这批产品是否合格?
…
分析:这批产品(螺钉长度)的全体组成问题的总体 . 现在要检验 是否为.
提出原假设和备择假设
第一步:
第二步:
能衡量差异大小且分布已知
取一检验统计量,在H0成立下
求出它的分布
第三步:
即“ ”是一个小概率事件 .
小概率事件在一次
试验中基本上不会
发生 .
对给定的显著性水平 ,查表确定临界值 ,使
得否定域 W:
故不能拒绝H0 .
第四步:
将样本值代入算出统计量 t 的实测值,
| t |=<
没有落入
拒绝域
例 4 在漂白工艺中,要考察湿度对针织品断裂强度的
影响,在70℃与80℃下分别作了八次实验,测得断裂
强度数据如下:
70℃
80℃
据经验针织品地断裂强度服从正态分布,问:70℃下
的断裂强度与80℃下的断裂强度有无显著性差异?
三、 检验法
o
例5 某砖厂生产的红砖质量比较稳定,抗压强度的方
差为64,今从一批新砖中任抽10块作抗压强度试验,
得数据如下:
578 572 570 568 572 570 572 596 584 570
问是否可相信这批砖的抗压强度的方差也为64?
( )
由于
拒绝域为
四、 检验法
F 检验法是两正态总体值
方差是否相等和两方差比较进行检验。如第三节例 4
中当检验针织品的断裂强度有无显著差异时,其方差
看作是相等的,这往往是凭经验而言。严格来说,这
是需要经过检验的。
未知的情况下,对其
o
拒绝域
见课本总结表
五、小结
正态母体参数的置信区间
对于总体的未知参数 ,利用点估计可求得其近似值,但
点估计本身既没有反应这种近似值的精确度,又不知道它
的误差范围,因此希望估计出一个范围,并希望知道参数
真值落在这个范围内的可信程度。
一、置信区间的定义
--置信下限
--置信上限
--置信区间的观测值
可靠度与精度是一对矛盾,一般是
在保证可靠度的条件下尽可能提高
精度.
2. 要求 以很大的可能被包含在区间
内,就是说,概率 要尽可能大 .
即要求估计尽量可靠.
3. 估计的精度要尽可能的高. 如要求区间长度
尽可能短,或能体现该要求的其它准则.
在求置信区间时,要查表求分位点.
二、置信区间的求法
若 为连续型随机变量 , 则有
所求置信区间为
或者
取
所求置信区间为
~ N(0, 1)
选 的点估计为 ,
求参数 的置信度为 的置信区间.
例1 设 是取自 的样本,
明确问题,是求什么
参数的置信区间?
置信水平是多少?
寻找未知参
数的一个良
好估计.
解
寻找一个待估参数和
统计量的函数 ,要求
其分布为已知.
有了分布,就可以求出
U取值于任意区间的概率.
对给定的置信水平
查正态分布表得
对于给定的置信水平, 根据U的分布,确定一
个区间, 使得U取值于该区间的概率为置信水平.
使
为什么
这样取?
从中解得
对给定的置信水平
查正态分布表得
使
于是所求 的 置信区间为
从例1解题的过程,我们归纳出求置信区间的一般步骤如下:
1. 明确问题, 是求什么参数的置信区间?
置信水平 是多少?
2. 寻找参数 的一个良好的点估计
T( )
3. 寻找一个待估参数 和估计量 T 的函数
U(T, ),且其分布为已知.
4. 对于给定的置信水平 ,根据U(T, )的分布,确定常数a, b,使得
P(a <U(T, )<b) =
5. 对“a<U(T, )<b”作等价变形,得到如下形式:
可见,确定区间估计很关键的是要寻找一个
待估参数 和估计量T 的函数U(T, ), 且U(T, )
的分布为已知, 不依赖于任何未知参数 .
而这与总体分布有关,所以,总体分布的形式是
否已知,是怎样的类型,至关重要.
需要指出的是,给定样本,给定置信水平 ,置信区间也不是唯一的.
对同一个参数,我们可以构造许多置信区间.
例如,设 是取自 的样本 ,
求参数 的置信水平为 的置
~N(0, 1)
信区间.
由标准正态分布表,对任意a、b,我们可以求得 P( a<U<b) .
~N(0, 1)
例如,由
P(≤U≤)=
我们得到
均值 的置信水平为
的
置信区间为
由 P(≤U≤)=
这个区间比前面一个要长一些.
置信区间为
我们得到
均值 的置信水平为
的
我们总是希望置信区间尽可能短.
类似地,我们可得到若干个不同的置信区间.
任意两个数a和b,只要它们的纵标包含f(u)
下95%的面积,就确定一个95%的置信区间.
在概率密度为单峰且对称的情形,当a =-b时求得的置信区间的长度为最短.
a =-b
即使在概率密度不对称的情形,如 分布,
F分布,习惯上仍取对称的分位点来计算未知参数的置信区间.
我们可以得到未知参数的的任何置信水平小于 1 的置信区间,并且置信水平越高,相应的置信区间平均长度越长.
也就是说,要想得到的区间估计可靠度高,
区间长度就长,估计的精度就差.这是一对矛盾.
实用中应在保证足够可靠的前提下,尽量使
得区间的长度短一些 .
三、 正态总体下的区间估计
由前面推导过程可知,
取统计量
对于对于给定的置信度
,查t分布表,使
从而,
于是得到一个
的置信区间
因而得到初生男婴平均体重的95%置信区间为(2820,3300)
所以取样本函数
对于对于给定的置信度
,查 分布表,使
即
于是得
的 置信区间
取
有
从而, 的置信区间为
函数
取函数
例3 为比较两个小麦品种的产量,选择18块条件相似的试验田,
采用相同的耕作方法做试验,结果播种甲品种的8块试验田的单
位面积产量和播种乙品种的10块试验田的单位面积产量
(单位:kg)分别为:
甲品种 628 583 510 554 612 523 530 615
乙品种 535 433 398 470 567 480 498 560 503 426
假定每个品种的单位面积产量均服从正态分布,试求这两个品种
平均单位面积产量差的置信区间。
解: 设两种品种的产量分别
(1)先检验两种产量的方差是否相等
1°假设
2°取检验统计量
由已给数据算得
3°对于
查F分布表的
4° 因为
所以接受
可以认为
(2) 求置信区间
在 成立的条件下,
三、单侧置信区间
上述置信区间中置信限都是双侧的,但对于有些实际问题,人们关心的只是参数在一个方向的界限.
例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了.
这时, 可将置信上限取为+∞ ,而只着眼于置信下限 ,这样求得的置信区间叫单侧置信区间.
于是引入单侧置信区间和置信限的定义:
定义
对于给定的 (0 < < 1) , 是待估参数
是总体 的样本,
若能确定一
个统计量
使得
则称
为置信度为1 - 的单侧置信区间.
例4 已知灯泡寿命 服从正态分布, 从中随机抽取 5 只作寿命试验, 测得寿命为
1050 , 1100 , 1120 , 1250 , 1280 (小时)
求灯泡寿命均值的单侧置信下限与寿命方差的单侧置信上限.
解
未知
(1) 选取统计量
(2) 选取统计量
若总体 的分布未知, 但样本容量很大, 由中心极限
定理, 可近似地视
若2已知, 则 的置信度为1 - 的置信区间可取为
若2未知, 则 的置信度为1 - 的置信区间可取为
四、 非正态总体均值的区间估计
例5 设 服从参数为 p 的0-1分布, 样本为
求 p 的置信度为 1 的置信区间。
解
( n > 50 ).
(近似)
所以参数 p 的置信区间为( p1, p2 )
令
例6 自一大批产品中抽取100个样品,其中有60
个一级品, 求这批产品的一级品率 p 的置信度
为的置信区间.
p 的置信区间为
解
课堂练习
非参数检验:指总体分布不要求服从正态分布或总
体分布情况不明时,用来检验数据资料是否来自某
一个总体的统计检验方法。
非参数的假设检验
目的:用样本去检验总体的具体分布形式。
分布拟合优度检验
拟合总体的分布函数
拟合总体的概率函数
通常非参数统计方法适用于以下几种情况:
未知分布型,或样本数太少(n6)而使得分布状况尚未显示出来;
非参数性,只能以严重程度、优劣等级、
效果大小、名次先后以及综合判断等方式记录其符号或等级;
分布程度偏态;
组内个别随机变量偏离过大。
一、 概率纸法
直观、简便的方法。
1、 正态概率纸法
正态分布是最常用的分布,用来判断总体分布是否为正态
分布的检验方法称为正态性检验,它在实际问题中大量使用。
正态概率纸可用来作正态性检验。
2、 正态概率纸法原理
设总体
做变换
易知
所以有
把
即
图1
原理总结:利用样本数据在概率纸上描点,用目测方法看这些点是否在一条直线附近,若是的话,可以认为该数据来自正态总体,若明显不在一条直线附近,则认为该数据来自非正态总体。
3、 正态概率纸法步骤
例1 随机选取10个零件,测得其直径与标准尺寸的偏差如下:(单位:丝)
在正态概率纸上作图步骤如下:
(1) 首先将数据排序:
(2)
(2) 对每一个观测值,计算频率:
1
…
…
频 数
…
观测值
采用修正频率:
(3) 将点
逐一点在正态概率纸上;
(4) 观察上述n个点的分布.
若诸点在一条直线附近,则认为该批数据来自正态总体;
若诸点明显不在一条直线附近,则认为该批数据的总体不是正态分布。
从图2可以看到,10个点基本在一条直线附近,
故可认为直径与标准尺寸的偏差服从正态分布。
图2
4、 正态概率纸的参数估计
因为
所以取
则
另外,取
则
如果从正态概率纸上确认总体是非正态分布时,可对原始数据进行变换后再在正态概率纸上描点,若变换后的点在正态概率纸上近似在一条直线附近,则可以认为变换后的数据来自正态分布,这样的变换称为正态性变换。常用的正态性变换有三个:
1)对数变换 ;
2)倒数变换 ;
5、正态性变换
3)根号变换 。
例2 随机抽取某种电子元件10个,测得其寿命数据
如下:
, , , , ,
, , , , .
图3 给出这10个点在正态概率纸上的图形,这10个点
明显不在一条直线附近,所以可以认为该电子元件的
寿命的分布不是正态分布。
图3 例2的正态概率纸
对该10个寿命数据作对数变换,结果见表4。
1
6
2
7
3
8
4
9
5
10
i
i
表4. 对数变换后的数据
利用表4中最后两列上的数据在正态概率
纸上描点,结果见图4,从图上可以看到10个
点近似在一条直线附近,说明对数变换后的
数据可以看成来自正态分布。这也意味着,
原始数据服从对数正态分布.
图4 变换后数据的正态概率纸
在前面的讨论中,概率纸虽然直观简单,但是对参数估计的精度不高,尤其是无法评价犯错误的
概率。从而,无法控制犯错误的概率。
二、卡方拟合优度检验
解决这类问题的方法最早由英国
统计学家 K. Pearson (皮尔逊) 于1900
年在他发表的一篇文章中给出, 该方
法后被称为 Pearsonχ2检验法,简称
χ2检验。
这是一项非常重要的工作,许多学者视它为近代统计学的开端。
判断样本观察频数(Observed frequency)与理论(期望)频数(Expected frequency )之差是否由抽样误差所引起。
原理
不妨设总体 是连续型分布。检验步骤如下:
将总体 的取值范围分成 k 个互不重叠的小区
间 I1, I2, …, Ik,
(2) 计算各子区间 Ii 上的理论频数。
如果总体的分布函数为F(x, θ),那么每个点落在区间 Ii 上的概率均为
n 个点中,理论上有n pi ( )个点落在 Ii
上, (称为理论频数)。当分布函数中含有未知参数
时,理论频数也未知, 要用来估计 n pi ( ),其中 为 的极大似然估。
(3) 计算各子区间 Ii 上的实际频数 ni 。
ni =﹟{ x1, x2, …, xn ∈ Ii } , i=1, 2, …, k .
计数符号,取集
合中元素的个数
(4) 计算理论频数与实际频数的偏差平方和。
可以证明:在 H0 成立,且 n→∞时,
(5) H0 的显著性水平为α 的检验的拒绝域为
注:该检验方法是在 n 充分大时使用的,因而,使用时要注意 n 必须足够地大, 以及 npi 不能太小这两个条件。
在实用上,一般要求 n ≥ 50,以及所有npi ≥5。如果初始子区间划分不满足后一个条件, 则适当地将某些子区间合并,可使 npi 满足上述要求。
例3 卢瑟福在2608个等时间间隔内观测一枚放射性物质放射的粒子数X,下表是观测结果的汇总,其中ni表示2608次观测中放射粒子数为i的次数。试利用该组数据检验该放射物质在单位时间内放射出的粒子数是否服从泊松分布。
ni 57 203 383 525 532 408 273 139 45 27 10 6
i 0 1 2 3 4 5 6 7 8 9 10 11
解:本例中,要检验总体是否服从泊松分布。
观测到 0, 1, …, 11 共 12 个不同取值,这相当于把总体分成12类。这里有一个未知参数 ,采用极大似然估计,
=
将 代入可以估计出诸 。于是可计算出 ,列表如下。
0
1
2
3
4
5
6
7
8
9
10
11
57
203
383
525
532
408
273
139
45
27
10
6
合计
2608
2068
=
i
若取 =,则
本例中 χ2 =<,故接受原假设。使用统计软件可以计算出此处检验的p 值是。
例4:某医院一年中出生的婴儿共计1521人,其中男婴802人,女婴719人。给定 α =,试问:能否认为男婴、女婴出生概率相同?
解:用X 表示服从两点分布的随机变量,X 取0, 1两个值,X=1表示男婴,X=0表是女婴。则问题就是检验假设
H0:p1 = P{X=0}=.
(1) 将 (-∞, ∞) 分成两个区间
计算每个区间上的理论频数。因为两个区间上
的理论概率 p1= p2=, 而 n=1521, 故
(3) 各区间上实际频数:n1=802, n2=719 .
(4) 计算统计量的值
(5) H0 的显著性水平为α的检验
所以,拒绝原假设,即认为男婴女婴出生概率有显著差异。
三、科尔莫哥洛夫检验
卡方检验法的问题
1)分组不同,拟合的结果可能不同;
2)需要有足够的样本含量;
3)对于连续型变量的优度拟合,卡方检验并不是
理想的方法。
统计学家推荐的拟合检验方法是:
1)Shapiro-Wilk检验
2)Kolmogorov-Smirnov检验
思想:比较实际频数与理论频数的累积概率间的差距,找出最大距离D,根据D值来判断实际频数分布是否服从理论频数分布。
科尔莫哥洛夫检验的步骤:
1)把字样观测值从小到大进行排序;
2)算出经验分布函数
3)在原假设H0下,计算观测值处的理论分布函数;
4)计算经验分布函数和理论分布函数的差的绝对值;
5)计算统计量的值;
6)给出显著水平a;由科尔莫哥洛夫检验的临界值表查出:
7)由(5)算出的 , 则拒绝原假设,否则接受原假设。
四、 秩和检验
秩和即秩次的和或等级之和。秩和检验法也叫Mann-Whitney-Wilcoxon检验,它常被译为曼-惠特尼-维尔克松检验,简称M-W-W检验,也称Mann-Whitney Z检验。
1、适用资料
1)秩和检验法与参数检验法中独立样本的t检验法相对应。当“总体正态”这一前提不成立时,不能用t检验,可以用秩和检验法;
2)当两个样本都为定序(顺序)变量时,也需使用秩和法进行差异显著性检验。
2、 秩和检验的步骤
1)小样本:两个样本容量均小于10(n110,n210)
(1)将两个样本数据混合由小到大排列秩次(如果大小相同就计算它们的平均秩次);
(2)把样本容量较小的样本中各数据的秩次相加,以T表示;
(3)建立假设
H0:A = B H1:A B
(4)检验
把T值与秩和检验表中的临界值比较
T T1或T T2,则表明两样本差异显著;
T1 < T <T2,则意味着两样本差异不显著。
例5 医学院试验两种新药治疗贫血病人,两个月后病人的红细胞数(万/毫米3)增加的秩次如下表,试问这两种新药有无显著性差异?(=)
120
120
119
101
85
70
乙药
147
145
134
134
124
120
118
107
甲药
14
13
12
11
10
9
8
7
6
5
4
3
2
1
秩次
解:T = 1+2+3+6+8+8 = 28. 查表,n1 = 6, n2 = 8, = (双测), c1 = 29, c2 = 61
因为:T < c1,所以两种药有显著差异
2)大样本:两个样本容量均大于10(n1>10, n2>10)。可以证明,当n时,T就趋向正态分布,此时,秩和T的分布接近正态分布,可以进行Z检验。其平均数和标准差如下:
例6 有两个水稻品系A与B,分别在10块试验田中作栽培试验,得产量如下表,试问它们的平均产量有无显著性差异?(=)
B
A
200
96
104
合计
100
44
56
服药者
100
52
48
未服药者
合计
未痊愈者
痊愈者
是否痊愈
服何种药
引例 某研究所推出一种感冒特效药,为证明其疗效,
选择200名患者为志愿者。将他们均分为两组,分别不
服药或服药,观察 三日后痊愈的情况,得出下列数据
问:新药是否有效?
五 、 列联表的独立性检验
列联表是将观测数据按两个或更多属性(定性变量) 分类时所列出的频数表。例如,对随机抽取的1000人按性别(男或女)及色觉(正常或色盲) 两个属性分类,得到如下二维列联表,又称2×2表或四格表。
一般,若总体中的个体可按两个属性A与
B分类,A 有r 个类 ,B 有c个类
从总体中抽取大小为n的样本,设
其中有 个个体既属于 类又属于 类,
称为频数,将rc个 排列为一个r行c列的
二维列联表,简称rc表。
表1 rc列联表
列联表分析的基本问题是: 考察各属性之间有无关联,即判别两属性是否独立。如在前例中,问题是:一个人是否色盲与其性别是否有关?在rc表中,若以 , 和 分别表示总体中的个体仅属于 ,仅属于 和同时属于 与 的概率,可得一个二维离散分布表,则“A、B两属性独立”的假设可以表述为
上式中至少对某组i, j 不成立。
表2 二维离散分布表
这就变为上一小节中诸 不完全已知时的分布拟合检验。这里诸 共有rc个参数,在原假设H0成立时,这rc个参数 由r+c个参数 和 决定。在这r+c后个参数中存在两个约束条件:
所以,此时 实际上由r+c-2个独立参数所确定。据此,检验统计量为
在H0成立时,上式服从自由度为rc-(r+c-2)-1的 分布。其中诸 是在H0成立下得到的 极大似然估计,其表达式为
对给定的显著性水平 ,检验的拒绝域为:
例7 设=,检验新药是否有显著性疗效?
解:此为2×2列联表问题
考察的两个指标为: A--是否痊愈,B--是否服药,
要研究的问题是A,B是否独立.
假设
A,B相互独立(是否痊愈与是否服药无关)
取检验统计量
由所给观测值
代入上式得
对于检验水平=,查表得
故接受
即有99%的把握认为这种感冒新药并无显著疗效。
例8 为研究儿童智力发展与营养的关系,某研究机
构调查了1436名儿童,得到如表3的数据,试在显著
性水平下判断智力发展与营 养有无关系。
表3 儿童智力与营养的调查数据
营养良好
营养不良
合计
智 商
合计
342
367
266
329
1304
56
40
20
132
16
423
382
286
345
1436
<80
8090
9099
100
解:用A表示营养状况,它有两个水平: 表示
营养良好, 表示营养不良;B表示儿童智商,
它有四个水平, 分别表示表中四种
情况。沿用前面的记号,首先建立假设
H0:营养状况与智商无关联,即A与B独立的。
统计表示如下:
在原假设H0成立下,我们可以计算诸参数的极大似然估计值:
进而可给出诸 ,如
其它结果见表4
表4 诸 的计算结果
营养良好
营养不良
<80
8090
9099
100
由表3和表4可以计算检验统计量的值
此处r=2,c=4,(r-1)(c-1)=3,若取 = ,
查表有 ,由于>,
故拒绝原假设,认为营养状况对智商有影响。
本例中检验的p 值为。
1、在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.试给出秃顶与患心脏病的列联表并检验秃顶与患心脏病是否相关?
课堂练习
课堂练习
HGJHG