智库文档所有分类

概论论语数理统计教程_第7章_假设检验.ppt

下载

用户#259

155页 | 3.92MB | 0次下载 |

0.0

(0人评价)

我要评价：

投诉举报

用手机看文档

扫一扫,手机看文档

下载

开通VIP

假设检验参数假设检验非参数假设检验这类问题称作假设检验问题 . 总体分布已知，检验关于未知参数的某个假设总体分布未知时的假设检验问题我们将讨论不同于参数估计的另一类重要的统计推断问题. 这就是根据样本的信息检验关于总体的某个假设是否正确. 第7章假设检验假设检验的基本思想和概念例1 工厂中自动打包机打包，每包重量每包重应为50kg,由于机器存在误差，打包重量并不是50kg，现从中任取9包，测得问：打包机工作是否正常？例2 学生的考试成绩是否服从正态分布？例3 某研究所推出一种感冒特效药，为证明其疗效，选择200名患者为志愿者。将他们均分为两组，分别不服药或服药，观察三日后痊愈的情况，得出下列数据： 200 96 104 合计 100 44 56 服药者 100 52 48 未服药者合计未痊愈者痊者问：新药是否有明显疗效？例1—例3所要解决的问题可转化下述问题：例1 例2 例3 生产流水线上罐装可乐不断地封装，然后装箱外运. 怎么知道这批罐装可乐的容量是否合格呢？把每一罐都打开倒入量杯, 看看容量是否合于标准. 这样做显然不行！罐装可乐的容量按标准应在 350毫升和360毫升之间. 一、基本概念和思想每隔一定时间，抽查若干罐 . 如每隔1小时，抽查5罐，得5个容量的值，根据这些值来判断生产是否正常. 如发现不正常，就应停产，找出原因，排除故障，然后再生产；如没有问题，就继续按规定时间再抽样，以此监督生产，保证质量. 通常的办法是进行抽样检查. 在正常生产条件下，由于种种随机因素的影响，每罐可乐的容量应在355毫升上下波动. 这些因素中没有哪一个占有特殊重要的地位. 因此，根据中心极限定理，假定每罐容量服从正态分布是合理的. 现在我们就来讨论这个问题. 罐装可乐的容量按标准应在 350毫升和360毫升之间. 它的对立假设是：称H0为原假设（或零假设）；称H1为备选假设（或对立假设）. 在实际工作中，往往把不轻易否定的命题作为原假设. H0：（ = 355） H1：这样，我们可以认为是取自正态总体的样本，是一个常数. 当生产比较稳定时，现在要检验的假设是：那么，如何判断原假设H0 是否成立呢？较大、较小是一个相对的概念，合理的界限在何处？应由什么原则来确定？由于是正态分布的期望值，它的估计量是样本均值，因此可以根据与的差距来判断H0 是否成立. 较小时，可以认为H0是成立的；当生产已不正常. 当较大时，应认为H0不成立，即问题归结为对差异作定量的分析，以确定其性质. 差异可能是由抽样的随机性引起的，称为 “抽样误差”或随机误差这种误差反映偶然、非本质的因素所引起的随机波动. 然而，这种随机性的波动是有一定限度的，如果差异超过了这个限度，则我们就不能用抽样的随机性来解释了. 必须认为这个差异反映了事物的本质差别，即反映了生产已不正常. 这种差异称作 “系统误差” 问题是，根据所观察到的差异，如何判断它究竟是由于偶然性在起作用，还是生产确实不正常？即差异是“抽样误差”还是“系统误差”所引起的？这里需要给出一个量的界限 . 问题是：如何给出这个量的界限？这里用到人们在实践中普遍采用的一个原则：小概率事件在一次试验中基本上不会发生 . 现在回到我们前面罐装可乐的例中：在提出原假设H0后，如何作出接受和拒绝H0的结论呢？在假设检验中，我们称这个小概率为显著性水平，用表示. 常取的选择要根据实际情况而定。提出假设选检验统计量 ~ N(0,1) H0： = 355 H1： ≠ 355 由于已知，它能衡量差异大小且分布已知 . 对给定的显著性水平，可以在N(0,1)表中查到分位点的值，使故我们可以取拒绝域为：也就是说,“ ”是一个小概率事件. W：如果由样本值算得该统计量的实测值落入区域W，则拒绝H0 ；否则，不能拒绝H0 . 如果H0 是对的，那么衡量差异大小的某个统计量落入区域 W(拒绝域) 是个小概率事件. 如果该统计量的实测值落入W，也就是说， H0 成立下的小概率事件发生了，那么就认为H0不可信而否定它. 否则我们就不能否定H0 （只好接受它）. 这里所依据的逻辑是：不否定H0并不是肯定H0一定对，而只是说差异还不够显著，还没有达到足以否定H0的程度 . 所以假设检验又叫 “显著性检验” 如果显著性水平取得很小，则拒绝域也会比较小. 其产生的后果是： H0难于被拒绝. 如果在很小的情况下H0仍被拒绝了，则说明实际情况很可能与之有显著差异. 基于这个理由，人们常把时拒绝H0称为是显著的，而把在时拒绝H0称为是高度显著的. 在上面的例子的叙述中，我们已经初步介绍了假设检验的基本思想和方法 . 下面，我们给出假设检验的一般步骤 . 二、假设检验的一般步骤 Step1º : 根据问题提出原假设和备择假设 Step2º : 选取检验统计量且其抽样分布中不含任何未知参数，可以查表或通过计算得其分位数（临界值） Step3º : 对于给定的显著性水平找临界值，从而确定拒绝域，使 Step4º : 判定。若假设检验会不会犯错误呢？由于作出结论的依据是下述小概率原理小概率事件在一次试验中基本上不会发生 . 不是一定不发生三、假设检验的两类错误如果H0成立，但统计量的实测值落入否定域，从而作出否定H0的结论，那就犯了“以真为假”的错误 . 如果H0不成立，但统计量的实测值未落入否定域，从而没有作出否定H0的结论，即接受了错误的H0，那就犯了“以假为真”的错误 . 请看下表假设检验的两类错误 H0为真实际情况决定拒绝H0 接受H0 H0不真第一类错误正确正确第二类错误 P{拒绝H0 |H0为真}= , P{接受H0 |H0不真}= . 犯两类错误的概率: 显著性水平为犯第一类错误的概率. 两类错误是互相关联的，当样本容量固定时，一类错误概率的减少导致另一类错误概率的增加. 要同时降低两类错误的概率或者要在不变的条件下降低，需要增加样本容量. 两类错误的概率的关系提出假设根据统计调查的目的, 提出原假设H0 和备选假设H1 作出决策抽取样本检验假设对差异进行定量的分析，确定其性质(是随机误差还是系统误差. 为给出两者界限，找一检验统计量T，在H0成立下其分布已知.）拒绝还是不能拒绝H0 显著性水平 P(T W)= -----犯第一类错误的概率， W为拒绝域总结检验法参数的假设检验一、例 1 在上节例1中，取=。问检验打包机的工作是否正常？ o 注： 1）检验步骤与1相同； 2）单侧（单尾）检验与双侧（双尾）检验。例 2 假设某次考试数学分数一中的16名学生其平均成绩为分，试判断该校的数学成绩是否优于全市平均水平？（=） ,随机抽查市二、检验法 o 故的拒绝域为例3某工厂生产的一种螺钉，标准要求长度是. 实际生产的产品，其长度假定服从正态分布未知，现从该厂生产的一批产品中抽取6件, 得尺寸数据如下: , , , , , 问这批产品是否合格? … 分析：这批产品(螺钉长度)的全体组成问题的总体 . 现在要检验是否为. 提出原假设和备择假设第一步：第二步：能衡量差异大小且分布已知取一检验统计量，在H0成立下求出它的分布第三步：即“ ”是一个小概率事件 . 小概率事件在一次试验中基本上不会发生 . 对给定的显著性水平，查表确定临界值，使得否定域 W: 故不能拒绝H0 . 第四步：将样本值代入算出统计量 t 的实测值, | t |=< 没有落入拒绝域例 4 在漂白工艺中，要考察湿度对针织品断裂强度的影响，在70℃与80℃下分别作了八次实验，测得断裂强度数据如下： 70℃ 80℃ 据经验针织品地断裂强度服从正态分布，问：70℃下的断裂强度与80℃下的断裂强度有无显著性差异？三、检验法 o 例5 某砖厂生产的红砖质量比较稳定，抗压强度的方差为64，今从一批新砖中任抽10块作抗压强度试验，得数据如下： 578 572 570 568 572 570 572 596 584 570 问是否可相信这批砖的抗压强度的方差也为64？（）由于拒绝域为四、检验法 F 检验法是两正态总体值方差是否相等和两方差比较进行检验。如第三节例 4 中当检验针织品的断裂强度有无显著差异时，其方差看作是相等的，这往往是凭经验而言。严格来说，这是需要经过检验的。未知的情况下，对其 o 拒绝域见课本总结表五、小结正态母体参数的置信区间对于总体的未知参数，利用点估计可求得其近似值，但点估计本身既没有反应这种近似值的精确度，又不知道它的误差范围，因此希望估计出一个范围，并希望知道参数真值落在这个范围内的可信程度。一、置信区间的定义 --置信下限 --置信上限 --置信区间的观测值可靠度与精度是一对矛盾，一般是在保证可靠度的条件下尽可能提高精度. 2. 要求以很大的可能被包含在区间内，就是说，概率要尽可能大 . 即要求估计尽量可靠. 3. 估计的精度要尽可能的高. 如要求区间长度尽可能短，或能体现该要求的其它准则. 在求置信区间时，要查表求分位点. 二、置信区间的求法若为连续型随机变量 , 则有所求置信区间为或者取所求置信区间为 ~ N(0, 1) 选的点估计为 , 求参数的置信度为的置信区间. 例1 设是取自的样本，明确问题,是求什么参数的置信区间? 置信水平是多少？寻找未知参数的一个良好估计. 解寻找一个待估参数和统计量的函数，要求其分布为已知. 有了分布，就可以求出 U取值于任意区间的概率. 对给定的置信水平查正态分布表得对于给定的置信水平, 根据U的分布，确定一个区间, 使得U取值于该区间的概率为置信水平. 使为什么这样取？从中解得对给定的置信水平查正态分布表得使于是所求的置信区间为从例1解题的过程，我们归纳出求置信区间的一般步骤如下: 1. 明确问题, 是求什么参数的置信区间? 置信水平是多少? 2. 寻找参数的一个良好的点估计 T( ) 3. 寻找一个待估参数和估计量 T 的函数 U(T, ),且其分布为已知. 4. 对于给定的置信水平，根据U(T, )的分布，确定常数a, b，使得 P(a <U(T, )<b) = 5. 对“a<U(T, )<b”作等价变形,得到如下形式: 可见，确定区间估计很关键的是要寻找一个待估参数和估计量T 的函数U(T, ), 且U(T, ) 的分布为已知, 不依赖于任何未知参数 . 而这与总体分布有关，所以，总体分布的形式是否已知，是怎样的类型，至关重要. 需要指出的是，给定样本，给定置信水平，置信区间也不是唯一的. 对同一个参数，我们可以构造许多置信区间. 例如，设是取自的样本，求参数的置信水平为的置 ~N(0, 1) 信区间. 由标准正态分布表，对任意a、b，我们可以求得 P( a<U<b) . ~N(0, 1) 例如，由 P(≤U≤)= 我们得到均值的置信水平为的置信区间为由 P(≤U≤)= 这个区间比前面一个要长一些. 置信区间为我们得到均值的置信水平为的我们总是希望置信区间尽可能短. 类似地，我们可得到若干个不同的置信区间. 任意两个数a和b，只要它们的纵标包含f(u) 下95%的面积，就确定一个95%的置信区间. 在概率密度为单峰且对称的情形，当a =-b时求得的置信区间的长度为最短. a =-b 即使在概率密度不对称的情形，如分布， F分布，习惯上仍取对称的分位点来计算未知参数的置信区间. 我们可以得到未知参数的的任何置信水平小于 1 的置信区间，并且置信水平越高，相应的置信区间平均长度越长. 也就是说，要想得到的区间估计可靠度高，区间长度就长，估计的精度就差.这是一对矛盾. 实用中应在保证足够可靠的前提下，尽量使得区间的长度短一些 . 三、正态总体下的区间估计由前面推导过程可知，取统计量对于对于给定的置信度，查t分布表，使从而，于是得到一个的置信区间因而得到初生男婴平均体重的95%置信区间为（2820，3300）所以取样本函数对于对于给定的置信度，查分布表，使即于是得的置信区间取有从而，的置信区间为函数取函数例3 为比较两个小麦品种的产量，选择18块条件相似的试验田，采用相同的耕作方法做试验，结果播种甲品种的8块试验田的单位面积产量和播种乙品种的10块试验田的单位面积产量（单位:kg）分别为：甲品种 628 583 510 554 612 523 530 615 乙品种 535 433 398 470 567 480 498 560 503 426 假定每个品种的单位面积产量均服从正态分布，试求这两个品种平均单位面积产量差的置信区间。解: 设两种品种的产量分别（1）先检验两种产量的方差是否相等 1°假设 2°取检验统计量由已给数据算得 3°对于查F分布表的 4° 因为所以接受可以认为（2）求置信区间在成立的条件下，三、单侧置信区间上述置信区间中置信限都是双侧的，但对于有些实际问题，人们关心的只是参数在一个方向的界限. 例如对于设备、元件的使用寿命来说，平均寿命过长没什么问题，过短就有问题了. 这时, 可将置信上限取为+∞ ，而只着眼于置信下限，这样求得的置信区间叫单侧置信区间. 于是引入单侧置信区间和置信限的定义：定义对于给定的  (0 <  < 1) ,  是待估参数是总体的样本, 若能确定一个统计量使得则称为置信度为1 -  的单侧置信区间. 例4 已知灯泡寿命服从正态分布, 从中随机抽取 5 只作寿命试验, 测得寿命为 1050 , 1100 , 1120 , 1250 , 1280 (小时) 求灯泡寿命均值的单侧置信下限与寿命方差的单侧置信上限. 解未知 (1) 选取统计量 (2) 选取统计量若总体的分布未知, 但样本容量很大, 由中心极限定理, 可近似地视若2已知, 则  的置信度为1 -  的置信区间可取为若2未知, 则  的置信度为1 -  的置信区间可取为四、非正态总体均值的区间估计例5 设服从参数为 p 的0-1分布, 样本为求 p 的置信度为 1   的置信区间。解 ( n > 50 ). (近似) 所以参数 p 的置信区间为( p1, p2 ) 令例6 自一大批产品中抽取100个样品,其中有60 个一级品, 求这批产品的一级品率 p 的置信度为的置信区间. p 的置信区间为解课堂练习非参数检验：指总体分布不要求服从正态分布或总体分布情况不明时，用来检验数据资料是否来自某一个总体的统计检验方法。非参数的假设检验目的：用样本去检验总体的具体分布形式。分布拟合优度检验拟合总体的分布函数拟合总体的概率函数通常非参数统计方法适用于以下几种情况：未知分布型，或样本数太少(n6)而使得分布状况尚未显示出来；非参数性，只能以严重程度、优劣等级、效果大小、名次先后以及综合判断等方式记录其符号或等级；分布程度偏态；组内个别随机变量偏离过大。一、概率纸法直观、简便的方法。 1、正态概率纸法正态分布是最常用的分布，用来判断总体分布是否为正态分布的检验方法称为正态性检验，它在实际问题中大量使用。正态概率纸可用来作正态性检验。 2、正态概率纸法原理设总体做变换易知所以有把即图1 原理总结：利用样本数据在概率纸上描点，用目测方法看这些点是否在一条直线附近，若是的话，可以认为该数据来自正态总体，若明显不在一条直线附近，则认为该数据来自非正态总体。 3、正态概率纸法步骤例1 随机选取10个零件，测得其直径与标准尺寸的偏差如下：（单位：丝）在正态概率纸上作图步骤如下： (1) 首先将数据排序： (2) (2) 对每一个观测值，计算频率: 1 … … 频数 … 观测值采用修正频率: (3) 将点逐一点在正态概率纸上; (4) 观察上述n个点的分布. 若诸点在一条直线附近,则认为该批数据来自正态总体；若诸点明显不在一条直线附近，则认为该批数据的总体不是正态分布。从图2可以看到，10个点基本在一条直线附近，故可认为直径与标准尺寸的偏差服从正态分布。图2 4、正态概率纸的参数估计因为所以取则另外，取则如果从正态概率纸上确认总体是非正态分布时，可对原始数据进行变换后再在正态概率纸上描点，若变换后的点在正态概率纸上近似在一条直线附近，则可以认为变换后的数据来自正态分布，这样的变换称为正态性变换。常用的正态性变换有三个： 1）对数变换； 2）倒数变换； 5、正态性变换 3）根号变换。例2 随机抽取某种电子元件10个,测得其寿命数据如下: , , , , , , , , , . 图3 给出这10个点在正态概率纸上的图形，这10个点明显不在一条直线附近，所以可以认为该电子元件的寿命的分布不是正态分布。图3 例2的正态概率纸对该10个寿命数据作对数变换,结果见表4。 1 6 2 7 3 8 4 9 5 10 i i 表4. 对数变换后的数据利用表4中最后两列上的数据在正态概率纸上描点，结果见图4，从图上可以看到10个点近似在一条直线附近，说明对数变换后的数据可以看成来自正态分布。这也意味着，原始数据服从对数正态分布. 图4 变换后数据的正态概率纸在前面的讨论中，概率纸虽然直观简单，但是对参数估计的精度不高，尤其是无法评价犯错误的概率。从而，无法控制犯错误的概率。二、卡方拟合优度检验解决这类问题的方法最早由英国统计学家 K. Pearson (皮尔逊) 于1900 年在他发表的一篇文章中给出, 该方法后被称为 Pearsonχ2检验法，简称 χ2检验。这是一项非常重要的工作,许多学者视它为近代统计学的开端。判断样本观察频数（Observed frequency）与理论(期望)频数（Expected frequency ）之差是否由抽样误差所引起。原理不妨设总体是连续型分布。检验步骤如下：将总体的取值范围分成 k 个互不重叠的小区间 I1, I2, …, Ik， (2) 计算各子区间 Ii 上的理论频数。如果总体的分布函数为F(x, θ)，那么每个点落在区间 Ii 上的概率均为 n 个点中，理论上有n pi ( )个点落在 Ii 上, (称为理论频数)。当分布函数中含有未知参数时，理论频数也未知，要用来估计 n pi ( )，其中为的极大似然估。 (3) 计算各子区间 Ii 上的实际频数 ni 。 ni =﹟{ x1, x2, …, xn ∈ Ii } ， i=1, 2, …, k . 计数符号，取集合中元素的个数 (4) 计算理论频数与实际频数的偏差平方和。可以证明：在 H0 成立，且 n→∞时, (5) H0 的显著性水平为α 的检验的拒绝域为注：该检验方法是在 n 充分大时使用的，因而，使用时要注意 n 必须足够地大, 以及 npi 不能太小这两个条件。在实用上，一般要求 n ≥ 50，以及所有npi ≥5。如果初始子区间划分不满足后一个条件, 则适当地将某些子区间合并，可使 npi 满足上述要求。例3 卢瑟福在2608个等时间间隔内观测一枚放射性物质放射的粒子数X，下表是观测结果的汇总，其中ni表示2608次观测中放射粒子数为i的次数。试利用该组数据检验该放射物质在单位时间内放射出的粒子数是否服从泊松分布。 ni 57 203 383 525 532 408 273 139 45 27 10 6 i 0 1 2 3 4 5 6 7 8 9 10 11 解：本例中，要检验总体是否服从泊松分布。观测到 0, 1, …, 11 共 12 个不同取值，这相当于把总体分成12类。这里有一个未知参数 ，采用极大似然估计， = 将代入可以估计出诸。于是可计算出，列表如下。 0 1 2 3 4 5 6 7 8 9 10 11 57 203 383 525 532 408 273 139 45 27 10 6 合计 2608 2068 = i 若取 =，则本例中 χ2 =<，故接受原假设。使用统计软件可以计算出此处检验的p 值是。例4：某医院一年中出生的婴儿共计1521人,其中男婴802人，女婴719人。给定 α =，试问：能否认为男婴、女婴出生概率相同？解：用X 表示服从两点分布的随机变量,X 取0, 1两个值，X=1表示男婴，X=0表是女婴。则问题就是检验假设 H0：p1 = P{X=0}=. (1) 将 (-∞, ∞) 分成两个区间计算每个区间上的理论频数。因为两个区间上的理论概率 p1= p2=, 而 n=1521, 故 (3) 各区间上实际频数：n1=802， n2=719 . (4) 计算统计量的值 (5) H0 的显著性水平为α的检验所以，拒绝原假设，即认为男婴女婴出生概率有显著差异。三、科尔莫哥洛夫检验卡方检验法的问题 1）分组不同，拟合的结果可能不同； 2）需要有足够的样本含量； 3）对于连续型变量的优度拟合，卡方检验并不是理想的方法。统计学家推荐的拟合检验方法是： 1）Shapiro-Wilk检验 2）Kolmogorov-Smirnov检验思想：比较实际频数与理论频数的累积概率间的差距，找出最大距离D，根据D值来判断实际频数分布是否服从理论频数分布。科尔莫哥洛夫检验的步骤： 1）把字样观测值从小到大进行排序； 2）算出经验分布函数 3）在原假设H0下，计算观测值处的理论分布函数； 4）计算经验分布函数和理论分布函数的差的绝对值； 5）计算统计量的值； 6）给出显著水平a；由科尔莫哥洛夫检验的临界值表查出： 7）由（5）算出的，则拒绝原假设，否则接受原假设。四、秩和检验秩和即秩次的和或等级之和。秩和检验法也叫Mann-Whitney-Wilcoxon检验，它常被译为曼－惠特尼－维尔克松检验，简称M-W-W检验，也称Mann-Whitney Z检验。 1、适用资料 1）秩和检验法与参数检验法中独立样本的t检验法相对应。当“总体正态”这一前提不成立时，不能用t检验，可以用秩和检验法； 2）当两个样本都为定序（顺序）变量时，也需使用秩和法进行差异显著性检验。 2、秩和检验的步骤 1）小样本：两个样本容量均小于10（n110,n210）（1）将两个样本数据混合由小到大排列秩次（如果大小相同就计算它们的平均秩次）；（2）把样本容量较小的样本中各数据的秩次相加，以T表示；（3）建立假设 H0：A = B H1：A  B （4）检验把T值与秩和检验表中的临界值比较 T  T1或T  T2，则表明两样本差异显著； T1 < T <T2,则意味着两样本差异不显著。例5 医学院试验两种新药治疗贫血病人，两个月后病人的红细胞数(万/毫米3)增加的秩次如下表，试问这两种新药有无显著性差异？(=) 120 120 119 101 85 70 乙药 147 145 134 134 124 120 118 107 甲药 14 13 12 11 10 9 8 7 6 5 4 3 2 1 秩次解：T = 1+2+3+6+8+8 = 28. 查表，n1 = 6, n2 = 8,  = (双测),  c1 = 29, c2 = 61 因为：T < c1，所以两种药有显著差异 2）大样本：两个样本容量均大于10（n1>10, n2>10）。可以证明，当n时，T就趋向正态分布，此时，秩和T的分布接近正态分布，可以进行Z检验。其平均数和标准差如下：例6 有两个水稻品系A与B，分别在10块试验田中作栽培试验，得产量如下表，试问它们的平均产量有无显著性差异？(=) B A 200 96 104 合计 100 44 56 服药者 100 52 48 未服药者合计未痊愈者痊愈者是否痊愈服何种药引例某研究所推出一种感冒特效药，为证明其疗效，选择200名患者为志愿者。将他们均分为两组，分别不服药或服药，观察三日后痊愈的情况，得出下列数据问：新药是否有效？五、列联表的独立性检验列联表是将观测数据按两个或更多属性(定性变量) 分类时所列出的频数表。例如，对随机抽取的1000人按性别（男或女）及色觉(正常或色盲) 两个属性分类,得到如下二维列联表，又称2×2表或四格表。一般,若总体中的个体可按两个属性A与 B分类，A 有r 个类，B 有c个类从总体中抽取大小为n的样本，设其中有个个体既属于类又属于类，称为频数，将rc个排列为一个r行c列的二维列联表，简称rc表。表1 rc列联表列联表分析的基本问题是: 考察各属性之间有无关联，即判别两属性是否独立。如在前例中，问题是：一个人是否色盲与其性别是否有关？在rc表中，若以，和分别表示总体中的个体仅属于，仅属于和同时属于与的概率,可得一个二维离散分布表，则“A、B两属性独立”的假设可以表述为上式中至少对某组i, j 不成立。表2 二维离散分布表这就变为上一小节中诸不完全已知时的分布拟合检验。这里诸共有rc个参数，在原假设H0成立时，这rc个参数由r+c个参数和决定。在这r+c后个参数中存在两个约束条件：所以，此时实际上由r+c-2个独立参数所确定。据此，检验统计量为在H0成立时，上式服从自由度为rc-(r+c-2)-1的分布。其中诸是在H0成立下得到的极大似然估计，其表达式为对给定的显著性水平 ，检验的拒绝域为: 例7 设=，检验新药是否有显著性疗效？解：此为2×2列联表问题考察的两个指标为: A--是否痊愈，B--是否服药，要研究的问题是A,B是否独立. 假设 A，B相互独立（是否痊愈与是否服药无关）取检验统计量由所给观测值代入上式得对于检验水平=，查表得故接受即有99%的把握认为这种感冒新药并无显著疗效。例8 为研究儿童智力发展与营养的关系，某研究机构调查了1436名儿童，得到如表3的数据，试在显著性水平下判断智力发展与营养有无关系。表3 儿童智力与营养的调查数据营养良好营养不良合计智商合计 342 367 266 329 1304 56 40 20 132 16 423 382 286 345 1436 <80 8090 9099 100 解：用A表示营养状况，它有两个水平：表示营养良好，表示营养不良；B表示儿童智商, 它有四个水平，分别表示表中四种情况。沿用前面的记号，首先建立假设 H0：营养状况与智商无关联，即A与B独立的。统计表示如下：在原假设H0成立下，我们可以计算诸参数的极大似然估计值: 进而可给出诸，如其它结果见表4 表4 诸的计算结果营养良好营养不良 <80 8090 9099 100 由表3和表4可以计算检验统计量的值此处r=2，c=4，(r-1)(c-1)=3,若取 = ，查表有，由于>，故拒绝原假设，认为营养状况对智商有影响。本例中检验的p 值为。 1、在某医院，因为患心脏病而住院的665名男性病人中，有214人秃顶，而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.试给出秃顶与患心脏病的列联表并检验秃顶与患心脏病是否相关？课堂练习课堂练习 HGJHG

联系我们

智库文档公众号

客服微信

概论论语数理统计教程_第7章_假设检验.ppt

下载

标签

相关文档

联系我们

意见反馈