智库文档所有分类

第四章假设检验.ppt

下载

Schmelke

96页 | 2.12MB | 3次下载 |

3.0

(3人评价)

我要评价：

投诉举报

用手机看文档

扫一扫,手机看文档

下载

开通VIP

第四章假设检验第一节第二节第三节假设检验的基本概念正态总体参数的假设检验非正态总体的假设检验第四节第五节检验的p值分布拟合检验【教学目的与要求】通过本章的教学，使学生理解假设检验的基本思想；熟练掌握关于单个和两个正态总体均值与方差的假设检验。第四章假设检验引言制药公司开发研制新的药物时，药物筛选成为需要面临的一个极其重要的决策问题药物筛选过程中有两种可能的行为 “拒绝”开发的新药，这意味着所检验的药物无效或只有微弱的效果。此时采取的行动就是将该药物废弃暂时”接受”开发的新药，此时需要采取的行动是对该药物进行进一步的细致试验根据两种可能出现的研究结果，人们提出了如下相应的假设形式 H0：新药对治疗某种特定疾病无效(或效果微弱) H1：新药对治疗某种特定疾病有效假设检验是对总体的未知参数或总体服从的分布等，首先提出某种假设，例如假设未知参数为某一常数或总体服从某已知分布等，然后由样本提供的信息，对所做假设的“真实性”做出否定还是不否定，即拒绝还是接受的判定。假设检验问题分为如下两大类：参数假设检验：对总体中某个数字特征或分布中的参数提出假设检验。非参数假设检验：对总体的分布、总体间的独立性以及是否同分布等方面的检验。本章主要介绍假设检验的基本概念、思想方法，讨论正态与非正态总体参数的检验、检验的P值、分布拟合检验等。引言第一节假设检验的基本概念问题的提出假设检验的基本步骤假设检验的两类错误检验函数与势函数一二三四五假设检验的原理与思想一、问题的提出先看如下例子检验是对假设而言的。假设是对事物的某种“看法”或“陈述”，假设检验是要根据样本值去判断一个假设是否成立。假设分如下两种：原假设(或零假设) H0 ：通常将不应轻易加以否定的假设做为原假设。备择假设H1：在原假设被拒绝后可供选择的假设。备择假设H1是和原假设H0不相容的。备择假设比原假设还重要，这要由实际问题来确定，一般把期望出现的结论作为备择假设。原假设与备择假设选取以便于数学处理为宜。一、问题的提出什么是小概率？在随机抽样的前提下，小概率事件在一次试验中是几乎不可能发生的。若在一次试验中小概率事件发生了，则我们就有理由怀疑试验的前提。小概率由研究者事先确定。概率意义的反证法？先假设一个命题成立，在该命题之下若能导出小概率事件发生了，则怀疑原命题。以一定的概率保证度，来推翻或保留命题。不是一定不发生！假设检验的基本思想：带有概率特征的反证法。即逻辑上运用反证法，统计上依据小概率原理。二、假设检验的原理与思想三、假设检验的基本步骤第一步：建立假设依据实际问题建立一对假设，【例】的假设为关于未知参数的某个命题（又已知信息得到）研究者想收集证据予以反对的假设又称“0假设” 总是有符号 ,  或 表示为 H0 研究者想收集证据予以支持的假设也称“研究假设”或“替换假设” 总是有符号 , 或  表示为 H1 原假设和备择假设是一个完备事件组，而且相互对立在一项假设检验中，原假设和备择假设必有一个成立，而且只有一个成立先确定备择假设，再确定原假设等号“=”总是放在原假设上因研究目的不同，对同一问题可能提出不同的假设(也可能得出不同的结论) 提出假设(结论与建议) 三、假设检验的基本步骤用单侧检验还是双侧检验，使用左侧检验还是右侧检验，决定于备择假设中的不等式形式与方向。备择假设没有特定的方向性，并含有“”符号的假设检验，称为双侧检验或双尾检验(two-tailed test) 备择假设具有特定的方向性，并含有符号“>”或“<”的假设检验，称为单侧检验或单尾检验(one-tailed test) 备择假设的方向为“<”，称为左侧检验备择假设的方向为“>”，称为右侧检验三、假设检验的基本步骤第一步：建立假设单侧检验（例子）例如，采用新技术生产后，将会使产品的使用寿命明显延长到1500小时以上属于研究中的假设建立的原假设与备择假设应为 H0:   1500 H1:   1500 例如，改进生产工艺后，会使产品的废品率降低到2%以下属于研究中的假设建立的原假设与备择假设应为 H0:   2% H1:  < 2% 三、假设检验的基本步骤第一步：建立假设提出原假设: H0:   10000 选择备择假设: H1:  < 10000 例如，该批产品的平均使用寿命超过10000小时吗?(属于检验声明的有效性，先提出原假设) 单侧检验（例子）提出原假设: H0:   25 选择备择假设: H1: :   25 例如，学生中经常上网的人数超过25%吗?（属于研究中的假设，先提出备择假设）三、假设检验的基本步骤第一步：建立假设三、假设检验的基本步骤第二步：选择检验统计量，给出拒绝域形式在与两者中做出一个选择，也即完成一次判断，必须建立一个检验法则，而由样本对原假设进行判断总是通过一个统计量完成的，该统计量称为检验统计量。一般而言，检验统计量的选择应该使在、分别成立时，统计量的值有较大差异，从而能够做出判断。根据样本观测结果计算得到的，并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布检验统计量(test statistic) 标准化的检验统计量三、假设检验的基本步骤第二步：选择检验统计量，给出拒绝域形式第二步：选择检验统计量，给出拒绝域形式什么是显著性水平？ 1. 是一个概率值。当原假设为真时，拒绝原假设的概率。被称为抽样分布的拒绝域 2. 通常值取, ,  3. 由研究者事先确定三、假设检验的基本步骤第三步：选择显著性水平三、假设检验的基本步骤第四步：确定临界值，给出拒绝域 W 给定显著性水平，查表得出相应的临界值u或u/2， t或t/2 将检验统计量的值与 水平的临界值进行比较作出决策双侧检验：|统计量| > 临界值，拒绝H0 左侧检验：统计量 < -临界值，拒绝H0 右侧检验：统计量 > 临界值，拒绝H0 第五步：根据样本做出判断三、假设检验的基本步骤提出假设根据统计调查的目的, 提出原假设H0 和备选假设H1 作出决策抽取样本检验假设对差异进行定量的分析，确定其性质(是随机误差还是系统误差。为给出两者界限，找一检验统计量T，在H0成立下其分布已知.）拒绝还是不能拒绝H0 显著性水平 P(T W)= 犯第一类错误的概率，W为拒绝域   如果H0成立，但统计量的实测值落入否定域，从而作出否定H0的结论，那就犯了“弃真”的错误。如果H0不成立，但统计量的实测值未落入否定域，从而没有作出否定H0的结论，即接受了错误的H0，那就犯了“取伪”的错误。四、假设检验中的两类错误假设检验会不会犯错误呢？ H0: 无罪正确错误有罪错误正确无罪有罪无罪实际情况裁决陪审团审判正确决策 1- 弃真错误拒绝H0 取伪错误正确决策 1- 未拒绝H0 H0为假 H0为真实际情况决策 H0 检验假设检验就好像一场审判过程统计检验过程四、假设检验中的两类错误五、检验函数与势函数五、检验函数与势函数五、检验函数与势函数由此可知，两类错误有如下的关系：   和 的关系就像翘翘板，小 就大， 大 就小五、检验函数与势函数五、检验函数与势函数一、单个正态总体均值的假设检验 1、方差已知时关于均值的u检验 2、方差已知时关于均值的t检验二、两个正态总体均值差的检验 1、方差已知时均值差的u检验 2、方差未知但相等时均值差的t检验 3、方差未知时均值差的近似检验三、单个正态总体方差的假设检验四、两个正态总体方差比的检验第二节正态总体参数的假设检验一、单个正态总体均值的假设检验设是来自正态总体的样本，对均值考虑如下的检验：称(１)、(２)为单侧检验，(３)为双侧检验。主要分三种情况讨论。一、单个正态总体均值的假设检验对单侧检验（１） 1、方差已知时关于均值的u检验一、单个正态总体均值的假设检验 1、方差已知时关于均值的u检验例题分析【例1】一种罐装饮料采用自动生产线生产，每罐的容量是255ml，标准差为5ml。为检验每罐容量是否符合要求，质检人员在某天生产的饮料中随机抽取了40罐进行检验，测得每罐平均容量为。取显著性水平= ，检验该天生产的饮料容量是否符合标准要求？双侧检验解：临界值(c): 检验统计量：决策：不拒绝H0 结论：样本提供的证据还不足以推翻“该天生产的饮料符合标准要求 ”的看法。一、单个正态总体均值的假设检验 2、方差已知时关于均值的t检验【例2】一种机床加工的零件尺寸绝对平均误差为。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低，从某天生产的零件中随机抽取50个进行检验。利用这些样本数据，检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低？(=) 50个零件尺寸的误差数据 (mm) 例题分析左侧检验【例2】解：临界值(c): 检验统计量：决策：拒绝H0 结论：新机床加工的零件尺寸的平均误差与旧机床相比有显著降低。【例3】某一小麦品种的平均产量为5200kg/hm2 。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高，随机抽取了36个地块进行试种，得到的样本平均产量为5275kg/hm2，标准差为120/hm2 。试检验改良后的新品种产量是否有显著提高？ (=) 右侧检验解：临界值(c): 检验统计量：结论：改良后的新品种产量有显著提高。决策：拒绝H0 (P = < = ) 例题分析  是否已知小样本容量n 大  是否已知是 u 检验否 u 检验是 u 检验否 t 检验一、单个正态总体均值的假设检验二、两个正态总体均值差的检验设是来自总体服从的样本，是来自总体服从的样本，且两样本相互独立，考虑如下的三种检验：主要分两种情况讨论。二、两个正态总体均值差的检验 1、方差已知时均值差的u检验二、两个正态总体均值差的检验 2、方差未知但相等时均值差的检验二、两个正态总体均值差的检验 2、方差未知但相等时均值差的检验【例】为比较两种农药残留时间（单位：d）的长短，现分别取12块地施甲种农药，10块地施乙种农药，经一段时间后，分别测得结果为：例题分析假设两药的残留时间均服从正态分布且方差相等，试问两种农药的残留时间有无显著差异？（=）解此为12 =22= 2但未知时，两个正态总体均值差的t检验。 H0：1=  2； H1：  1≠  2 所以在显著性水平=下接受H0，认为两种农药的残留时间无显著差异。例题分析二、两个正态总体均值差的检验更多的情况是总体分布未知，要对两个总体的均值差进行检验。要解决这类问题，通常的方法是取两个大样本，由中心极限定理知，当H0：μ1=μ2为真时当12, 22未知时，分别用s12, s22代替它们，有这就是说，尽管两个总体的分布未知，但只要是大样本，无论方差知否，均可用u 检验进行均值差的显著性检验。 3、方差未知时均值差的近似检验由于u=，所以拒绝H0接受H1，即认为作物甲的产量比作物乙的低。【例】甲乙两种作物分别在两地种植，设管理条件相同，收获时得以下结果：甲：n1=400, 1hm2平均产量乙：n2=550, 1hm2平均产量问甲的产量是否比乙的低？（=）解这是两个总体分布及其方差均未知，对总体均值差的检验，由于是大样本，故为u 检验。H0： μ1=μ2； H1：μ1＜μ2 例题分析三、单个正态总体方差的假设检验设总体来自该总体的样本，对方差考虑如下的三种检验：主要分两种情况讨论。三、单个正态总体方差的假设检验 1、未知时方差的检验三、单个正态总体方差的假设检验 2、已知时方差的检验三、单个正态总体方差的假设检验 2、已知时方差的检验【例6】已知某种棉花的纤度服从N(, ) ，2003年从中任取8个样品，测得纤度为, , , , , , , .问2003年棉花纤度的方差与已知纤度的方差是否相同？(=) 解这是未知情况下，对总体方差的双侧检验. H0: 2 =02 (=) 由于n = 8，02 = ，且由样本观察值计算得 =， S2 = = 对=，查 2 分布表得所以接受H0，认为2003年棉花纤度的方差与无显著不同。例题分析四、两个正态总体方差比的检验设是来自总体服从的样本，是来自总体服从的样本，且两样本相互独立，考虑如下的三种检验：四、两个正态总体方差比的检验四、两个正态总体方差比的检验解此题是两正态总体方差未知，亦不知是否齐性的情况下对两总体均值差的检验。须先作方差齐性检验，再用 t 检验。（1）假设H0: 12 =22，H1: 12 ≠ 22 所以接受H0，即认为方差是齐性的。若含氮量都服从正态分布，问其含氮量是否相同？(=) 【例】甲乙两种氮肥，其含氮量的抽样数据分别为：例题分析已得到方差齐性的结论，已经满足t 检验的条件。进而检验 H0: μ1=μ2 统计量的值所以接受H0，认为两种氮肥的含氮量基本相同(无显著差异)。例题分析第三节非正态总体参数的假设检验一、大样本下参数的假设检验 1、大样本下样本均值的渐近分布 2、大样本下样本均值的假设检验二、 0-1总体参数的假设检验 1、单个总体参数（比率）的检验 2、两个总体参数（比率）的比较检验若总体X的分布未知，均值和方差2存在，(x1, x2, …, xn)是来自总体X的一个大样本(n≥50)，由独立同分布的中心极限定理，对任意实数x，都有当2已知，且H0 ： =  0为真时一、大样本下参数的假设检验【例】某果园，苹果树剪枝前平均每株产苹果52kg，剪枝后任取50株单独采收，经核算平均株产量为54kg，标准差s=8kg，试问剪枝是否提高了株产量？解此为总体分布未知且方差亦未知的大样本下，对μ的假设检验问题。 H0: μ=52；H1: μ>52 查表得=, =. 故当 =时拒绝H0接受H1；=时接受H0。例题分析在产品检验，森林树木病害率调查以及药效对比等试验中，常用到总体比率的检验，本节就大样本的情况下，讨论总体比率差异性的检验。设p为总体X的比率，是来自总体X的样本，是样本均值，p0（0＜p0＜1）为已知常数，要检验的假设为 H0：p=p0 由中心极限定理，当H0为真时于是检验过程完全同于u检验，不再赘述。二、 0-1总体参数的假设检验 1、单个总体参数（比率）的检验【例】某种子站有一批种子，按规定发芽率不低于95%才可出售，今从中任取500粒作发芽试验，有480粒出芽，问这批种子可否出售？（α=）解设这批种子（总体）的发芽率为p，则要检验的假设为 H0：p=； H1：p<。故接受H0，认为该批种子的发芽率不低于95%，可以出售。例题分析在分析对比试验结果时，常用到两个总体频率差异性的检验，设p1和p2分别是独立总体X和Y的频率，分别X和Y的样本均值，n1和n2分别是X和Y的样本容量。检验假设为二、 0-1总体参数的假设检验 2、两个总体参数（比率）的比较检验二、 0-1总体参数的假设检验 2、两个总体参数（比率）的比较检验什么是 P 值：拒绝原假设的最小显著性水平第四节检验的P 值 P值告诉我们：如果原假设是正确的话，我们得到目前这个样本数据的可能性有多大，如果这个可能性很小，就应该拒绝原假设； P值被称为观察到的(或实测的)显著性水平；决策规则： 1. 单侧检验若p值  ,保留 H0 若p值 < , 拒绝 H0 2. 双侧检验若p值  /2, 保留 H0 若p值 < /2, 拒绝 H0 一、P值的概念双侧检验的P 值第四节检验的P 值二、基于p值的假设检验左侧检验的P 值第四节检验的P 值二、基于p值的假设检验右侧检验的 P 值第四节检验的P 值二、基于p值的假设检验原假设的可信度有多高？如果H0所代表的假设是人们多年来一直相信的，就需要很强的证据(小的P值)才能说服他们拒绝的结论是什么？如果拒绝H0而肯定H1 ，就需要有很强的证据显示要支持H1。比如，H1代表要花很多钱把产品包装改换成另一种包装，你就要有很强的证据显示新包装一定会增加销售量(因为拒绝H0要花很高的成本) 显著性检验的目的是要描述样本所提供不利于原假设的证据有多强。P值就在做这件事。但是，要证明原假设不正确，P值要多小，才能令人信服呢？这要根据两种情况来确定第四节检验的P 值有了P值，我们并不需要用5%或1%这类传统的显著性水平。P值提供了更多的信息，它让我们可以选择任意水平来评估结果是否具有统计上的显著性，从而可根据我们的需要来决定是否要拒绝原假设只要你认为这么大的P值就算是显著了，你就可以在这样的P值水平上拒绝原假设传统的显著性水平，如1%、5%、10%等等，已经被人们普遍接受为“拒绝原假设足够证据”的标准，我们大概可以说：10%代表有“一些证据”不利于原假设；5%代表有“适度证据”不利于原假设；1%代表有“很强证据”不利于原假设固定显著性水平是否有意义? 第四节检验的P 值 1、用P值进行检验比根据统计量检验提供更多的信息 2、统计量检验是我们事先给出的一个显著性水平，以此为标准进行决策，无法知道实际的显著性水平究竟是多少比如，根据统计量进行检验时，只要统计量的值落在拒绝域，我们拒绝原假设得出的结论都是一样的，即结果显著。但实际上，统计量落在拒绝域不同的地方，实际的显著性是不同的。比如，统计量落在临界值附近与落在远离临界值的地方，实际的显著性就有较大差异。而P值给出的是实际算出的显著水平，它告诉我们实际的显著性水平是多少 P 值决策与统计量的比较第四节检验的P 值 1、与其人为地把显著性水平固定按某一水平上，不如干脆选取检验统计量的P值； 2、与其大致知道犯第Ⅰ错误的概率，不如干脆知道一个确切的犯第Ⅰ类错误的概率(P值)； 3、与其为选取“适当的”的而苦恼，不如干脆把真正的 (P值)算出来。 P 值决策与统计量的比较(结论) 第四节检验的P 值一、非参数检验方法简介非参数统计是一种不要求变量值为某种特定分布和不依赖某种特定理论的统计方法，或者是在不了解总体分布及其全部参数的情况下的统计方法。非参数统计方法开始于20世纪中期，早期的符号检验可以追溯到18世纪。实际工作中，有许多资料常不能确定或假设其总体变量值的分布，因此参数统计不宜使用，不知道总分布，就不能比较参数，而只能比较非参数。所谓非参数，即指数据的正负符号，大小顺序号，综合判断所划分的名次、严重程度、优劣等级等，利用直接说明或比较两个或几个样本的非参数的方法均属于非参数统计法。第五节分布拟合检验参数检验：指总体分布服从正态分布或总体分布已知条件下的统计检验。非参数检验：指总体分布不要求服从正态分布或总体分布情况不明时，用来检验数据资料是否来自同一个总体的统计检验方法。一、非参数检验方法简介第五节分布拟合检验通常非参数统计方法适用于以下几种情况: 未知分布型，或样本数太少(n6)而使得分布状况尚未显示出来非参数性，只能以严重程度、优劣等级、效果大小、名次先后以及综合判断等方式记录其符号或等级分布程度偏态组内个别随机变量偏离过大。一、非参数检验方法简介第五节分布拟合检验 (1)对总体分布函数F(x)的假设检验 (2)对随机变量的独立性、相关性的假设检验 H0: F(x)= F0(x)， H1: F(x)≠ F0(x) 【例如】 1、考察某一产品的质量指标打算用正态分布模型 2、考察一种元件的寿命打算用指数分布模型 3、一个骰子是否是均匀的？假设 H0：X~N(, 2) 假设 H0 ：X服从参数为的指数分布假设 H0 ：这个骰子是均匀的这里主要介绍拟合优度检验（卡方检验法）和正态性检验。一、非参数检验方法简介第五节分布拟合检验设 X为未知总体，(x1，x2，…，xn)为大样本(n≥50)，欲检验 H0: F(x)= F0(x)， H1: F(x)≠ F0(x) 把实数轴(-∞，+∞)分成k个互不相交的区间： (-∞, a1], (a1, a2], …, (ak-2, ak-1], (ak-1, +) 记a0=-∞, ak=+, Ii=(ak-2, ak-1] (i=1,2,…,k-1) , Ik=(ak-1, +)， ni为样本观测值（X的取值）落在第i个小区间Ii 的个数, pi 为X取值落入第i个小区间Ii的概率，0<pi<1, i=1,2, …,k, 则 pi= P{ ai-1<X< ai } = F0(ai)—F0(ai-1)，i=1,2,…,k. 二、拟合优度检验第五节分布拟合检验构造统计量： K. Pearson和联合证明了：定理不论F0(x)是何分布函数，只要n充分大(n≥50)，当假设H0成立时，上述2统计量都近似地服从自由度为k-r-1的2 分布。其中r是F0(x)中未知参数的个数。称ni为实测频数，vi=npi为理论频数。称这类检验为拟合优度检验。对于给定的，查2分布表得临界值2(k-r-1)，使二、拟合优度检验第五节分布拟合检验由样本值计算出2 统计量的值，当 2 ﹥2(k-r-1) 时拒绝H0 2 ≤2(k-r-1) 时接受H0 可见，皮尔逊定理（准则）适用于实测频数与理论频数相比较的问题。二、拟合优度检验第五节分布拟合检验几点注释 ①若分布函数F0(x)的类型未知，可由实际问题分析或由样本观察数据的直方图来推测。 ②若已知F0(x) 分布类型，还有r个参数未知时，须先用极大似然估计法求出未知参数的估计值，然后再作假设。 ③此检验要求一定是大样本，一般n≥50。至于k的大小，对于正态总体，样本容量n与区间个数k要满足渐近最优关系 k=(n-1) 74 56 30 22 16 12 9 k 10000 2000 1000 500 200 100 50 N 二、拟合优度检验第五节分布拟合检验 ④ 若理论频数vi=npi＜5时，则将相临的小区间合并，直至全部npi ≥5（合并区间的同时，也将实测频数合并），合并后的小区间数设为k*，则此时2统计量的由度变为 df = k*-r-1 ⑤手工计算时常采用公式二、拟合优度检验第五节分布拟合检验例1 设从总体X中抽取120个样本观察值，经计算整理得下表，试检验X服从正态分布。（=） 120 ∑ 6 （219，+∞） 9 8 （216，219] 8 14 （213，216] 7 22 （210，213] 6 23 （207，210] 5 20 （204，207] 4 14 （201，204] 3 7 （198，201] 2 6 （-∞，198] 1 ni 小区间组号例题分析解这里只给出了分布类型，有两个待估参数与2。用极大似然法对与2作出估计，得到故提出假设 H0: X 服从N( 209 , ) H1: X不服从 N(209, ) =()-()=. 类似地算得: p3=, p4=, p5=, p6=, p7=, p8=, p9=. 例题分析由 n =120，算得统计量的值由于所以接受H0，认为X 服从N(209 ,). =, k=9, r=2. 查表得临界值例题分析【例2】对200个电池做寿命试验，(ti-1,ti)表示以小时计的时间区间(i=1,2,…,6)，在=下，试检验电池寿命X服从指数分布。 200 ∑ 1 （25, 30） 6 2 （20, 25） 5 4 （15, 20） 4 15 （10, 15） 3 45 （5, 10） 2 133 （0, 5） 1 ni （ti-1, ti）组序解首先，用样本观察值对未知参数作极大似然估计。以xi表示区间(ti-1, ti)的中点（也称为组中值），则例题分析故提出假设 H0：X服从 =的指数分布。当H0为真时，有类似地算出： p3 =, p4 =, p5 =, p6 =. 各vi=npi分别为： , , , , , . 由于v5和v6都小于5，且合并后仍小于5，故与v4合并. 例题分析由= 得由于2﹤2(k-r-1)，故接受H0，即认为X服从参数= 的指数分布。 200 200  － 7 4 － 15 3 － 45 2 133 1 (ni-npi)2/npi ni-npi vi=npi ni 组序例题分析【例3】从同类产品中，任取n = 200 批，质检结果如下表，其中xi表示各批产品中次品数，ni表示有xi件次品的批数，试在显著性水平 =下，检验次品件数X 服从泊松分布。 200 2 4 22 56 116 ni  4 3 2 1 0 xi 5 4 3 2 1 序号解先用极大似然估计法求估计值于是认为F0(x)是参数为=的泊松分布的分布函数，分布律为检验假设为H0: X服从=的泊松分布例题分析当 H0成立时，算得 2 =，由于2＜ 2(k―r―1)，所以接受H0，即认为X服从=的泊松分布。类似地算出 p3=， p4=， p5=. 再算出理论频数npi分别为，，，，. 例题分析统计量实质是适合性检验是用样本提供的信息去推断总体分布是否适合某种已知的规律。适合性检验二、拟合优度检验【例4】某地区1993年新生婴儿1284个，其中男婴692个，试问婴儿的性别比是否正常？( =) 解检验假设为 H0：男:女=1:1 , H1：男:女≠1:1 当H0为真时，有对于＝，查表得临界值由于所以拒绝H0，即认为该地区1993年新生婴儿性别的比例失调。例题分析【例5】按孟德尔遗传学说，将两种豌豆杂交后，可产出数量之比为 9:3:3:1 的 A、B、C、D 四种不同的种子。今在一试验中共收了189粒种子，A、B、C、D各类型的分别为102粒、30粒、42粒和5粒。问在 =下，该结果是否符合孟德尔遗传学说的结果？解检验假设为 H0：A:B:C:D=9:3:3:1，即试验结果适合孟德尔学说实测频数为102，30，42和15，且当H0成立时理论频数为同样可计算出B、C、D型种子的理论频数依次为 vB=，vC=，vD=. 例题分析由=得临界值由于于是有故接受H0，即认为试验结果与孟德尔学说的结果相符合。例题分析独立性检验是对两个总体，或两组资料，或一总体的两种指标（分类、特性、特征）等之间的独立性所进行的检验。因此，若设X和Y是两个总体（或一个总体的两个指标），则其假设应为： H0：两总体X与Y相互独立将X和Y的可能的取值范围分成互不相交的r个组和s个组：A1, A2, …, Ar和B1, B2, …, Bs. 在总体(X, Y)中随机抽取样本 (x1, y1), (x2, y2), …, (xn, yn). 记Ai与Bj的每一个搭配(Ai, Bj)所包括的样本个数为cij(i=1,2,…, r; j=1,2,…,s), cij即为实测频数且列联表的独立性检验二、拟合优度检验由cij构成r×s列联表。(X, Y)落入(Ai, Bj)概率的估计值为当H0成立时，则有于是理论频数的估计值为根据皮尔逊准则，对于给定的 ，查表得临界值列联表的独立性检验用于判断总体分布是否为正态分布的检验称为正态性检验。正态检验的方法很多，Wilk-Shapiro的W检验和Epps-Pulley的EP检验是最好的，它们犯第二类错误的概率最小。 (1)小样本（）场合的W检验三、正态性检验第五节分布拟合检验三、正态性检验 (2)大样本（）场合的EP检验三、正态性检验 As a result of this class, you will be able to ... Rejection region does NOT include critical value. Rejection region does NOT include critical value.

联系我们

智库文档公众号

客服微信

第四章假设检验.ppt

下载

标签

联系我们

意见反馈