本节内容
程序中t检验在的使用方法
2.百分率资料的假设检验方法
第三节 两个样本平均数差异
显著性检验
两个样本平均数差异显著性检验,因
试验设计不同 ,分为非配对设计和配对设
计两种。检验方法有u检验法和t检验法两
种。
一、非配对设计两个样本平均数
差异显著性检验
非配对设计是将试验单位完全随机地分为
两组,然后再随机地对两组分别实施两个不同
处理;两组试验单位相互独立,所得观测值相
互独立;两个处理的样本容量可以相等,也可
以不相等,所得数据称为非配对数据。这种设
计适用于试验单位比较一致的情况。
【例4·5】 测得马铃薯两个品种鲁引1号
和大西洋的块茎干物质含量结果如 表 4-3 所
示。试检验两个品种马铃薯的块茎干物质含量
有无显著差异。
4-3 两个马铃薯品种干物质含量(%)
1、提出假设
2、计算t值 t值计算公式为
其中, 、 , 、 分别为两样本含
量、平均数; 为样本均数差数标准
误,计算公式为
当 时,
其中, 、 分别为两样本均方。
此例, =, =,
=6, =5
于是
3、统计推断
根据 ,
查附表3得: =
因为计算得的 =< ,故p>
,不能否定H0: ,表明两个马铃
薯品种的块茎干物质含量差异不显著,可以
认为两个马铃薯品种的块茎干物质含量相同。
注意,两个样本平均数差异显著性检验的
无效假设 与备择假设 ,一般如前所述,
但也有例外。例如通过收益与成本的综合经济
分析知道,施用高质量的肥料比施用普通肥料
提高的成本需用产量提高 个单位获得的收益
来相抵,那么在检验施用高质量的肥料比施用
普通肥料收益上是否有差异时 , 无效假设应
为 ,备择假设为
(两尾检验);
在检验施用高质量肥料的收益是否高于施
用普通肥料时,无效假设应为 ,
备择假设为 (一尾检验)。
此时,t检验计算公式为:
二、配对设计两个样本平均数
差异显著性检验
配对设计是指先根据配对的要求将试验单
位两两配对,然后将配成对子的两个试验单位
随机实施某一处理。
配对的要求是,配成对子的两个试验单位
的初始条件尽量一致,不同对子间试验单位的
初始条件允许有差异,每一个对子就是试验处
理的一个重复。
例如,在相邻两个小区、两个盆钵实施
两种不同处理;在同一植株(或器官)的对
称部位上实施两种不同处理;在同一供试单
位上进行处理前和处理后的对比等,都是配
对试验设计,所得观测值称为成对数据。
【例4·7】 选取生长期、发育进度、植
株大小和其他方面皆比较一致的相邻的两块
地(每块地面积为㎡)的红心地瓜苗
构成一组,共得6组。 每组中一块地按标准
化栽培,另一块地进行绿色有机栽培,用来
研究不同栽培措施对产量的影响,得每块地
瓜产量如表4-4所示,试检验两种栽培方式
差异是否显著。
表表4-4 4-4 两种栽培方法的地瓜产量两种栽培方法的地瓜产量 ((kg/
采用两尾t检验法。
1、提出假设 H0: ;
HA: 。
其中, 为第一个样本所在的总体平均数,
为第二个样本所在的总体平均数,
为两个样本各对数据之差数
所在的总体平均数,
2、计算t值 计算公式为,
其中, , 为差数标准
误, 为配对的对子数 。
本例,
[++
+(-)+(-)+(-)]
=
于是,
=
3、统计推断
查 附 表 3,当 时 ,
==,计算所得的 == <<
,故 p p >> ,不 能 否 定 H0:
,表明两种栽培方法的地瓜产
量差异不显著,可以认为两种栽培方法的地
瓜产量相同。
第四节 百分率资料的显著性检验
由具有两个属性类别的质量性状利用统
计次数法得来的次数资料进而计算出的百分
率资料,如结实率、发芽率、病株率、杂株
率以及一对性状的杂交后代中某一性状的植
株占总株数的百分率等是服从二项分布的。
这类百分率资料的假设检验应按二项分布进
行。
当样本含量n足够大 , p不过小,np 和
nq均大于5时,二项分布接近于正态分布,此
时可近似地采用u检验法(称为正态近似法)
对服从二项分布百分率资料进行差异显著性检
验。
适用于正态近似法所需的二项分布百分率
资料的样本含量n见表4-5。
((样样本百分本百分率率)) ((较较小小组组的次数)的次数) ((样样本容量)本容量)
1515
2020
2424
4040
6060
7070
3030
50 50
80 80
200 200
600 600
1,400 1,400
表4-5 适用于正态近似法所需要的二项
分布百分率资料的样本容量n
一、样本百分率与总体百分率
差异显著性检验
检验一个服从二项分布的样本百分率
与已知的二项总体百分率p00差异是否显
著,其目的在于检验一个样本百分率 所
在二项总体百分率 p 是否与已知二项总体
百分率p0相同 ,换句话说,检验该样本百
分率 是否来自总体百分率为p0 的二项
总体。
这里所讨论的百分率是服从二项分布的,
当满足n足够大,p不过小,np和nq均大于5
的条件时,可近似地采用u检验法,即正态
近似法来进行显著性检验;若np和nq均大
于30,不必对u进行连续性矫正。
【例4·8】 用糯玉米和非糯玉米杂
交,预期F1 植株上糯性花粉粒的百分率为
=。现检视150粒花粉,得糯性花粉
68粒,糯性花粉粒百分率 =,问此
结果和理论百分率 =是否相符?
本 例 的糯性花粉粒百分率服从二项分
布,但样本容量n=150n=150较大,np=75 np=75 、nq=75均
大于5(注意,此处假定 ,
来计算np和nq),所以采
用正态近似法来进行显著性检验;且要回答
的问题是糯性花粉粒样本百分率 ==与
理论百分率 ==是否相符,故采用两尾u
检验;由于np=75np=75、nq=75nq=75均大于3030,不必对u进
行连续性矫正。
检验步骤如下:
1、统计假设
H0:
HA: =
2、计算u值 u值的计算公式为:
其中, 为样本百分率, =为已知
总体百分率, 为样本百分率标准误:
其中,n为样本容量。
本例,
于是,
3、统计推断
计算所得的 < ,故p>
,不能否定H0: ,表明糯
性花粉样本百分率 =和
差异不显著,可以认为糯性花粉粒样本百分
率 =所在的总体百分率 与理论百分
率 =相同。
p
二、两个样本百分率差异显著性检验
检 验 服 从 二 项分布的两个样本百分
率 、 差异是否显著,其目的在于检验两
个样本百分率 、 所在的两个总体百分
率 、 是否相同。
当两样本的np、nq均大于5时,可以
采用正态近似法,即u检验法进行检验;若
两样本的np和nq均大于30,不必对u进行
连续性矫正。
【例4·9】 调查春大豆品种 A的 120
个豆荚( =120) ,其 中 有 瘪 荚38荚
(f1=38),瘪荚率%( );调查春大
豆品种B的135个豆荚( =135),其 中有
瘪荚52荚(f2=52),瘪荚率%( )。
试 检 验 这两个品种的瘪荚率差异是否显
著?
本例为服从二项分布的百分率资料,样
本容量较大, =120, =135,且
均大于5 (注意,假
定 成立, 为合并样本百分率,由
(4-22)式计算),可以采用正态近似法 ,
即u检验法进行显著性检验,要回答的问题
是两个品种的瘪荚率差异是否显著 ,故 采
用两尾u检验;由于 , 均
大于30,不必对u进行连续性矫正。
,
检验步骤如下:
1、统计假设
H0: ;
HA: 。
2、计算u值 u值的计算公式为:
其中, , 为两个样本
百分率, 为样本百分率差异标准误,
为合并样本百分率
本例,
=1-=
=
=
=
=
于是,
=
=
=
3、统计推断
由于计算所得的 < =,故
p>,不能否定H0: ,表明两个品
种的瘪荚率差异不显著,可以认为两个品种
的瘪荚率相同。
三、百分率资料显著性检验的连续性矫正
(一) 样本百分率与总体百分率差异显著性检验
的连续性矫正
检验一个服从二项分布的样本百分率与已
知的二项总体百分率差异是否显著 ,当满足n
足够大,p不过小,np和nq均大于5的条件时,
可近似地采用 u检验法,即正态近似法来进行
显著性检验;如果此时np和(或)nq小于或等
于30,还须对u进行连续性矫正。
将连续性矫正后计算的值记为 ,
的计算公式为:
检验的其它步骤同【例4·8】。
(二) 两个样本百分率差异显著性检验的
连续性矫正
检验服从二项分布的两个样本百分率差
异是否显著,当两样本的np、nq均大于5时,
可以采用正态近似法,即u检验法进行检验;
如果此时两样本的np和(或)nq小于或等于
30,还须对u进行连续性矫正。
值的计算公式为:
检验的其它步骤同【例4·9】。
【例4·10】调查大豆A品种20荚,其中
三粒荚14荚,两粒以下荚 6荚,三粒荚百分
率为;B品种25荚,其中三粒荚7荚,两
粒以下荚18荚,三粒荚百分率为 。问
两 个 大豆品种的三粒荚百分率差异是否显
著?
由于本例
=20, =25,
=14, =7
均大于5,可以采用正
态近似法,即u检验法进行显著性检验,要回
答的问题是两个品种的三粒荚百分率差异是
否显著,故采用两尾u检验;但由于小于30,
须对u进行连续性矫正。
检验步骤如下:
1、统计假设
H0: ;
HA: 。
2、计算 值
因为
于是,
3、统计推断
由于计算所得的 介于与之
间,故<p<,否定H0: ,两个
大豆品种的三粒荚百分率差异显著,这里表
现为A品种的三粒荚百分率显著高于B品种。
第五节 参数的区间估计
参数估计就是用样本统计数来估计总体
参数,有点估计和区间估计之分。
将样本统计数直接作为总体相应参数的
估计值叫点估计。点估计只给出了总体参数
的估计值,没有考虑试验误差的影响,也没
有指出估计的可靠程度。
区间估计是在一定概率保证下给出总体
参数的可能范围 ,所给出的可能范围叫置信
区间 ,给出的概率保证称为置信度或置信概
率 。
一、正态总体平均数 的置信区间
设有一来自正态总体的样本,包含 个观
测值 ,样本平均数 ,
标准误 ,总体平均数为 。
因为 服从自由度为 -
1的 分布,两尾概率为 时,有:
P(
也就是说, 在区间 内取值的可
能性为1- ,即:
对 变形得:
亦即
( 4-25)式称为总体平均数 置信度为
1- 的置信区间,
称为置信半径;
L1 = 和L2= 分别称为置
信下限和置信上限;
置信上、下限之差称为置信距,置信距
越小,估计的精确度越高。
总体平均数 的95%和99%的置信
区间如下:
【例4·11】 测得某高产 、抗病小
麦品种的8个千粒重,计算得千粒重平均数
=,标准误 。试求该品
种小麦千粒重在置信度为 95% 的置信区
间。
查 附 表 3 , 当 df =(8-1)= 7 时,
得 , 故95%的置信度区间为:
((--××))g≤ ≤(+×)gg≤ ≤(+×)g
≤ ≤
说明置信度为95%时,该高产、抗病小麦
品种的千粒重在—之间。
二、二项总体百分率 的置信区间
求总体百分率的置信区间有两种方法:
正态近似法和查表法,这里仅介绍正态近似
法。
当 ,p 时,总体百分率
p的95%、99%置信区间为:
其中, 为样本百分率, 为样本百
分率标准误, 的计算公式为:
【例4·12】 调查某品种水稻1200株,受
二化螟危害的有200株,即 =200/1200=。
试估计置信度为95%的二化螟危害率的置信区间。
先计算样本百分率标准误 ,得:
置信下限L1和置信上限L2为:
L1=-×=
L2=+×=
即水稻二化螟危害率的95%置信区间为
%—%。