第五章 平均水平的比较
第一节 Means过程
主要功能
实例操作
第二节 Independent-Samples T Test过程
主要功能
实例操作
第三节 Paired-Samples T Test过程
主要功能
实例操作
第四节 One-Way ANOVA过程
主要功能
实例操作
在正态或近似正态分布的计量资料中(如临床常见的体温、血压、脉搏、身高、体重等测量值,几乎均为此类资料),经常在使用前一章计量资料描述过程分析后,还要进行组与组之间平均水平的比较。本章将分四节分别介绍这一统计方法:即常用的t检验和单因素方差分析。
第一节 Means过程
主要功能
与第四章中Descriptives过程相比,若仅仅计算单一组别的均数和标准差,Means过程并无特别之处;但若用户要求按指定条件分组计算均数和标准差,如分性别同时分年龄计算各组的均数和标准差,则用Means过程更显简单快捷。
实例操作
[例5.1]某医师测得如下血红蛋白值(g%),试作基本的描述性统计分析:
数据准备
激活数据管理窗口,定义变量名:性别为sex,年龄为age,血红蛋白值为hb。按顺序输入数据(sex变量中,男为1,女为2),结果见图。
统计分析
激活Statistics菜单选Compare Means中的Means...项,弹出Means对话框(如图示)。今欲分性别同时分年龄求血红蛋白值的均数和标准差,故在对话框左侧的变量列表中选hb,点击(钮使之进入Dependent List框,选sex 点击(钮使之进入Independent List框,点击Next,可选定分组的第二层次(Layer 2 of 2),选age 点击(钮亦使之进入Independent List框。点击Options...可选统计项目:在Cell Displays项中,Mean为均数、Standard deviation为标准差、Variance为方差、Count为观察单位数、Sum为观察值总和,在Statistics for First Layer项中,将为第一层次的分组计算方差分析(ANOVA table and eta)和线性检验(Test of linearity)。选好后点击Continue钮返回Means对话框,点击OK钮即可。
结果解释
在结果输出窗口中将看到如下统计数据:
For Entire Population一行表示40个观察值合计为,均数为,标准差为,方差为,例数为40;接下去各行分别表示先按性别分组(分男性与女性),再按年龄分组(16,17,18岁三组)的观察值合计、均数、标准差、方差和例数。
若在Independent List中未分层次,即sex和age一起放在Layer 1 of 1中,则结果是分别计算男性与女性(不作年龄分组)、16,17,18岁三组(不作性别分组)的观察值合计、均数、标准差、方差和例数(如下所示)。
第二节 Independent-Samples T Test过程
主要功能
调用此过程可完成两样本均数差别的显著性检验,即通常所说的两组资料的t检验。
实例操作
[例5.2]分别测得14例老年性慢性支气管炎病人及11例健康人的尿中17酮类固醇排出量(mg/dl)如下,试比较两组均数有无差别。
病 人
健康人
数据准备
激活数据管理窗口,定义变量名:把实际观察值定义为x,再定义一个变量group来区分病人与健康人。输入原始数据,在变量group中,病人输入1,健康人输入2。结果如图所示。
统计分析
激活Statistics菜单选Compare Means中的Independent-samples T Test...项,弹出Independent- samples T Test对话框(如图示)。从对话框左侧的变量列表中选x,点击(钮使之进入Test Variable(s)框,选group 点击(钮使之进入Grouping Variable框,点击Define Groups...钮弹出Define Groups定义框,在Group 1中输入1,在Group 2中输入2,点击Continue钮,返回Independent-samples T Test对话框,点击OK钮即完成分析。
结果解释
在结果输出窗口中将看到如下统计数据:
t-tests for independent samples of GROUP
Number
Variable of Cases Mean SD SE of Mean
---------------------------------------------------------------
X
GROUP 1 14 .387
GROUP 2 11 .523
---------------------------------------------------------------
Mean Difference =
Levene's Test for Equality of Variances: F= .440 P= .514
这一部分显示两组资料的例数(Numbers of cases)、均数(Mean)、标准差(SD)和标准误(SE of Mean),显示两均数差值为,经方差齐性检验: F= .440 P= .514,即两方差齐。
t-test for Equality of Means 95%
Variances t-value df 2-Tail Sig SE of Diff CI for Diff
-----------------------------------------------------------------------
Equal 23 .084 .637 (, .167)
Unequal .093 .651 (, .213)
-----------------------------------------------------------------------
这一部分显示t检验的结果,第一行表示方差齐情况下的t检验的结果,第二行表示方差不齐情况下的t检验的结果。依次显示值(t-value)、自由度(df)、双侧检验概率(2-Tail Sig)、差值的标准误(SE of Diff)及其95%可信区间(Cl for Diff)。因本例属方差齐性,故采用第一行(即Equal)结果:t=,P=,差别有显著性意义,即老年性慢性支气管炎病人的尿中17酮类固醇排出量低于健康人。
第三节 Paired-Samples T Test过程
主要功能
调用此过程可完成配对资料的显著性检验,即配对t检验。在医学领域中,主要的配对资料包括:同对(年龄、性别、体重、病况等非处理因素相同或相似者)或同一研究对象分别给予两种不同处理的效果比较,以及同一研究对象处理前后的效果比较。前者推断两种效果有无差别,后者推断某种处理是否有效。
实例操作
[例5.2]某单位研究饲料中缺乏维生素E与肝中维生素A含量的关系,将大白鼠按性别、体重等配为8对,每对中两只大白鼠分别喂给正常饲料和维生素E缺乏饲料,一段时期后将之宰杀,测定其肝中维生素A含量((mol/L)如下,问饲料中缺乏维生素E对鼠肝中维生素A含量有无影响?
大白鼠对别
肝中维生素A含量((mol/L)
正常饲料组
维生素E缺乏饲料组
1
2
3
4
5
6
7
8
数据准备
激活数据管理窗口,定义变量名:正常饲料组测定值为x1,维生素E缺乏饲料组测定值为x2,数据输入后结果如图所示。
统计分析
激活Statistics菜单选Compare Means中的Paired-samples T Test...项,弹出Paried-samples T Test对话框(如图示)。从对话框左侧的变量列表中点击x1,这时在左下方的Current Selections框中Variable 1处出现x1,再从变量列表中点击x2,左下方的Current Selections框中Variable 2处出现x2。点击(钮使x1、x2进入Variables框,点击OK钮即完成分析。
结果解释
在结果输出窗口中将看到如下统计数据:
- - - t-tests for paired samples - - -
Number of 2-tail
Variable pairs Corr Sig Mean SD SE of Mean
--------------------------------------------------------------------------------------------------------------
X1
8 .586 .127
X2
-------------------------------------------------------------------------------
这段结果显示本例共有8对观察值,相关系数(C)为,相关系数的显著性检验表明P=;变量x1的均数(Mean)、标准差(SD)、标准误(SE of Mean)分别为、、,变量x2的均数、标准差、标准误分别为、、。
Paired Differences |
Mean SD SE of Mean | t-value df 2-tail Sig
----------------------------------------------------|--------------------------------------------------
| 7 .004
95% CI (, ) |
这段结果显示变量x1、x2两两相减的差值均数、标准差、标准误95%可信区间(95% Cl)分别为、、,95%可信区间(95% Cl)为,。配对检验结果为:t=, P=, 差别具高度显著性意义,即饲料中缺乏维生素E对鼠肝中维生素A含量确有影响。
第四节 One-Way ANOVA过程
主要功能
在实际研究中,经常需要比较两组以上样本均数的差别,这时不能使用t检验方法作两两间的比较(如有人对四组均数的比较,作6次两两间的t检验),这势必增加两类错误的可能性(如原先(定为,这样作多次的t检验将使最终推断时的(>)。故对于两组以上的均数比较,必须使用方差分析的方法,当然方差分析方法亦适用于两组均数的比较。方差分析可调用此过程可完成。
本过程只能进行单因素方差分析,即完全随机设计资料的方差分析。对于随机区组设计资料方差分析的方法,将在第五章介绍。
实例操作
[例5.4]某单位研究两种不同制剂治疗钩虫的效果,用大白鼠作试验。11只大白鼠随机分配于3组:一组为对照组、另外二组分别为使用甲、乙制剂的实验组。试验方法是:用药前每鼠人工感染500条钩蚴,感染后第8天实验组分别给予甲、乙制剂,对照组不给药,第10天全部解剖检查鼠体内活虫数,结果如下,问两制剂是否有效?
对照组
甲制剂组
乙制剂组
279
334
303
338
298
129
174
110
210
285
117
数据准备
激活数据管理窗口,定义变量名:实际观察值定义为x,组别用变量range表示:其中对照组的值为、甲制剂实验组的值为、乙制剂实验组的值为,输入后的结果如图所示。
统计分析
激活Statistics菜单选Compare Means中的One-Way ANOVA...项,弹出One-Way ANOVA 对话框(如图示)。从对话框左侧的变量列表中选x,点击(钮使之进入Dependent List框,选range 点击(钮使之进入Factor框,点击Define Range钮打开One-Way ANOVA: Define Range 对话框,因本例为3组比较,故在Minimum处输入1,在Maximum处输入3,点击Continue钮返回One-Way ANOVA 对话框。如果欲作多个样本均数间两两比较,可点击该点击对话框的Post Hoc...钮打开One-Way ANOVA: Post Hoc Multiple Comparisons对话框(如图所示),这时可见在Tests框中有7种比较方法供选择:
Least-significant difference:最小显著差法。(可指定0~1之间任何显著性水平,默认值为;
Bonferroni:Bonferroni修正差别检验法。(可指定0~1之间任何显著性水平,默认值为;
Duncan’s multiple range test:Duncan多范围检验。只能指定(为或或,默认值为;
Student-Newman-Keuls:Student-Newman-Keuls检验,简称N-K检验,亦即q检验。(只能为;
Tukey’s honestly significant difference:Tukey显著性检验。(只能为;
Tukey’s b:Tukey另一种显著性检验。(只能为;
Scheffe:Scheffe差别检验法。(可指定0~1之间任何显著性水平,默认值为。
本例选用Student-Newman-Keuls显著性检验法。在Sample Size Estimate框中有Harmonic average of pairs和Harmonic average of all groups两选项,前者表示仅采用相互比较两组的调和均数,后者表示采用所有组(含比较的两组和尚未比较的其他组)的调和均数,本例选用前者,点击Continue钮返回One-Way ANOVA 对话框后,再点击OK钮即完成分析。
结果解释
在结果输出窗口中将看到如下统计数据:
- - - - - O N E W A Y - - - - -
Variable X
By Variable RANGE
Analysis of Variance
Sum of Mean F F
Source . Squares Squares Ratio Prob.
Between Groups 2 .0033
Within Groups 8
Total 10
上述结果显示组间、组内(实际上本例应称之为“剩余”)和合计的自由度(.)、离均差平方和(Sum of Squares,即SS)、均方(Means Squares,即SS)、F值(F Ratio)和P值(F Prob.),本例F=,P=,表明甲、乙两种制剂中必有一种制剂治疗钩虫是有效的。
为了解哪一种制剂是有效的,本例采用SNK两两比较法,结果如下:
- - - - - O N E W A Y - - - - -
Variable X
By Variable RANGE
Multiple Range Tests: Student-Newman-Keuls test with significance level .050
The difference between two means is significant if
MEAN(J)-MEAN(I) >= * RANGE * SQRT(1/N(I) + 1/N(J))
with the following value(s) for RANGE:
Step 2 3
RANGE
(*) Indicates significant differences which are shown in the lower triangle
G G G
r r r
p p p
2 3 1
Mean RANGE
Grp 2
Grp 3
Grp 1 * *
上述结果显示:如果两均数的差值 ×RANGE×,则差别有显著性意义。上面已用“*”标出2、3两组与1组比较均有显著性差异。具体作法是:以甲制剂与对照组的比较为例,均数差值 = - = ,已知RANGE为,n1=5,n2=3,按上式求得,因 > ,故甲制剂有效;余同。即甲、乙制剂治疗钩虫均有效。因甲制剂与乙制剂比较,均数差值为,按上式求得界值为,故尚无证据表明甲、乙制剂间效果有差别。
1