SPSS FOR WINDOWS
简明教程
二○○二年三月
目 录
第一章 SPSS 的安装与概貌 ..........................................................................................................................7
第一节 SPSS 的安装 ..............................................................................................................................7
SPSS 简介 ...............................................................................................................................7
SPSS 的安装 ...........................................................................................................................7
第二节 SPSS 的界面初识 .....................................................................................................................10
SPSS 的启动 .........................................................................................................................10
SPSS 的主窗口 .....................................................................................................................11
SPSS 的菜单 .........................................................................................................................11
SPSS 的其他窗口 .................................................................................................................12
SPSS 的退出 .........................................................................................................................12
SPSS 的求助系统 .................................................................................................................12
第二章 SPSS 的数据管理 .............................................................................................................................13
第一节 数据的输入 ..............................................................................................................................13
变量的定义 ..........................................................................................................................13
数据格式化 ..........................................................................................................................13
数据的输入 ..........................................................................................................................14
缺失值处理 ..........................................................................................................................15
变量标签 ..............................................................................................................................16
数据管理器列宽定义 ..........................................................................................................16
第二节 数据的编辑 ..............................................................................................................................17
数据的增删 ..........................................................................................................................17
数据的整理 ..........................................................................................................................18
数据的算术处理 ..................................................................................................................23
第三节 数据文件的管理 ......................................................................................................................27
数据文件的调用 ..................................................................................................................27
数据文件的连接 ..................................................................................................................28
数据文件的保存 ..................................................................................................................29
第三章 SPSS 文本文件的编辑 ....................................................................................................................30
第一节 文本文件的管理 ......................................................................................................................31
文件的生成 ..........................................................................................................................31
文件的保存 ..........................................................................................................................32
文件的调用 ..........................................................................................................................32
文件的打印 ..........................................................................................................................32
第二节 文本文件的编辑 ......................................................................................................................32
文本中文字的增删与修改 ..................................................................................................32
文本的选择 ..........................................................................................................................33
文本块的删除、移动与复制 ..............................................................................................33
文本块的打印 ......................................................................................................................33
文本中文字的查找 ..............................................................................................................34
文本中文字的替换 ..............................................................................................................34
第四章 摘要性分析 ......................................................................................................................................35
第一节 Frequencies 过程......................................................................................................................35
主要功能 ..............................................................................................................................35
实例操作 ..............................................................................................................................35
第二节 Descriptives 过程 .....................................................................................................................39
主要功能 ..............................................................................................................................39
实例操作 ..............................................................................................................................40
第三节 Explore 过程 ............................................................................................................................42
主要功能 ..............................................................................................................................42
实例操作 ..............................................................................................................................42
第四节 Crosstabs 过程..........................................................................................................................47
主要功能 ..............................................................................................................................47
实例操作 ..............................................................................................................................47
第五章 平均水平的比较 ..............................................................................................................................51
第一节 Means 过程 ..............................................................................................................................52
主要功能 ..............................................................................................................................52
实例操作 ..............................................................................................................................52
第二节 Independent-Samples T Test 过程 ...........................................................................................55
主要功能 ..............................................................................................................................55
实例操作 ..............................................................................................................................55
第三节 Paired-Samples T Test 过程.....................................................................................................57
主要功能 ..............................................................................................................................57
实例操作 ..............................................................................................................................57
第四节 One-Way ANOVA 过程 ..........................................................................................................59
主要功能 ..............................................................................................................................59
实例操作 ..............................................................................................................................60
第六章 方差分析 ..........................................................................................................................................63
第一节 Simple Factorial 过程...............................................................................................................63
主要功能 ..............................................................................................................................63
实例操作 ..............................................................................................................................63
第二节 General Factorial 过程 .............................................................................................................66
主要功能 ..............................................................................................................................66
实例操作 ..............................................................................................................................66
第三节 Multivarite 过程 .......................................................................................................................69
主要功能 ..............................................................................................................................69
实例操作 ..............................................................................................................................69
第七章 相关分析 ........................................................................................................................................78
第一节 Bivariate 过程 ..........................................................................................................................78
主要功能 ..............................................................................................................................78
实例操作 ..............................................................................................................................78
第二节 Partial 过程...............................................................................................................................81
主要功能 ..............................................................................................................................81
实例操作 ..............................................................................................................................81
第三节 Distances 过程..........................................................................................................................83
主要功能 ..............................................................................................................................83
实例操作 ..............................................................................................................................83
第八章 回归分析 ..........................................................................................................................................87
第一节 Linear 过程...............................................................................................................................87
主要功能 ..............................................................................................................................87
实例操作 ..............................................................................................................................88
第二节 Curve Estimation 过程 .............................................................................................................91
主要功能 ..............................................................................................................................91
实例操作 ..............................................................................................................................91
第三节 Logistic 过程 ............................................................................................................................94
主要功能 ..............................................................................................................................94
实例操作 ..............................................................................................................................94
第四节 Probit 过程 ...............................................................................................................................97
主要功能 ..............................................................................................................................97
实例操作 ..............................................................................................................................97
第五节 Nonlinear 过程 .......................................................................................................................101
主要功能 ............................................................................................................................101
实例操作 ............................................................................................................................102
第九章 对数线性模型 ................................................................................................................................105
第一节 General 过程 ..........................................................................................................................106
主要功能 ............................................................................................................................106
实例操作 ............................................................................................................................106
第二节 Hierarchical 过程 ...................................................................................................................110
主要功能 ............................................................................................................................110
实例操作 ............................................................................................................................110
第三节 Logit 过程 ..............................................................................................................................117
主要功能 ............................................................................................................................117
实例操作 ............................................................................................................................117
第十章 分类分析 ........................................................................................................................................122
第一节 K-Means Cluster 过程............................................................................................................123
主要功能 ..........................................................................................................................123
实例操作 ..........................................................................................................................123
第二节 Hierarchical Cluster 过程.......................................................................................................127
主要功能 ..........................................................................................................................127
实例操作 ..........................................................................................................................127
第三节 Discriminant 过程 ..................................................................................................................132
主要功能 ..........................................................................................................................132
实例操作 ..........................................................................................................................132
第十一章 因子分析 ..................................................................................................................................138
主要功能 ...................................................................................................................................138
实例操作 ...................................................................................................................................138
第十二章 可靠性分析 ..............................................................................................................................145
主要功能 ...................................................................................................................................145
实例操作 ...................................................................................................................................145
第十三章 非参数检验 ................................................................................................................................150
第一节 Chi-Square 过程 .....................................................................................................................150
主要功能 ..........................................................................................................................150
实例操作 ..........................................................................................................................151
第二节 Binomial 过程 ........................................................................................................................153
主要功能 ..........................................................................................................................153
实例操作 ..........................................................................................................................153
第三节 Runs 过程 ...............................................................................................................................154
主要功能 ..........................................................................................................................154
实例操作 ..........................................................................................................................154
第四节 1-Sample K-S 过程 ................................................................................................................156
主要功能 ..........................................................................................................................156
实例操作 ..........................................................................................................................156
第五节 2 Independent Samples 过程..................................................................................................157
主要功能 ..........................................................................................................................157
实例操作 ..........................................................................................................................157
第六节 k Independent Samples 过程..................................................................................................159
主要功能 ..........................................................................................................................159
实例操作 ..........................................................................................................................159
第七节 2 Related Samples 过程 .........................................................................................................160
主要功能 ..........................................................................................................................160
实例操作 ..........................................................................................................................161
第八节 K Related Samples 过程 ........................................................................................................163
主要功能 ..........................................................................................................................163
实例操作 ..........................................................................................................................163
第十四章 生存分析 ....................................................................................................................................165
第一节 Life Tables 过程.....................................................................................................................165
主要功能 ..........................................................................................................................165
实例操作 ..........................................................................................................................165
第二节 Kaplan-Meier 过程.................................................................................................................169
主要功能 ..........................................................................................................................169
实例操作 ..........................................................................................................................169
第三节 Cox Regression 过程..............................................................................................................173
主要功能 ..........................................................................................................................173
实例操作 ..........................................................................................................................173
第十五章 统计图的绘制 ............................................................................................................................179
第一节 直条图 ....................................................................................................................................179
主要功能 ..........................................................................................................................179
实例操作 ..........................................................................................................................179
第二节 线图 ........................................................................................................................................181
主要功能 ..........................................................................................................................181
实例操作 ..........................................................................................................................181
第三节 区域图 ....................................................................................................................................183
主要功能 ..........................................................................................................................183
实例操作 ..........................................................................................................................183
第四节 构成图 ....................................................................................................................................185
主要功能 ..........................................................................................................................185
实例操作 ..........................................................................................................................185
第五节 高低区域图 ............................................................................................................................187
主要功能 ..........................................................................................................................187
实例操作 ..........................................................................................................................187
第六节 直条构成线图 ........................................................................................................................188
主要功能 ..........................................................................................................................188
实例操作 ..........................................................................................................................189
第七节 质量控制图 ............................................................................................................................190
主要功能 ..........................................................................................................................190
实例操作 ..........................................................................................................................190
第八节 箱图 ........................................................................................................................................193
主要功能 ..........................................................................................................................193
实例操作 ..........................................................................................................................193
第九节 均值相关区间图 ....................................................................................................................195
主要功能 ..........................................................................................................................195
实例操作 ..........................................................................................................................195
第十节 散点图 ....................................................................................................................................197
主要功能 ........................................................................................................................197
实例操作 ........................................................................................................................197
第十一节 直方图 ................................................................................................................................199
主要功能 ........................................................................................................................199
实例操作 ........................................................................................................................199
第十二节 正态概率分布图 ................................................................................................................201
主要功能 ........................................................................................................................201
实例操作 ........................................................................................................................202
第十三节 正态概率单位分布图 ........................................................................................................203
主要功能 ........................................................................................................................203
实例操作 ........................................................................................................................203
第十四节 普通序列图 ........................................................................................................................207
主要功能 ........................................................................................................................207
实例操作 ........................................................................................................................207
第十五节 时间序列图 ........................................................................................................................208
主要功能 ........................................................................................................................208
实例操作 ........................................................................................................................208
第一章 SPSS 的安装与概貌
第一节 SPSS 的安装
SPSS 简介
SPSS 的全称是:Statistical Program for Social Sciences,即社会科学统计程序。该软件是公认的
最优秀的统计分析软件包之一。SPSS 原是为大型计算机开发的,其版本为 SPSSx,80 年代初,微
机开始普及以后,它率先推出了微机版本(版本为 SPSS/PC+ ),占领了微机市场,大大地扩大了
自己的用户量,我国目前正在使用的用户中,绝大部分是使用 — 版本。
80 年代末,Microsoft 发表 Windows 后,SPSS 迅速向 Windows 移植。至 1993 年 6 月,正式推
出 SPSS for Windows 版本。该版本不仅修正了以前版本的错误,改写一些模块使运行速度大大
提高。而且根据统计理论与技术的发展,增加了许多新的统计分析方法,使之功能日臻完善。与以
往的 SPSS for DOS 版本相比,SPSS for Windows 显得更加直观易用。首先,它采用现今广为流行的
电子表格形式作数据管理器,使用户变量命名、定义数据格式、数据输入与修改等过程一气呵成,
免除了原 DOS 版本在文本方式下数据录入的诸多不便;其次,采用菜单方式选择统计分析命令,采
用对话框方式选择子命令,简明快捷,无需死记大量繁冗的语法语句,这无疑是计算机操作的一次
解放;第三,采用对象连接和嵌入技术,使计算结果可方便地被其他软件调用,数据共享,提高工
作效率。
作为统计分析工具,理论严谨、内容丰富,数据管理、统计分析、趋势研究、制表绘图、文字
处理等功能,几乎无所不包。本使用指导以 SPSS for Windows 为蓝本,以医学领域的相关资料
为例子,简单明了地介绍它的具体使用方法。
SPSS 的安装
SPSS for Windows 共有 7 个部分,包括:Base、、、Tables、Trends、Categeries
和 LISREL。具体内容介绍如下,用户可根据自身需求选择性安装,这样既节省硬盘空间,又方便使
用。
Base system(基本统计系统)
ACF(时间序列研究中的自动相关分析) 97K
Aggregate(数据文件的汇总) 106K
Anova(方差分析) 137K
Autorecode(变量自动赋值处理) 49K
Correlations(相关分析) 73K
Crosstabs(列联表处理) 302K
Curvefit(11 种曲线模型的拟合) 125K
Date(变量定义与数据录入) 155K
Descriptives(均数、标准差等的描述性统计及 Z-分数转换) 79K
Examine(数值分布形式的探究) 290K
Fit(定义程序运行条件) 94K
Flip(数据行列转换) 44K
Frequencies(频数表分析) 121K
Graph(统计图制作) 219K
List(原始数据显示) 52K
Matrix Data(数据的矩阵处理) 81K
Mconvert(矩阵转化) 42K
Means(均数及均数差别的显著性检验) 140K
Mult Response(多变量数据的处理) 90K
Nonpar Corr(非参数资料的相关分析) 80K
Npar Tests(非参数检验) 199K
Oneway(单因素方差分析) 160K
Partial Corr(偏相关分析) 90K
Plot(曲线绘制) 118K
Rank(等级排序、计算正态分数、百分比等分析) 57K
Regression(回归分析) 453K
Report(结果输出) 226K
Sort(数据排序) 43K
SP Chart(高分辨率的统计制图) 94K
Sysfile Info(显示 SPSS 格式的系统文件信息) 35K
TS Plot(时间序列资料的统计制图) 190K
T-Test(t-检验) 77K
基本统计系统共需硬盘空间 M
Professional Statistics option(专业统计系统)
Alscal(利用最小二乘法处理多等级测量资料) 404K
Cluster(聚类分析) 166K
Discriminant(判别分析) 435K
Factor(因子分析) 296K
Proximities(资料相似性分析) 117K
Quick Cluster(快速聚类分析) 104K
Reliability(可靠性分析) 164K
2SLS(两级最小二乘法分析) 107K
WLS(加权最小二乘法分析) 94K
专业统计系统共需硬盘空间 M
Advanced Statistics option(高级统计系统)
Cox Regression(Cox 回归模型) 374K
Hiloglinear(多因子系统模式的对数线性模型) 155K
Kaplan-Meier(Kaplan-Meier 生存时间模型) 160K
Loglinear(对数线性模型及最优化检验) 207K
Logistic(Logistic 模型) 351K
Manova(协方差分析) 738K
Matrix(高级矩阵转换) 490K
Nonlinear(非线性分析) 147K
Probit(依照所需概率作拟合最优化分析) 134K
Survival(寿命表方式的生存分析) 178K
高级统计系统共需硬盘空间 M
Tables option(制表系统)
共需硬盘空间 M
Trends option(趋势分析系统)
Arima(Arima 时间序列分析) 332K
Exsmooth(指数平滑拟合) 123K
Model Name(定义程序运行过程需调用的模块) 58K
Season(季节模型) 60K
Spectra(光谱时间序列分析) 138K
X11 Arima(X11 Arima 时间序列分析) 435K
趋势分析系统共需硬盘空间 M
Categories option(项目分类分析系统)
本系统只提供键盘录入式的语法命令,共需硬盘空间 M
LISREL option(线性结构方程式模型分析系统)
本系统只提供键盘录入式的语法命令,共需硬盘空间 M
SPSS 的安装步骤:
1、启动 Windows,在程序管理器中选“文件”菜单的“运行”项,弹出“运行”对话框,点击“浏览...”
钮,根据安装盘所在的驱动器(A:或 B:或光盘)及其路径,找到 文件,点击“确
定”钮返回“运行”对话框,再点击“确定”钮,即运行安装程序。
2、安装程序运行后,出现安装选项对话框(如图 所示)。用户可根据自己的需要选择欲安
装的模块:即在所需的模块名前“Ⅰ”内点击,使“Ⅰ”内出现“Ⅰ”表明选中;若再点击使“Ⅰ”转为“Ⅰ”表
明取消选择。选择完毕后点击 OK 钮。
3、指定安装的目标盘和安装文件的路径。
4、输入软件系列号码、用户姓名和单位名称。
5、根据安装过程的提示,依次顺序插换原盘直至安装完成。
最小安装大约需要 15M 硬盘空间(含必需中心系统 和求助系统 ),完全安装大约需
要 28M 硬盘空间。
图 SPSS FOR WINDOWS 的安装选项
第二节 SPSS 的界面初识
SPSS 的启动
在 Windows 的程序管理器中双击 SPSS FOR WINDOWS 图标以打开 SPSS 程序组,选择 SPSS
图标并双击之,即可启动 SPSS。SPSS 启动成功后出现 SPSS 的封面及主窗口,5 秒钟后或点击鼠标
左键,封面消失,呈现 SPSS 的预备工作状态(如图 所示)。
SPSS 的主窗口
SPSS 的主窗口名为 SPSS for Windows,此为窗口的标题栏,当它呈蓝底白字时,表示该窗口为
活动窗口,意即用户可对之进行操作。非活动窗口的标题栏呈白底黑字,用户对之不能操作。激活
窗口的方法是点击该窗口的标题栏。
标题栏的左侧(即窗口的左上角)为窗口控制钮,点击它选择窗口的还原、移动、大小变换、
最小化、最大化、关闭和与其它窗口的切换。标题栏右侧(即窗口右上角)的两个钮:箭头向下的
为最小化钮,点击它使窗口缩小为图标(但不是关闭窗口);箭头向上的为最大化钮,点击它使窗口
充满整个屏幕。
该窗口的底部为系统状态栏,显示系统即刻的工作状况,这对用户了解系统情况十分有益。
图 SPSS 的启动窗口
SPSS 的菜单
菜单栏共有 9 个选项:
1、File:文件管理菜单,有关文件的调入、存储、显示和打印等;
2、Edit:编辑菜单,有关文本内容的选择、拷贝、剪贴、寻找和替换等;
3、Data:数据管理菜单,有关数据变量定义、数据格式选定、观察对象的选择、排序、加权、
数据文件的转换、连接、汇总等;
4、Transform:数据转换处理菜单,有关数值的计算、重新赋值、缺失值替代等;
5、Statistics:统计菜单,有关一系列统计方法的应用;
6、Graphs:作图菜单,有关统计图的制作;
7、Utilities:用户选项菜单,有关命令解释、字体选择、文件信息、定义输出标题、窗口设计
等;
8、Windows:窗口管理菜单,有关窗口的排列、选择、显示等;
9、Help:求助菜单,有关帮助文件的调用、查寻、显示等。
点击菜单选项即可激活菜单,这时弹出下拉式子菜单,用户可根据自己的需求再点击子菜单的
选项,完成特定的功能。
SPSS 的其他窗口
在 SPSS 的主窗口中还有两个窗口,一个是数据管理窗口,其标题名称是“Newdata”,且默认为
激活状态。数据管理器是一种典型的电子表格形式,用户可通过定义变量名、格式化数据类型后输
入原始数值,并可根据需要对数据进行增删、剪贴、修改、存储等操作。
另一个是结果输出窗口,标题名称是“!Output1”,启动时为非活动窗口,只有当完成一项处理后,
才在该窗口显示处理过程提示和计算结果。
当进行某项具体的统计方法操作时,可点击对话框的“Paste”钮激活命令编辑窗口,其标题名称
是“!Syntax1”,或选 Window 菜单的!Syntax1 项也可激活命令编辑窗口。用户可利用该窗口进行 SPSS
命令的输入、编辑和运行,这对熟悉 DOS 版本的 SPSS 用户是十分方便的。
上述三个窗口在实际操作时,经常因为内容很多,一个窗口中无法看到全部内容。有两种方法
可帮助用户看到全部内容:
1、使用窗口的滚动条 每个窗口的右侧有一个垂直滚动条,用鼠标点击滚动条上下两头的箭
号钮或用鼠标按住滚动条中的方块上下拖动,可使窗口中的内容前后翻滚;底边有一个水平滚动条,
用鼠标点击滚动条左右两头的箭号钮或用鼠标按住滚动条中的方块左右拖动,可使窗口中的内容左
右移动。如此,用户便可看清所有内容。
2、改变窗口的大小 一般情况下,鼠标指针是一个朝左上方的箭头,当把鼠标指针指向窗口
边界时,鼠标指针变成双向箭头形。这时,若按住鼠标左键移动,可改变窗口的大小,同样可看清
窗口内容。
SPSS 的退出
完成 SPSS 的统计分析后,退出该系统的方法是:选 File 菜单的 Exit 项,回答系统提出的有关
是否需要存储原始数据、计算结果和 SPSS 命令之后,即退到 Windows 的程序管理器中。
SPSS 的求助系统
SPSS 提供了丰富且详尽的在线帮助。主要有下列几种方式:
1、主窗口的 Help 菜单:在软件运行的任何时候,点击 Help 菜单选相关的子菜单,可得到所需
的各种帮助。
2、主窗口的 Utilities 菜单:在 Utilities 菜单中,有 Command index...子菜单,它提供有关 SPSS
各项统计分析技术能解决什么问题的信息。
3、各种对话框中的 Help 钮:在具体操作过程中,当弹出某一对话框时,一般总有 Help 钮,点
击该钮,用户可得到这一对话框选项内容的详细帮助。
4、结果输出窗口中的 Grossary 钮:当用户在浏览计算结果时,可点击结果输出窗的 Grossary
钮,它显示各种专用统计术语的解释信息以便用户理解。
5、命令编辑窗口中的 Syntax 钮:激活命令编辑窗,可见一 Syntax 钮,点击该钮,可得到与用
户正在编辑的命令相关的命令语法提示。
第二章 SPSS 的数据管理
统计分析离不开数据,因此数据管理是 SPSS 的重要组成部分。详细了解 SPSS 的数据管理方法,
将有助于用户提高工作效率。SPSS 的数据管理是借助于数据管理窗口和主窗口的 File、Data、
Transform 等菜单完成的。
第一节 数据的输入
变量的定义
先激活数据管理窗口,然后选 Data 菜单的 Define Variable...命令项,弹出 Define Variable 对话
框(见图 ),在 Variable Name:框内输入变量名,如本例为 x1。
图 变量定义对话框
数据格式化
在 Define Variable 对话框中点击 Type...钮,弹出 Define Variable Type 对话框(如图 所示),
用户可根据具体资料的属性对数据进行格式化。Define Variable Type 对话框中列出如下 7 种数据类
型:
图 定义变量类型对话框
1、Numeric:数值型,同时定义数值的宽度(Width),即整数部分+小数点+小数部分的位数,
默认为 8 位;定义小数位数(Decimal Places),默认为 2 位。
2、Comma:加显逗号的数值型,即整数部分每 3 位数加一逗号,其余定义方式同数值型。
3、Dot:3 位加点数值型,无论数值大小,均以整数形式显示,每 3 位加一小点(但不是小数
点),可定义小数位置,但都显示 0,且小数点用逗号表示。如 显示为 ,00(实际是
12345E-4).
4、Scientific notation:科学记数型,同时定义数值宽度(Width)和小数位数(Decimal Places),
在数据管理窗口中以指数形式显示。如 定义数值宽度为 9,小数位数为 2,则 显示为 +02。
5、Date:日期型,用户可从系统提供的日期显示形式中选择自己需要的。如选择 mm/dd/yy 形
式,则 1995 年 6 月 25 日显示为 06/25/95。
6、Dollar:货币型,用户可从系统提供的日期显示形式中选择自己需要的,并定义数值宽度和
小数位数,显示形式为数值前有$。
7、Custom currency:常用型,显示为整数部分每 3 位加一逗号,用户可定义数值宽度和小数位
数。如 显示为 12,。
8、String:字符型,用户可定义字符长度(Characters)以便输入字符。
用户选择完毕可点击 Continue 钮返回 Define Variable 对话框。
数据的输入
定义好变量并格式化数据之后,即可向数据管理窗口键入原始数据。数据管理窗口的主要部分
就是电子表格,横方向为电子表格的行,其行头以 1、2、3、……表示,即第 1、2、3、……行;纵
方向为电子表格的列,其列头以 var00001,var00002,var00003……表示变量名。行列交叉处称为单元
格,即保存数据的空格。鼠标一旦移入电子表格内即呈十字形,这时按鼠标左键可激活单元格,被
激活的单元格以加粗的边框显示;用户也可以按方向键上下左右移动来激活单元格。单元格被激活
后,用户即可向其中输入新数据或修改已有的数据。图 所示即为一个已输入数据的数据管理窗
口。为方便起见,用户亦可省略定义变量和数据格式化两个步骤,一启动 SPSS 即向数据管理窗口
中键入原始数据,这时,变量名默认为 var00001,var00002,var00003……
图 数据管理器
缺失值处理
在实际工作中,因各种原因会出现数值缺失现象,为此,SPSS 提供缺失值处理技术。在 Define
Variable 对话框中点击 Missing Value...钮,弹出 Define Missing Values 对话框(图 ),用户有 4 个
可选项:
图 缺失值定义对话框
1、No missing values:没有缺失值;
2、Discrete missing values:可定义 1-3 个。如测量身高(厘米)的资料,可定义 999 为缺失值;
性别的资料(男为 1、女为 2),可定义-1 为缺失值;
3、Range of missing values:可定义缺失值的范围。如脉搏资料,可定义 0—9 为缺失值;
4、Range plus one discrete missing value:可定义缺失值的范围,同时定义另外 1 个不是这一范
围的缺失值。如定义 0—9 为脉搏的缺失值,同时定义 999 为身高的缺失值。
变量标签
在 Define Variable 对话框中点击 Labels...钮,弹出 Define Labels 对话框(图 ),用户可定义
变量标签和特定变量值的标签。如定义变量 hb 的标签为“血红蛋白值”,同时定义 为“正常”,
则可在 Define Labels 对话框中的 Variable Label 处输入变量标签名,在 Value Labels 框中的 Value
处指定变量值,在 Value Label 处输入变量值标签,点击 Add 钮表示加入这种标签定义,点击 Change
表示更改原有标签,用户重新定义,点击 Remove 钮表示取消原有标签。
图 定义标签对话框
数据管理器列宽定义
在 Define Variable 对话框中点击 Column Format...钮,弹出 Define Column Format 对话框(图
),用户可定义数据管理器纵列的宽度,以便显示较长的数值或文字;同时用户还可指定数值或
文字在数据管理器单元格中的位置:Left 表示靠左、Center 表示居中、Right 表示靠右(此为默认方
式)。
图 列宽格式定义对话框
第二节 数据的编辑
输入的原始数据,经常在统计分析前或统计分析过程中,需要作一些特殊的处理。为此,系统
提供了如下主要方法。
数据的增删
增加一个新的变量列
例如要在第 2 列前增加一个新的列,使原来的第 2 列右移变成第 3 列,则可先激活第 2 列的任
一单元格,然后选 Data 菜单的 Insert Variable 命令项,系统自动为用户在第 2 列前插入一个新的变
量列,原第 2 列自动向右移一列成为第 3 列。
增加一个新的观察单位(即增加一个新的行)
例如要在第 6 个观察单位前增加一个观察单位(亦即在第 6 行前增加一行,使原来的第 6 行下
移成为第 7 行),则可先激活第 6 行的任一单元格,然后选 Data 菜单的 Insert Case 命令项,系统自
动为用户在第 6 行前插入一个新的行,原第 6 行列自动向下移一行成为第 7 行。
增加一个新的观察值
例如由于输入错误,造成第 7 个观察单位的第 4 个变量值漏输,结果第 8 个观察单位的第 4 个
变量值误为第 7 个观察单位的第 4 个变量值,这样的情形使得数据管理器中的第 4 个变量值从第 7
行起全部上移,而合计例数少一个。于是希望在第 7 行的第 4 列处插入 1 个单元格,原有数据依次
下移恢复正常。可先将鼠标指向在第 7 行第 4 列交叉处的单元格,然后按住鼠标左键向下拖动鼠标
直至第 4 列从第 7 行起的所有数据被选中(黑底白字),选 Edit 菜单的 Cut 命令项,选中的数据被剪
切入剪贴板,再激活第 8 行第 4 列交叉处的单元格,选 Edit 菜单的 Paste 命令项,可将剪贴板中的
原第 7 行起的所有数据下移自第 8 行开始,并空出第 7 行第 4 列的单元格以便补入漏输的数值。
删除一个行
例如要删除第 9 行(即删除这个观察单位的所有观察值),则可先点击第 9 行的行头,这时整个
第 9 行被选中(呈黑底白字状),然后按 Delete 键或选 Edit 菜单的 Clear 命令项,该行即被删除。
删除一个变量列
例如要删除第 4 个变量列,则可先点击第 4 列的列头,这时整个第 4 列被选中(呈黑底白字
状),然后按 Delete 键或选 Edit 菜单的 Clear 命令项,该列即被删除。
删除一个观察值
例如由于输入错误,造成第 6 个观察单位的第 2 个变量值重复输入,结果第 7 个观察单位的第
2 个变量值误为第 6 个观察单位的第 2 个变量值,第 8 个观察单位的第 2 个变量值误为第 7 个观察
单位的第 2 个变量值,……,这样的情形使得数据管理器中的第 2 个变量值从第 7 行起全部下移,
而合计例数多一个。于是希望将第 7 行第 2 列的单元格删除,原有数据依次上移恢复正常。可先将
鼠标指向在第 8 行第 2 列交叉处的单元格,然后按住鼠标左键向下拖动鼠标直至第 2 列从第 8 行起
的所有数据被选中(黑底白字),选 Edit 菜单的 Cut 命令项,选中的数据被剪切入剪贴板,再激活
第 7 行第 2 列交叉处的单元格,按 Del 键删除该单元格的数值,选 Edit 菜单的 Paste 命令项,可将
剪贴板中的原第 8 行起的所有数据上移自第 7 行开始,既填补第 7 行第 2 列的单元格,又恢复原有
下移的数值。
数据的整理
数据的排序
用户可按要求对数据管理器的数据进行排序。选 Data 菜单的 Sort Cases...命令项,弹出 Sort
Cases...对话框(图 ),在变量名列框中选 1 个需要按其数值大小排序的变量(用户也可选多个变
量,系统将按变量选择的先后逐级依次排序),点击Ⅰ钮使之进入 Sort by 框,然后在 Sort Order 框中
确定是按升序(Ascending,从小到大)或降序(Descending,从大到小),点击 OK 钮即可。
图 排序对话框
数据的行列互换
有时,用户需要将数据管理器中原先按行(列)方向排列的数据转换成按列(行)方向排列的
数据,这时可选 Data 菜单的 Transpose...命令项,弹出 Transpose...对话框(图 ),在变量名列框中
选 1 个或多个需要转换的变量,点击Ⅰ钮使之进入 Variable(s)框,再点击 OK 钮即可。产生的新数据
会在第 1 列出现一个 case_lbl 新变量,用于放置原来数值的变量名。若要将数据再转换回原来的排
列方式,方法与上述过程相同。
图 行列互换框
数据的分组汇总
用户还可对数据管理器中的数据按指定变量的数值进行归类分组汇总,汇总的形式十分多样。
例如,要对下列数据(图 )按变量 group 的大小,把变量 x1 作平均值汇总、把变量 x2 作求和汇
总。选 Data 菜单的 Aggregate...命令项,弹出 Aggregate Data 对话框(图 ),在变量名列框中选
group 变量,点击Ⅰ钮使之进入 Break Variable(s)框,选 x1 变量进入 Aggregate Variable(s)框,因 x1
欲作平均值汇总,故点击 Function...钮弹出 Aggregate Data: Aggregate Function 对话框(图 )选
Mean of values 项点击 Continue 钮返回;选 x2 变量进入 Aggregate Variable(s)框,因 x2 变量欲作求
和汇总,故点击 Function...钮选 Sum of values 项点击 Continue 钮返回。再点击 OK 钮即可。结果如
图 所示。
图 欲作分组汇总的原始数据
图 分组汇总对话框
图 分组汇总的函数功能对话框
图 分组汇总后的数据
分组汇总提供的函数形式有:
1、Mean of values:求该组的平均值;
2、Standard deviation:求该组的标准差;
3、First value:只保留该组的第 1 个数值;
4、Minimum value:只保留该组的最小值;
5、Last value:只保留该组的最后 1 个数值;
6、Maximum value:只保留该组的最大值;
7、Number of cases:合计该组的观察例数;
8、Sum of values :求该组所有观察值的和。
9、Percentage above :先确定 1 个数值,求大于该数值的所有例数占总例数的百分比
(0-100%);
10 、 Percentage below : 先 确 定 1 个 数 值 , 求 小 于 该 数 值 的 所 有 例 数 占 总 例 数 的 百 分 比
(0-100%);
11、Fraction above:先确定 1 个数值,求大于该数值的所有例数占总例数的百分比(0-1);
12、Fraction below:先确定 1 个数值,求小于该数值的所有例数占总例数的百分比(0-1);
13、Percentage inside:先确定 1 个下限,再确定 1 个上限,求数值在该区间内的例数占总例数
的百分比(0-100%);
14、Percentage outside:先确定 1 个下限,再确定 1 个上限,求数值在该区间外的例数占总例数
的百分比(0-100%);
15、Fraction inside:先确定 1 个下限,再确定 1 个上限,求数值在该区间内的例数占总例数的
百分比(0-1);
16、Fraction outside:先确定 1 个下限,再确定 1 个上限,求数值在该区间外的例数占总例数的
百分比(0-1)。
数据的分割
数据也可根据需要,事先按用户的指定作分组(这种分组是系统内定义的,在数据管理器中并
不一定明确体现,故亦可称之为分割),此后的所有分析都将按这种分组进行,除非取消数据分割的
命令。选 Data 菜单的 Split File...命令项,弹出 Split File 对话框(图 ),选 Repeat analysis for each
group 表示此后都按指定的分组方式作相同项目的分析,用户可从变量名列框中选 1 个或多个变量点
击Ⅰ钮使之进入 Groups Based on 框来作分组的依据。若在数据分割之后要取消这种分组,可选
Analyze all cases 项,则系统恢复如初。
调用 Split File 命令完成定义后,SPSS 将在主窗口的最下面状态行中显示 Split File On 字样;若
调用该命令后的数据库被用户存盘,则当这个数据文件再次打开使用时,仍会显示 Split File On 字样,
意味着数据分割命令依然有效。
图 数据分割对话框
数据的选择
除按要求作数据分组分别作分析外(但这依然是将所有的资料全部代入分析),还可从所有资料
中选择一些数据进行统计分析。选 Data 菜单的 Select Cases...命令项,弹出 Select Cases 对话框(图
),系统提供如下几种选择方法:
图 数据选择对话框
1、All cases:表示所有的观察例数都被选择,该选项可用于解除先前的选择;
2、If condition is satisfied:表示按指定条件选择,点击 If...钮,弹出 Select Cases:If 对话框(图
),先选择变量,然后定义条件;
3、Random sample of cases:表示对观察单位进行随机抽样,点击 Sample...钮,弹出 Select
Cases:Random Sample 对话框,有两种选择分式,一是大概抽样(Approximately)即键入抽样比例后
由系统随机抽取,另一是精确抽样(Exactly)即要求从第几个观察值起抽取多少个;
4、Based on time or case range:表示顺序抽样,点击 Range...钮,弹出 Select Cases:Range 对话框,
用户定义从第几个观察值抽到第几个观察值;
5、Use filter variable:表示用指定的变量作过滤,用户先选择 1 个变量,系统自动在数据管理
器中将该变量值为 0 的观察单位标上删除标记,系统对有删除标记的观察单位不作分析。若用户在
Select Cases 对话框的 Unselected Cases Are 框中选 Deleted 项,则系统将删除所有被标上删除标记的
观察单位。
调用 Select Cases 命令完成定义后,SPSS 将在主窗口的最下面状态行中显示 Filter On 字样;若
调用该命令后的数据库被用户存盘,则当这个数据文件再次打开使用时,仍会显示 Filter On 字样,
意味着数据选择命令依然有效。
图 选择条件对话框
观察单位的秩次确定
为了解在指定条件下某个或某些变量值的大小顺序,可选 Transform 菜单的 Rank Cases...命令项,
弹出 Rank Cases 对话框(图 ),从变量名列框中选 1 个或多个变量点击Ⅰ钮使之进入 Variable(s)
框作为按该变量值大小排序的依据。若选 1 个或多个变量使之进入 By 框,则系统在排序时将按进
入 By 框的变量值分组排序。排序的结果将在数据管理器中新建 1 个变量名为原排序变量前加一特定
排序类型字母(如原变量为 x,则普通排序时变量为 rx)的变量用于放置秩次。用户可在 Rank Cases
对话框的 Assign Rank 1 to 框中指定秩次排列方式:Smallest value 表示最小值用 1 标注,之后为 2、
3、4……;Largest value 表示最大值用 1 标注,之后为 2、3、4……。
图 观察单位排序对话框
若点击 Rank Cases 对话框的 Rank Types...钮,可选择排序类型(图 ):
1、Rank:普通秩次,排序类型字母 r;
2、Fractional Rank as percent;累积百分秩次,排序类型字母 p;
3、Savage score:以指数分布为基础的原始分秩次,排序类型字母 s;
4、Sum of case weights:分组例数之和的权重秩次,排序类型字母 n;
5、Fractional Rank:分组例数之和占总例数累积百分比秩次,排序类型字母 r;
6、Ntiles:先给定一个大于 1 的整数,系统按此数范围确定排序的秩次,排序类型字母 n。
图 观察单位排序类型对话框
数据的算术处理
变量的加权
选 Data 菜单的 Weight Cases...命令项,可对指定的数值变量进行加权。在弹出的 Weight Cases
对话框中(图 ),Do not weight cases 表示不做加权,这可用于对做过加权的变量取消加权;Weight
cases by 表示选择 1 个变量做加权。在加权操作中,系统只对数值变量进行有效加权,即大于 0 的数
按变量的实际值加权,0、负数和缺失值加权为 0。
加权操作在Ⅰ2 检验中是必不可少的,且一旦该变量做过加权操作,那么,一方面系统自动根据
用户对已加权变量值的修改做加权变换,另一方面用户除非取消加权,否则即使改变变量名,系统
依然对该变量进行加权操作。
调用 Weight Cases 命令完成定义后,SPSS 将在主窗口的最下面状态行中显示 Weight On 字样;
若调用该命令后的数据库被用户存盘,则当这个数据文件再次打开使用时,仍会显示 Weight On 字
样,意味着数据加权命令依然有效。
图 数据加权对话框
数据的运算与新变量的生成
选 Transform 菜单的 Compute...命令项,既可对选定的变量进行运算操作,又可通过运算操作让
系统生成新的变量。在弹出的 Compute Variable 对话框中(图 ),用户首先在 Target Variable 指
定一个变量(可以是数据管理器中已有的变量,也可是用户欲生成的新变量),然后点击
Type&Label...钮确定是数值型变量,还是字符型变量,或加上变量标签。在 Numeric Expression 框中
键入运算公式,系统提供计算器和 82 种函数(在 Functions 框内)让用户使用;若点击 If...钮会弹
出 Compute Variable:If Cases 对话框(类似于图 的选择条件对话框),用户可指定符合条件的变
量参与运算。
如本例是要求系统生成一个新变量 x1,x1 = x 的绝对值+y-×z。点击 OK 钮即可。结果
在数据管理器中产生一个新变量 x1。
图 数据运算对话框
变量值个数的清点
对于数值型变量,某个或某些值在各观察单位中的出现次数可以作清点。选 Transform 菜单的
Count...命令项,在弹出的 Count Occurrences of Value within Cases 对话框中(图 ),先在 Target
Variable 指定一个变量(可以是数据管理器中已有的变量,也可是用户欲生成的新变量),然后指定
需要清点的变量,即在变量名列中选择 1 个或多个变量点击Ⅰ钮使之进入 Numeric Variable(s)框,再
点击 Define Values...钮,弹出 Count Value within Cases:Value to Count 对话框,确定哪些数值作为清
点对象。选 Value 表示单一数值为清点对象;选 System-missing 或 System-or user missing 表示系统或
用户指定的缺失值为清点对象;选 Range 表示指定数值范围为清点对象。还可点击 If...钮指定条件
来确定参与清点的观察单位。
图 数值清点对话框
变量的重新赋值
在数据管理器中,用户可对各单元的数值重新赋予新值。这种操作只适用于数值型变量。选
Transform 菜 单 的 Recode 命 令 项 , 此 时 有 两 种 选 择 : 一 是 对 变 量 自 身 重 新 赋 值 ( Into Same
Variables...),一是对其它变量或新生成的变量进行赋值(Into Different Variables...)。若选第一种赋
值方法,在弹出的 Recode into Same Variables 对话框中(图 ),先在变量名列中选 1 个或多个变
量点击Ⅰ钮使之进入 Numeric Variables 框,然后点击 Old and New Values...钮弹出 Recode into Same
Variables:Old and New Value 对话框,用户根据实际情况确定旧值和新值,点击 Continue 钮返回,再
点击 OK 钮即可。若选第二种赋值方法,在弹出的 Recode into Different Variables 对话框中(图
),先在变量名列中选 1 个或多个变量点击Ⅰ钮使之进入 Numeric VariableⅠOutput Variable 框,
同时在 Output Variable 框确定一赋值变量(可以是数据管理器中已有的变量,也可以是用户要求生
成的新变量),然后点击 Old and New Values...钮弹出 Recode into Different Variables:Old and New
Value 对话框,用户根据实际情况确定旧值和新值,点击 Continue 钮返回,再点击 OK 钮即可。
在两种赋值情况下,用户均可点击 If...钮指定条件来确定参与清点的观察单位。
与 Compute 方法不同的是:Recode 方法不能进行运算,只能根据指定变量值作数值转换,且这
种转换是单一数值的转换。
图 自身变量赋值对话框
图 非自身变量赋值对话框
缺失值的替代
对于缺失值,可采取多种手段进行科学替代。选 Transform 菜单的 Replace Missing Values...命令
项,在弹出的 Replace Missing Values 对话框中(图 ),先在变量名列中选 1 个或多个存在缺失
值的变量点击Ⅰ钮使之进入 New Variable(s)框,这时系统自动产生用于替代缺失值的新变量,用户也
可在 Name 框处自己定义替代缺失值的新变量名。然后点击 Method 的下箭头选择缺失值的替代方式:
图 数值清点对话框
1、Series mean:用该变量的所有非缺失值的均数做替代;
2、Mean of nearby points:用缺失值相邻点的非缺失值的均数做替代,取多少个相邻点可任意定
义;
3、Median of nearby points:用缺失值相邻点的非缺失值的中位数做替代,取多少个相邻点可任
意定义;
4、Linear interpolation:用缺失值相邻两点非缺失值的中点值做替代;
5、Linear trend at point:用线性拟合方式确定替代值。
第三节 数据文件的管理
数据文件的调用
选 File 菜单的 Open 命令项,再选 Data...项,弹出 Open Data File 对话框,用户确定盘符、路径、
文件名后点击 OK 钮,即可调入数据文件。
系统支持如下格式的数据文件:
1、SPSS:SPSS for WINDOWS 版本的数据文件,后缀为.sav;
2、SPSS/PC+ :SPSS for DOS 版本的数据文件,后缀为.sys;
3、SPSS portable:SPSS 的 ASCII 格式的机器码,可用于网络传输,后缀为.por;
4、Excel:微软公司电子表格的数据文件,后缀为.xls;
5、Lotus:莲花公司电子表格的数据文件,后缀为.w*;
6、SYLK:扩展格式电子表格的 ASCII 格式, 后缀为.slk;
7、dBASE:数据库的数据文件,后缀为.dbf;
8、Tab-delimited:以空格为分隔的 ASCII 格式的数据文件,后缀为.dat。
数据文件的连接
纵向连接——观察单位的追加
利用数据连接功能可以将两个或两个以上的具有相同变量格式的数据文件连在一起。选 Data 菜
单的 Merge Files 命令项,选 Add Cases...项,弹出 Add Cases:Read File 对话框(类似于图 ),用
户确定盘符、路径、文件名后点击 OK 钮,即完成连接。如本例有两个数据文件: 和
(图 ),它们具有共同的变量 name、x1、x2,将之连接后如图 所示。
图 数据文件调用对话框
(A) (B)
图 待连接的数据文件
图 连接后的数据文件
横向连接——变量值的合并
利用数据连接功能还可以将两个或两个以上的具有相同观察单位的数据文件连在一起。选 Data
菜单的 Merge Files 命令项,选 Add Variables...项,弹出 Add Variables:Read File 对话框(类似于图
),用户确定盘符、路径、文件名后点击 OK 钮,即完成连接。如本例有两个数据文件:
和 (图 ),它们具有共同的观察单位 zhangsan、lisi、wanwu、maliu,将之连接后如图
所示。
(A) (B)
图 待连接的数据文件
图 连接后的数据文件
数据文件的保存
输入数据管理器中的数据,无论什么时候(完成统计后或未作任何分析前或数据尚未输完,
等),用户均可对之进行保存,以便于再使用(可以用于下次再追加数据、或作其他统计处理、或转
成其他格式的数据文件供别的软件使用,等)都可以将数据文件保存起来。
选 File 菜单的 Save As... 命令项,弹出 Newdata:Save Data As 对话框(图 ), 用户确定盘符、
路径、文件名以及文件格式后点击 OK 钮,即可保存数据文件。
图 数据文件保存对话框
系统可由用户通过点击 Save File as Type 框的下箭头,选择确定完成下列格式数据文件的存放:
1、SPSS(*.sav):SPSS for WINDOWS 版本的数据格式;
2、SPSS/PC+(*.sys):SPSS for DOS 版本的数据格式;
3、SPSS Portable(*.por):SPSS for WINDOWS 版本的 ASCII 码数据格式;
4、Tab-delimited(*.dat) :用空格分割的 ASCII 码数据格式;
5、Fixed ASCII(*.dat) :混合 ASCII 码数据格式;
6、Excel(*.xls) :Excel 的数据格式;
7、1-2-3 Rel (*.wk3) :Lotus 版本的数据格式;
8、1-2-3 Rel (*.wk1) :Lotus 版本的数据格式;
9、1-2-3 Rel (*.wks) :Lotus 版本的数据格式;
10、SYLK(*.slk) :扩展方式电子表格的数据格式;
11、dBASE Ⅰ(*.dbf) :dBASE Ⅰ版本的数据格式;
12、dBASE Ⅰ(*.dbf) :dBASE Ⅰ版本的数据格式;
13、dBASE Ⅰ(*.dbf) :dBASE Ⅰ版本的数据格式。
第三章 SPSS 文本文件的编辑
上一章介绍了 SPSS 数据管理窗口的使用方法。在第一章中,我们还提到过 SPSS 的其他窗口,
如结果输出窗口(图 )和命令编辑窗口(图 ),这两个窗口是系统用于接收或输出文本的。用
户经常在实际工作中需要对之进行必要的编辑。SPSS 的文本编辑是借助于主窗口的 File、Edit 等菜
单完成的,本章介绍 SPSS 的文本编辑方法。
图 结果输出窗口(对变量 x 进行 Descriptives 统计过程分析的结果)
图 命令编辑窗口(对变量 x 进行 Descriptives 统计过程分析的语法)
第一节 文本文件的管理
文件的生成
SPSS 文本文件主要有两种生成方法:
1、在进行统计分析时,系统会将出错信息、数据转换情况、统计运算的中间环节和最终结果送
到结果输出窗口中,这就是结果文本的内容;
2、在调用 Statistics 菜单的统计过程命令项时,会弹出统计过程对话框,这时若点击 Paste 钮就
会出现命令编辑窗口,在该窗口中显示了与 SPSS For DOS 相类似的 SPSS 语法命令,这就是命令文
本的内容。
无论是结果文本还是命令文本,用户都可以对之进行必要的编辑。
文件的保存
对于出现在结果输出窗口和命令编辑窗口的文本内容,用户可以将之保存起来以便日后查阅。
方法是:先激活该窗口(窗口标题栏为蓝底白字时,即为活动窗口),然后选 File 菜单的 Save As...
命令项,弹出 Save As 对话框,用户指定盘符、路径和文件名后点击 OK 钮即可保存文件。
系统对结果文本的文件名默认后缀为.lst,对命令文本的文件名默认后缀为.sps。
文件的调用
对存盘的文本文件,可以在需要时调用它。选 File 菜单的 Open 命令项,再选 SPSS Syntax...项,
弹出 Open SPSS Syntax 对话框,用户指定盘符、路径和文件名后点击 OK 钮即可调用后缀为.lst 的结
果文本文件;若选 File 菜单的 Open 命令项,再选 SPSS Output...项,弹出 Open Output 对话框,用户
指定盘符、路径和文件名后点击 OK 钮即可调用后缀为.sps 的语法文本文件。
文件的打印
用户还可将文本打印出来以便阅读或保存。先激活需要打印的窗口,然后选 File 菜单的 Print...
命令项,弹出 Print 对话框,用户确定是全部打印(All)还是选择部分打印(Selection),并确定打
印份数(Copies)后,点击 OK 钮即可将文本内容送往打印机。
系统在 File 菜单中还提供 Printer Setup...命令项,选择命令项可对打印机类型、纸张尺寸、打印
边界、打印输出方向、打印分辩率和打印颜色深浅度进行设定。
第二节 文本文件的编辑
显示在结果输出窗口和命令编辑窗口的文本内容,就象任何显示在文字处理器中的文字内容一
样,可以按用户的需要做修改、增删、移动、查找、替换等操作。但 SPSS 毕竟不是专门的文字处
理器,而是统计分析软件,因此,其文本编辑的功能相对有限。对其文本内容,尤其是运算结果的
有关内容,用户经常需将之体现在专业报告中。如果用户想仅仅依靠 SPSS 有限的文本编辑功能直
接就着输出的结果进行文章撰写,那么会发现其排版功能的不足让人捉襟见肘。本节介绍 SPSS 的
文本编辑的功能,旨在让用户对输出结果或统计命令作必要的编辑,以便直接打印或通过 WINDOWS
的剪贴板剪切或拷贝后供其他文字处理器(如 Word、Wordperfect 等)使用。
文本中文字的增删与修改
激活结果输出窗口或命令编辑窗口后,用户可使用方向键和 Home、End、PageUp、PageDown
键或直接用鼠标(在文本区内,鼠标呈“I”状)移动和确定光标位置,以便进行文字的增删与修改。
其中Ⅰ键为光标左移;Ⅰ键为光标右移;Ⅰ键为光标上移;Ⅰ键为光标下移;Home 键为光标移至行
头;End 键为光标移至行尾;Ctrl+Home 键为光标移至篇头;Ctrl+End 键为光标移至篇尾;PageUp
键为上翻一页;PageDown 键为下翻一页。
移动光标至所需位置时,即可进行文字的增删与修改。在默认情况下,编辑处于插入状态,用
户在光标位置上击键即可插入文字;若想覆盖原有的文字,可先按 Insert 键关闭插入状态,这时键
入的文字将逐一取代光标位置之后的原有文字;若想删除文字,则可使用 Delete 键和 Backpace 键,
用 Delete 键可删除光标后面的文字,用 Backpace 键可删除光标前面的文字。
在结果输出窗口中,每隔几行文字,其最左边会显示一个 z 符号,这是打印分页符(有的是Ⅰ
符号,两个Ⅰ之间的内容为一次完整统计过程的结果输出块)。对于一般的打印纸,当保留系统提供
的分页符时,会出现每打印十数行就换页的情况,这样十分浪费纸张。故一般需要将分页符删除:
即将光标移至分页符后按 Backpace 键即可消除分页符。
必要时,用户可重新对文本加入 z 符号和Ⅰ符号。选 Edit 菜单的 Add Page Break 命令项可加入 z
符号;选 Edit 菜单的 Add Output Break 命令项可加入Ⅰ符号。
文本的选择
上面所讲的方法用于少数几个文字的删除是很方便的,但实际工作中需要对几行或数段文字(即
文本块)进行删除或移动,这时就需要应用文本选择方法。
将鼠标移至需选择的文本块之首,按住鼠标左键拖动鼠标,直至所需文本块全部选中后放开鼠
标左键,被选中的文本块呈黑底白字;若感到拖动鼠标的操作有困难,也可改用键盘选择方式,即
先将光标移至需选择的文本块之首,然后按住 Shift 键不放,再同时按方向键移动光标,便可选择所
需的文本块。
还可调用 Edit 菜单的 Select 命令项进行文本块选择,它有几个选项:
1、All:窗口里的内容全部选择,可用于结果文本也可用于命令文本;
2、Page:窗口里当前区域内显示的一个页面的内容(即两个分页符之间的内容)被选择,只适
用于结果文本;
3、Output Block:窗口里当前区域内显示的一个输出块的内容(即两个Ⅰ符之间的内容)被选择,
只适用于结果文本;
4、Command:窗口里当前区域内显示的一个命令段的内容被选择,只适用于命令文本。
文本块的删除、移动与复制
完成文本块的选择之后,就可以进行所需的删除、移动或复制操作了。
1、删除:选好文本块后,按 Del 键或选 Edit 菜单的 Clear 命令项,即可将选好的文本块删除;
2、移动:已有的文本可能需要移到另一处,这时可先选好需要移到别处的文本块,再选 Edit 菜
单的 Cut 命令项,将该文本块剪切送入 Windows 的剪贴板中(该文本块从原处消失),然后将光标
移到所需的位置,选 Edit 菜单的 Paste 命令项,即完成文本块的移动;
3、复制:已有的文本可能在另一处也需要,这时可先选好该文本块,再选 Edit 菜单的 Copy 命
令项,将该文本块拷入 Windows 的剪贴板中(该文本块在原处仍保留),然后将光标移到所需的位
置,选 Edit 菜单的 Paste 命令项,即完成文本块的复制。
文本块的打印
被选取的文本块,可直接送打印机输出。选 File 菜单的 Print...命令项,弹出 Print 对话框,系统
默认选 Selection 项,用户确定打印份数后点击 OK 钮即可。
文本中文字的查找
激活结果输出窗口或命令编辑窗口,选 Edit 菜单的 Search For Text...命令项,弹出 Serach For
Text 对话框(图 ),用户在 Serach for 框中输入需要查找的文字,然后确定是否忽略字母的大小写
(Ignore case),点击 Serach Forward 钮可要求系统向后查找,点击 Search Backward 钮可要求系统向
前查找。
图 文本文字查找对话框
文本中文字的替换
激活结果输出窗口或命令编辑窗口,选 Edit 菜单的 Replace Text...命令项,弹出 Replace Text 对
话框(图 ),用户在 Serach for 框中输入替换前的文字,在 Replace with 框中输入替换后的文字,
确定是否忽略字母的大小写(Ignore case),并确定系统的查找方向(向后为 Serach Forward,向前
为 Search Backward)。点击 Search 钮,系统找到替换处时会暂停询问用户是否做替换操作,若要点
击 Replace then Search 钮,系统替换后继续再查找;若不要可点击 Search 钮再查找或点击 Close 钮结
束替换操作。用户在十分肯定的情况下可点击 Replace All 钮,系统将不做任何询问快速自动地全部
替换。
图 文本文字替换对话框
第四章 摘要性分析
摘要性分析是对原始数据进行描述性分析,这是统计工作的出发点。统计学的一系列基本描述
指标,不仅让人了解资料的特征,而且可启发人们对之作进一步的深入分析。通过调用摘要性分析
的诸个过程,可完成许多统计学指标,对于计量资料,可完成均数、标准差、标准误等指标的计算;
对于计数和一些等级资料,可完成构成比、率等指标的计算和χ2 检验。本章将介绍其操作方法。
第一节 Frequencies 过程
主要功能
调用此过程可进行频数分布表的分析。频数分布表是描述性统计中最常用的方法之一,此外还
可对数据的分布趋势进行初步分析。
实例操作
[例 4-1]调查 100 名健康女大学生的血清总蛋白含量(g%)如下表,试作频数表分析。
数据准备
激活数据管理窗口,定义血清总蛋白含量的变量名为 X,然后输入血清总蛋白含量的原始数据,
结果见图 。
图 输入血清总蛋白含量值
统计分析
激活 Statistics 菜单,选 Summarize 中的 Frequencies...命令项,弹出 Frequencies 对话框(图
)。现欲对血清总蛋白含量值进行频数表分析,故在对话框左侧的变量列表中选 x,点击钮使之进
入 Variable(s)框。同时可点击 Format...钮弹出 Frequencies:Format 对话框,在 Order by 栏中有四个
选项:Ascending values 为根据数值大小按升序从小到大作频数分布;Descending values 为根据数值
大小按降序从大到小作频数分布;Ascending counts 为根据频数多少按升序从少到多作频数分布;
Descending counts 为根据频数多少按降序从多到少作频数分布。在 Page Formal 栏中可定义结果输出
的格式。本例选 Ascending values 项后点击 Continue 钮返回 Frequencies 对话框。
图 频数表分析对话框
点击 Statistics...钮,弹出 Frequencies:Statistics 对话框(图 ),可点击相应项目,要求系统在
作频数表分析的基础上,附带作各种统计指标的描述,特别是可进行任何水平的百分位数计算。本
例要求计算四分位数(Quartiles)、均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)、标准差
()、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、标准误
()、偏度系数(Skewness)和峰度系数(Kurtosis),选好后点击 Continue 钮返回 Frequencies
对话框。
图 频数表分析的统计指标对话框
点击 Charts...钮,弹出 Frequencies:Charts 对话框,用户可选两种图形,一是直条图(Bar chart),
适用于非连续性的变量;另一是直方图(Histogram),适用于连续性的变量。本例要求对变量 x 绘
制直方图,故选择 Histogram 项,并要求绘制正态曲线(With normal curve),点击 Continue 钮返回
Frequencies 对话框,再点击 OK 钮即可。
结果解释
在输出结果窗口中将看到如下统计数据:
系统对变量 x 的原始数据作频数分布表,Value 为原始值、Frequency 为频数、Percent 为各组频
数占总例数的百分比、Valid percent 为各组频数占总例数的有效百分比、Cum Percent 为各组频数占
总例数的累积百分比。
X Valid Cum
Value Label Value Frequency Percent Percent Percent
1
2
1
4
2
3
3
1
7
4
7
7
11
8
1
7
1
1
5
7
2
1
1
3
3
1
2
1
2
1
------ ------- -------
Total 100
接着输出各基本统计指标,其中均数为 , 标准误为 , 中位数为 , 众数为 ,
标准差为 , 方差为 , 峰度系数为 , 峰度系数的标准误为 , 偏度系数为 , 偏
度系数的标准误为 , 全距为 , 最小值为 , 最大值为 , 25%位数为 , 50%位数
为 , 75%位数为 ,共 100 个观察值,无缺失值。
Mean Std err .039 Median
Mode Std dev .394 Variance .155
Kurtosis .034 S E Kurt .478 Skewness .060
S E Skew .241 Range Minimum
Maximum
Percentile Value Percentile Value Percentile Value
Valid cases 100 Missing cases 0
最后系统输出带有正态曲线的直方图(图 ),由图中可见,数据基本呈现正态分布形状。
图 频数分布的直方图
X
Histogram
Fr
eq
ue
nc
y
30
20
10
0
Std. Dev = .39
Mean =
N =
从上述内容可知,系统在未特别指定的情形下,频数分布表是按照原始数值逐一作频数分布的,
这与日常需要的等距分组、且组数保持在 8~15 组的要求不符。为此,在调用 Frequencies 过程命令
之前,可先对原始数据进行算术处理:已知最小值为 ,最大值为 ,全距为 ,故可要
求分成 10 组,起点为 ,组距为 。选 Transform 菜单 Recode 项的 Into Different Variable...命令
项,在弹出的 Recode Into Different Variable 对话框中选 x 点击钮使之进入 Numeric VariableⅠOutput
Variable 框,在 Output Variable 栏的 Name 处输入 x1,点击 Change 钮表示新生成的变量名为 x1。点
击 Old and New Values 钮弹出 Recode Into Different Variable:Old and New Values 对话框,在 Old value
栏内选 Range 项,输入第一个分组的数值范围:~,在 New value 栏内输入新值:,点
击 Add 钮,依此将各组的范围及对应的新值逐一输入,最后点击 Continue 钮返回 Recode Into
Different Variable 对话框,再点击 OK 钮即完成。系统在原数据库中生成一新变量为 x1,这时调用
Frequencies 过程命令将输出等距分组且组数为 10 的频数分布表。
X1
Valid Cum
Value Label Value Frequency Percent Percent Percent
3
5
8
12
25
23
10
7
6
1
------- ------- -------
Total 100
Valid cases 100 Missing cases 0
第二节 Descriptives 过程
主要功能
调用此过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,且可将原始数
据转换成标准 Z 分值并存入数据库,所谓 Z 分值是指某原始数值比其均值高或低多少个标准差单位,
高的为正值,低的为负值,相等的为零。
实例操作
[例 4-2]调查 20 名男婴的出生体重(克)资料如下,试作描述性统计。
2770 2915 2795 2995 2860 2970 3087 3126 3125 4654
2272 3503 3418 3921 2669 4218 3707 2310 2573 3881
数据准备
激活数据管理窗口,定义男婴出生体重的变量名为 X,然后输入男婴出生体重的原始数据。
统计分析
激活 Statistics 菜单选 Summarize 中的 Descriptives...命令项,弹出 Descriptives 对话框(图 )。
现欲对男婴出生体重进行描述性分析,故在对话框左侧的变量列表中选 x,点击钮使之进入 Variable(s)
框;本例要求将原始数据转换成 z 分值,故选 Save standardized value as variables 项。
图 描述性统计对话框
点击 Options...钮,弹出 Descriptives:Options 对话框(图 )。框中各指标的意义请读者参阅本
章第一节。选好项目后点击 Continue 钮返回 Descriptives 对话框,再点击 OK 钮即可。
图 描述性统计指标对话框
结果解释
在结果输出窗口中将看到如下统计数据:均数为 , 标准误为 , 标准差为
, 方差为 , 峰度系数为 , 峰度系数的标准误为 , 偏度系数为 , 偏度
系数的标准误为 , 全距为 , 最小值为 2272, 最大值为 4654, 有效例数为 100,无缺失
值。
Number of valid observations (listwise) =
Variable X
Mean . Mean
Std Dev Variance
Kurtosis .118 . Kurt .992
Skewness .732 . Skew .512
Range Minimum 2272
Maximum 4654 Sum
Valid observations - 20 Missing observations - 0
此外,系统以 zx 为变量名将原始数据转换成标准 z 分值,存放在原数据库中(图 )。例如,
已知均数为 , 标准差为 ,故原始值 2770 的 Z 分值为 = - ;
原始值 2770 的 Z 分值为 = 。新变量具有均值为 0、标准差为 1 的特征,亦即
变量的标准化过程。
图 原始数据及其标准 Z 分值
2770 3188 45
629146
.
.
3881 3188 45
629146
.
.
第三节 Explore 过程
主要功能
调用此过程可对变量进行更为深入详尽的描述性统计分析,故称之为探索性统计。它在一般描
述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于
用户思考对数据进行进一步分析的方案。
实例操作
[例 4-3]下表为 30 名 10 岁少儿的身高(cm)资料,试作探索性分析。
身高 身高编
号 男孩 女孩
编
号 男孩 女孩
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
数据准备
激活数据管理窗口,定义少儿身高的变量名为 X,然后再定义一个变质为 SEX,用于作性别分
组。顺序输入少儿身高的原始数据,在变量 SEX 中,男孩输入 1、女孩输入 2。
统计分析
激活 Statistics 菜单选 Summarize 中的 Explore...项,弹出 Explore 对话框(如图 ),现欲对少
儿身高资料进行分组的探索性分析,故在对话框左侧的变量列表中选 x 点击钮使之进入 Dependent
List 框,再选 sex 点击钮使之进入 Factor List 框。
图 探索性分析对话框
点击 Statistics...钮,弹出 Explore:Statistics 对话框(图 ),有如下选项:
1、Descriptives:输出均数、中位数、众数、5%修正均数、标准误、方差、标准差、最小值、
最大值、全距、四分位全距、峰度系数、峰度系数的标准误、偏度系数、偏度系数的标准误;
2、M-estimators:作中心趋势的粗略最大似然确定,输出四个不同权重的最大似然确定数;
3、Outliers:输出五个最大值与五个最小值;
4、Percentiles:输出第 5%、10%、25%、50%、75%、90%、95%位数;
5、Grouped Frequency tables:输出分组的例数与数值范围表。
本例全部选择,之后点击 Continue 钮返回 Explore 对话框。
图 探索性分析统计对话框
点击 Plot...钮弹出 Explore:Plot 对话框(图 ),在 Boxplot 栏内选 Factor levels together 项要求
按组别进行箱图绘制;在 Descriptive 栏内选 Stem-and-leaf 项要求作茎叶情形描述。之后点击 Continue
钮返回 Explore 对话框,再点击 OK 钮即可。
图 探索性分析绘图对话框
结果解释
在结果输出窗口中将看到如下统计数据:
先输出男孩的数据。共 15 例,无缺失值,其均数为 ,中位数为 ,5%修正均数为
,均数的 95%置信区间为 ~,标准误为 ,方差为 ,标准差
为 ,最小值为 ,最大值为 ,全距为 ,四分位全距为 ,偏度系数为,
偏度系数的标准误为 ,峰度系数为 ,峰度系数的标准误为 。
接着输出四个不同权重下作中心趋势的粗略最大似然确定数,对于伴有长拖尾的对称分布数据
或带有个别极端数值的数据,用粗略最大似然确定数替代均数或中位数,结果更准确。系统还进行
数据的茎叶情形描述。如系统指出男孩的身高资料中,有一个数值是茎为 12,叶为 1,其实该数值
是 ;有四个数值是茎为 12,叶为 8999,其实这些数值是 、、、。
再接着输出百分位数:第 5%位数是 ,第 10%数是 ,第 25%位数是 ,第 50%
位数是 ,第 75%位数是 136,第 90%位数是 。并输出最大五个数和最小五个数:最大五
个数是 ,,,,;最小五个数是 ,,,,。
最后输出频数分布表。
X
By SEX 1
Valid cases: Missing cases: .0 Percent missing: .0
Mean Std Err Min Skewness
Median Variance Max S E Skew .5801
5%Trim Std Dev Range Kurtosis .4961
95% CI for Mean (, ) IQR S E Kurt
M-Estimators
------------
Huber ( ) Tukey ( )
Hampel ( , , ) Andrew ( * pi )
Frequency Stem & Leaf
12 * 1
12 . 8999
13 * 1224
13 . 5567
14 * 00
Stem width:
Each leaf: 1 case(s)
Percentiles
-----------
Percentiles
Haverage
Tukey's Hinges
Extreme Values
------- ------
5 Highest Case # 5 Lowest Case #
Case: 14 Case: 1
Case: 7 Case: 9
Case: 10 Case: 12
Case: 8 Case: 4
Case: 6 Case: 15
Frequency Table
--------- -----
Bin Valid Cum
Center Freq Pct Pct Pct
下一部分为系统输出的女孩资料分析结果,其意义同上述。
X
By SEX 2
Valid cases: Missing cases: .0 Percent missing: .0
Mean Std Err Min Skewness
Median Variance Max S E Skew .5801
5% Trim Std Dev Range Kurtosis
95% CI for Mean (, ) IQR S E Kurt
M-Estimators
------------
Huber ( ) Tukey ( )
Hampel ( , , ) Andrew ( * pi )
Frequency Stem & Leaf
12 * 04
12 . 5
13 * 0233
13 . 677889
14 * 01
Stem width:
Each leaf: 1 case(s)
Percentiles
-----------
Percentiles
Haverage
Tukey's Hinges
Extreme Values
------- ------
5 Highest Case # 5 Lowest Case #
Case: 29 Case: 26
Case: 22 Case: 23
Case: 20 Case: 24
Case: 27 Case: 18
Case: 28 Case: 17
Frequency Table
--------- -----
Bin Valid Cum
Center Freq Pct Pct Pct
此外,按用户要求,系统输出箱图。图中方箱为四分位数,中心粗线为中位数,两端线为最大
值与最小值。
图 性别分组少儿身高资料的箱图
第四节 Crosstabs 过程
主要功能
调用此过程可进行计数资料和某些等级资料的列联表分析,在分析中,可对二维至 n 维列联表
(RC 表)资料进行统计描述和 χ2 检验,并计算相应的百分数指标。此外,还可计算四格表确切概
率(Fisher’s Exact Test)且有单双侧( One-Tail、 Two-Tail),对数似然比检验(Likelihood Ratio)
以及线性关系的 Mantel-Haenszelχ2 检验。
实例操作
[例 4-4]用两组大白鼠诱发鼻咽癌的动物实验中,一组单纯用亚硝胺鼻注,另一组附加维生素 B12 ,
生癌率如下表,问两组生癌率有无差别?
动物分组 生癌鼠数 未生癌鼠数 合计 生癌率(%)
亚硝胺组
亚硝胺+B12 组
52
39
19
3
71
42
1515N =
SEX
21
X
150
140
130
120
110
合计 91 22 113
数据准备
激活数据管理窗口,定义变量名:count 为频数变量(行列对应的频数值),group 为组变量
(行),test 为试验结果变量(列)。按顺序输入相应的变量(图 )。
图 原始数据的输入
统计分析
在进行计数资料的分析前,应对频数变量的值进行加权处理。先激活 Data 菜单, 选 Weight
Cases...项,弹出 Weight Cases 对话框,选 Weight cases by,再选变量 count 点击钮使之进入 Frequence
Variable 框中,点击 OK 钮完成加权。
激活 Statistics 菜单,选 Summarize 中的 Crosstabs...项,弹出 Crosstabs 对话框(如图 示)。
在 Crosstabs 对话框中,选 group 点击钮使之进入 Row(s)框,选 test 点击钮使之进入 Column(s)框。
点击 Statistics...钮,弹出 Crosstabs:Statistics 对话框(图 ), 其中 Chi-square 即为读者所熟悉的 χ2
检验。由于在实际研究中,变量间的依赖强度和特征也是需要考虑的,χ2 值不是列联强度的好的度
量,故用户可根据实际需要选择其他相关的指标:
图 列联表分析对话框
图 列联表统计方法对话框
1、定距变量的关联指标
Correlations:可作列联表行、列两变量的 Pearson 相关系数或作伴随组秩次的 Spearman 相关系
数。
2、定类变量的关联指标
Contingency coefficient:列联系数,其值 = ,界于 0~1 之间,其中 N 为总例数;
Phi and Cramer's V:ψ 系数 = ,用于描述相关程度,在四格表χ2 检验中界于-1~1 之
间,在 RC 表 χ2 检验中界于 0~1 之间;Cramer's V = ,界于 0~1 之间,其中 k 为行
数和列数较小的实际数;
Lambda:λ 值,在自变量预测中用于反映比例缩减误差,其值为 1 时表明自变量预测应变量好,
为 0 时表明自变量预测应变量差;
Uncertainty coefficient:不确定系数,以熵为标准的比例缩减误差,其值接近 1 时表明后一变量
的信息很大程度来自前一变量,其值接近 0 时表明后一变量的信息与前一变量无关。
3、定序变量的关联指标
Gamma:γ 值 = ,P 为同序对子数,Q 为异序对子数,界于 0~1 之间,所有观察实际
数集中于左上角和右下角时,其值为 1;
Somers'D:Somers'D 值 = ,T 为独立变量上不存在同分的偶对中,同序对子
数超过异序对子数的比例;
Kendall's tau-b:Kendall τ = ,T 为在 V1 变量上是同序
在 V2 变量上不是的对子数, T 为在 V2 变量上是同序在 V1 变量上不是的对子数,Kendall τ 值
界于-1~1 之间;
Kendall's tau-c:Kendall τ = ,m 为行数和列数较小的实际数,Kendall τ 值界
于-1~1 之间。
4、其他指标
Kappa:内部一致性系数;
Eta:Eta 值,其平方值可认为是应变量受不同因素影响所致方差的比例;
Risk:相对危险度。
点击 Cells...钮,弹出 Crosstabs:Cells 对话框(图 ),用于定义列联表单元格中需要计算的指标。
Observed 为实际观察数,Expected 为理论数,Row 为行百分数,Column 为列百分数,Total 为合计
百分数,Raw 为实际数与理论数的差值,Standardized 为实际数与理论数的差值除理论数,Adj.
χ
χ
2
2 + N
χ 2
N
χ 2
N(k -1)
P Q
P Q
P Q
P Q Tvd
vd
b
P Q
p Q T P Q Tv v
( )( )1 2 v1
v2 b
c
2
12
m P Q
N m
( )
( )
c
Standardized 为由标准误确立的单元格残差。选择后点击 Continue 钮返回 Crosstabs 对话框,再点击
OK 钮即可。
图 列联表单元对话框
结果解释
在结果输出窗中,系统先输出四格表资料,包括实际观察数、理论数、行百分数、列百分数和
合计百分数。
TEST by GROUP
GROUP
Count |
Exp Val |
Row Pct |
Col Pct | Row
Tot Pct | 1| 2| Total
TEST --------+--------+--------+
1 | 52 | 39 | 91
| | | %
| % | % |
| % | % |
| % | % |
+--------+--------+
2 | 19 | 3 | 22
| | | %
| % | % |
| % | % |
| % | % |
+--------+--------+
Column 71 42 113
Total % % %
接着输入有关统计数据,Pearson χ2 值为 ,P 值为 ,可认为亚硝胺+B12 组的生癌
率较高;校正χ2 值为 ,P 值为 ;M-T 检验 χ2 值为 ,P 值为 ;最小理
论数为 ,故不需作精确概率计算。(如果四格表中有理论频数小于5时,Crosstabs 命令会自动
进行 Fisher 精确概率计算)。
内部一致性系数为,Pearson 相关系数和 Spearman 相关系数均为 。
第一组对第二组的相对危险性 RR 值为 21%左右(),即可认为第二组生癌的相对危险
性为第一组的 倍。
Chi-Square Value DF Significance
-------------------- ----------- ---- ------------
Pearson 1 .01092
Continuity Correction 1 .02149
Likelihood Ratio 1 .00686
Mantel-Haenszel test for 1 .01128
linear association
Minimum Expected Frequency -
Approximate
Statistic Value ASE1 Val/ASE0 Significance
-------------------- --------- ------- -------- ------------
Kappa .07083
Pearson's R .07447 .01065 *4
Spearman Correlation .07447 .01065 *4
*4 VAL/ASE0 is a t-value based on a normal approximation, as is the significance
Statistic Value 95% Confidence Bounds
-------------------- -------- -----------------------
Relative Risk Estimate (TEST 1 / TEST 2) :
case control .21053 .05816 .76211
cohort (GROUP 1 Risk) .66165 .51872 .84397
cohort (GROUP 2 Risk)
Number of Missing Observations: 0
第五章 平均水平的比较
在正态或近似正态分布的计量资料中(如临床常见的体温、血压、脉搏、身高、体重等测量值,
几乎均为此类资料),经常在使用前一章计量资料描述过程分析后,还要进行组与组之间平均水平的
比较。本章将分四节分别介绍这一统计方法:即常用的t检验和单因素方差分析。
第一节 Means 过程
主要功能
与第四章中 Descriptives 过程相比,若仅仅计算单一组别的均数和标准差,Means 过程并无特别
之处;但若用户要求按指定条件分组计算均数和标准差,如分性别同时分年龄计算各组的均数和标
准差,则用 Means 过程更显简单快捷。
实例操作
[例5.1]某医师测得如下血红蛋白值(g%),试作基本的描述性统计分析:
对象编号 性别 年龄 血红蛋白值 对象编号 性别 年龄 血红蛋白值
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
女
男
女
女
男
男
女
男
女
女
男
男
男
女
女
女
男
男
女
男
18
16
18
17
16
18
16
18
18
17
18
18
16
17
17
17
17
16
16
18
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
女
男
男
女
女
女
女
男
男
男
男
女
女
女
男
男
男
男
女
男
16
16
18
18
17
18
17
16
16
18
16
16
18
18
18
18
17
17
16
16
数据准备
激活数据管理窗口,定义变量名:性别为 sex,年龄为 age,血红蛋白值为 hb。按顺序输入数据
(sex 变量中,男为 1,女为 2),结果见图 。
图 原始数据的输入
统计分析
激活 Statistics 菜单选 Compare Means 中的 Means...项,弹出 Means 对话框(如图 示)。今欲
分性别同时分年龄求血红蛋白值的均数和标准差,故在对话框左侧的变量列表中选 hb,点击Ⅰ钮使
之进入 Dependent List 框,选 sex 点击Ⅰ钮使之进入 Independent List 框,点击 Next,可选定分组的
第二层次(Layer 2 of 2),选 age 点击Ⅰ钮亦使之进入 Independent List 框。点击 Options...可选统计项
目:在 Cell Displays 项中,Mean 为均数、Standard deviation 为标准差、Variance 为方差、Count 为
观察单位数、Sum 为观察值总和,在 Statistics for First Layer 项中,将为第一层次的分组计算方差分
析(ANOVA table and eta)和线性检验(Test of linearity)。选好后点击 Continue 钮返回 Means 对话
框,点击 OK 钮即可。
图 Means 对话框
结果解释
在结果输出窗口中将看到如下统计数据:
- - Description of Subpopulations - -
Summaries of HB
By levels of SEX
AGE
Variable Value Label Sum Mean Std Dev Variance Cases
For Entire Population 40
SEX 1 21
AGE 16 9
AGE 17 3
AGE 18 9
SEX 2 19
AGE 16 5
AGE 17 7
AGE 18 7
Total Cases = 40
For Entire Population 一行表示 40 个观察值合计为 ,均数为 ,标准差为 ,
方差为 ,例数为 40;接下去各行分别表示先按性别分组(分男性与女性),再按年龄分组
(16,17,18 岁三组)的观察值合计、均数、标准差、方差和例数。
若在 Independent List 中未分层次,即 sex 和 age 一起放在 Layer 1 of 1 中,则结果是分别计算男
性与女性(不作年龄分组)、16,17,18 岁三组(不作性别分组)的观察值合计、均数、标准差、
方差和例数(如下所示)。
- - Description of Subpopulations - -
Summaries of HB
By levels of SEX
Variable Value Label Sum Mean Std Dev Variance Cases
For Entire Population 40
SEX 1 21
SEX 2 19
Total Cases = 40
Summaries of HB
By levels of AGE
Variable Value Label Sum Mean Std Dev Variance Cases
For Entire Population 40
AGE 16 14
AGE 17 10
AGE 18 16
Total Cases = 40
第二节 Independent-Samples T Test 过程
主要功能
调用此过程可完成两样本均数差别的显著性检验,即通常所说的两组资料的 t 检验。
实例操作
[例5.2]分别测得 14 例老年性慢性支气管炎病人及 11 例健康人的尿中 17 酮类固醇排出量
(mg/dl)如下,试比较两组均数有无差别。
病 人
健康人
数据准备
激活数据管理窗口,定义变量名:把实际观察值定义为 x,再定义一个变量 group 来区分病人与
健康人。输入原始数据,在变量 group 中,病人输入 1,健康人输入 2。结果如图 所示。
图 两组资料 t 检验的原始数据
统计分析
激活 Statistics 菜单选 Compare Means 中的 Independent-samples T Test...项,弹出 Independent-
samples T Test 对话框(如图 示)。从对话框左侧的变量列表中选 x,点击Ⅰ钮使之进入 Test
Variable(s)框,选 group 点击Ⅰ钮使之进入 Grouping Variable 框,点击 Define Groups...钮弹出 Define
Groups 定 义 框 , 在 Group 1 中 输 入 1 , 在 Group 2 中 输 入 2 , 点 击 Continue 钮 , 返 回
Independent-samples T Test 对话框,点击 OK 钮即完成分析。
图 Independent-samples T Test 对话框
结果解释
在结果输出窗口中将看到如下统计数据:
t-tests for independent samples of GROUP
Number
Variable of Cases Mean SD SE of Mean
---------------------------------------------------------------
X
GROUP 1 14 .387
GROUP 2 11 .523
---------------------------------------------------------------
Mean Difference =
Levene's Test for Equality of Variances: F= .440 P= .514
这一部分显示两组资料的例数(Numbers of cases)、均数(Mean)、标准差(SD)和标准误(SE
of Mean),显示两均数差值为 ,经方差齐性检验: F= .440 P= .514,即两方差齐。
t-test for Equality of Means 95%
Variances t-value df 2-Tail Sig SE of Diff CI for Diff
-----------------------------------------------------------------------
Equal 23 .084 .637 (, .167)
Unequal .093 .651 (, .213)
-----------------------------------------------------------------------
这一部分显示 t 检验的结果,第一行表示方差齐情况下的 t 检验的结果,第二行表示方差不齐情
况下的 t 检验的结果。依次显示值(t-value)、自由度(df)、双侧检验概率(2-Tail Sig)、差值的标
准误(SE of Diff)及其 95%可信区间(Cl for Diff)。因本例属方差齐性,故采用第一行(即 Equal)
结果:t=,P=,差别有显著性意义,即老年性慢性支气管炎病人的尿中 17 酮类固醇排出量低
于健康人。
第三节 Paired-Samples T Test 过程
主要功能
调用此过程可完成配对资料的显著性检验,即配对 t 检验。在医学领域中,主要的配对资料包
括:同对(年龄、性别、体重、病况等非处理因素相同或相似者)或同一研究对象分别给予两种不
同处理的效果比较,以及同一研究对象处理前后的效果比较。前者推断两种效果有无差别,后者推
断某种处理是否有效。
实例操作
[例5.2]某单位研究饲料中缺乏维生素 E 与肝中维生素 A 含量的关系,将大白鼠按性别、体
重等配为 8 对,每对中两只大白鼠分别喂给正常饲料和维生素 E 缺乏饲料,一段时期后将之宰杀,
测定其肝中维生素 A 含量(Ⅰmol/L)如下,问饲料中缺乏维生素 E 对鼠肝中维生素 A 含量有无影
响?
肝中维生素 A 含量(Ⅰmol/L)大白鼠对别
正常饲料组 维生素 E 缺乏饲料组
1
2
3
4
5
6
7
8
数据准备
激活数据管理窗口,定义变量名:正常饲料组测定值为 x1,维生素 E 缺乏饲料组测定值为 x2,
数据输入后结果如图 所示。
图 配对 t 检验的原始数据
统计分析
激活 Statistics 菜单选 Compare Means 中的 Paired-samples T Test...项,弹出 Paried-samples T Test
对话框(如图 示)。从对话框左侧的变量列表中点击 x1,这时在左下方的 Current Selections 框中
Variable 1 处出现 x1,再从变量列表中点击 x2,左下方的 Current Selections 框中 Variable 2 处出现 x2。
点击Ⅰ钮使 x1、x2 进入 Variables 框,点击 OK 钮即完成分析。
图 Paried-samples T Test 对话框
结果解释
在结果输出窗口中将看到如下统计数据:
- - - t-tests for paired samples - - -
Number of 2-tail
Variable pairs Corr Sig Mean SD SE of Mean
--------------------------------------------------------------------------------------------------------------
X1
8 .586 .127
X2
-------------------------------------------------------------------------------
这段结果显示本例共有 8 对观察值,相关系数(C)为 ,相关系数的显著性检验表明
P=;变量 x1 的均数(Mean)、标准差(SD)、标准误(SE of Mean)分别为 、、
,变量 x2 的均数、标准差、标准误分别为 、、。
Paired Differences |
Mean SD SE of Mean | t-value df 2-tail Sig
----------------------------------------------------|--------------------------------------------------
| 7 .004
95% CI (, ) |
这段结果显示变量 x1、x2 两两相减的差值均数、标准差、标准误 95%可信区间(95% Cl)分别
为 、、,95%可信区间(95% Cl)为 ,。配对检验结果为:t=,
P=, 差别具高度显著性意义,即饲料中缺乏维生素 E 对鼠肝中维生素 A 含量确有影响。
第四节 One-Way ANOVA 过程
主要功能
在实际研究中,经常需要比较两组以上样本均数的差别,这时不能使用 t 检验方法作两两间的
比较(如有人对四组均数的比较,作 6 次两两间的 t 检验),这势必增加两类错误的可能性(如原先
Ⅰ定为 ,这样作多次的 t 检验将使最终推断时的Ⅰ>)。故对于两组以上的均数比较,必须使
用方差分析的方法,当然方差分析方法亦适用于两组均数的比较。方差分析可调用此过程可完成。
本过程只能进行单因素方差分析,即完全随机设计资料的方差分析。对于随机区组设计资料方
差分析的方法,将在第五章介绍。
实例操作
[例5.4]某单位研究两种不同制剂治疗钩虫的效果,用大白鼠作试验。11 只大白鼠随机分配
于 3 组:一组为对照组、另外二组分别为使用甲、乙制剂的实验组。试验方法是:用药前每鼠人工
感染 500 条钩蚴,感染后第 8 天实验组分别给予甲、乙制剂,对照组不给药,第 10 天全部解剖检查
鼠体内活虫数,结果如下,问两制剂是否有效?
对照组 甲制剂组 乙制剂组
279
334
303
338
298
129
174
110
210
285
117
数据准备
激活数据管理窗口,定义变量名:实际观察值定义为 x,组别用变量 range 表示:其中对照组的
值为、甲制剂实验组的值为、乙制剂实验组的值为,输入后的结果如图 所示。
图 单因素方差分析的原始数据
统计分析
激活 Statistics 菜单选 Compare Means 中的 One-Way ANOVA...项,弹出 One-Way ANOVA 对话
框(如图 示)。从对话框左侧的变量列表中选 x,点击Ⅰ钮使之进入 Dependent List 框,选 range
点击Ⅰ钮使之进入 Factor 框,点击 Define Range 钮打开 One-Way ANOVA: Define Range 对话框,因
本例为 3 组比较,故在 Minimum 处输入 1,在 Maximum 处输入 3,点击 Continue 钮返回 One-Way
ANOVA 对话框。如果欲作多个样本均数间两两比较,可点击该点击对话框的 Post Hoc...钮打开
One-Way ANOVA: Post Hoc Multiple Comparisons 对话框(如图 所示),这时可见在 Tests 框中有
7 种比较方法供选择:
图 One-Way ANOVA 对话框
图 One-Way ANOVA:Post Hoc Multiple Comparisons 对话框
Least-significant difference:最小显著差法。Ⅰ可指定 0~1 之间任何显著性水平,默认值为 ;
Bonferroni:Bonferroni 修正差别检验法。Ⅰ可指定 0~1 之间任何显著性水平,默认值为 ;
Duncan’s multiple range test:Duncan 多范围检验。只能指定Ⅰ为 或 或 ,默认值为
;
Student-Newman-Keuls:Student-Newman-Keuls 检验,简称 N-K 检验,亦即 q 检验。Ⅰ只能为
;
Tukey’s honestly significant difference:Tukey 显著性检验。Ⅰ只能为 ;
Tukey’s b:Tukey 另一种显著性检验。Ⅰ只能为 ;
Scheffe:Scheffe 差别检验法。Ⅰ可指定 0~1 之间任何显著性水平,默认值为 。
本例选用 Student-Newman-Keuls 显著性检验法。在 Sample Size Estimate 框中有 Harmonic average of
pairs 和 Harmonic average of all groups 两选项,前者表示仅采用相互比较两组的调和均数,后者表示
采用所有组(含比较的两组和尚未比较的其他组)的调和均数,本例选用前者,点击 Continue 钮返
回 One-Way ANOVA 对话框后,再点击 OK 钮即完成分析。
结果解释
在结果输出窗口中将看到如下统计数据:
- - - - - O N E W A Y - - - - -
Variable X
By Variable RANGE
Analysis of Variance
Sum of Mean F F
Source . Squares Squares Ratio Prob.
Between Groups 2 .0033
Within Groups 8
Total 10
上述结果显示组间、组内(实际上本例应称之为“剩余”)和合计的自由度(.)、离均差平方
和(Sum of Squares,即 SS)、均方(Means Squares,即 SS)、F 值(F Ratio)和 P 值(F Prob.),本例
F=,P=,表明甲、乙两种制剂中必有一种制剂治疗钩虫是有效的。
为了解哪一种制剂是有效的,本例采用 SNK 两两比较法,结果如下:
- - - - - O N E W A Y - - - - -
Variable X
By Variable RANGE
Multiple Range Tests: Student-Newman-Keuls test with significance level .050
The difference between two means is significant if
MEAN(J)-MEAN(I) >= * RANGE * SQRT(1/N(I) + 1/N(J))
with the following value(s) for RANGE:
Step 2 3
RANGE
(*) Indicates significant differences which are shown in the lower triangle
G G G
r r r
p p p
2 3 1
Mean RANGE
Grp 2
Grp 3
Grp 1 * *
上述结果显示:如果两均数的差值 ×RANGE× ,则差别有显著性意义。上
1
1
1
2n n
面已用“*”标出 2、3 两组与 1 组比较均有显著性差异。具体作法是:以甲制剂与对照组的比较为例,
均数差值 = - = ,已知 RANGE 为 ,n1=5,n2=3,按上式求得 ,
因 > ,故甲制剂有效;余同。即甲、乙制剂治疗钩虫均有效。因甲制剂与乙制剂比
较,均数差值为 ,按上式求得界值为 ,故尚无证据表明甲、乙制剂间效果有差别。
第六章 方差分析
方差分析是 发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素
的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一
是研究中施加的对结果形成影响的可控因素。方差分析的基本思想是:通过分析研究中不同来源的
变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
方差分析主要用于:1、均数差别的显著性检验,2、分离各有关因素并估计其对总变异的作用,
3、分析因素间的交互作用,4、方差齐性检验。
第一节 Simple Factorial 过程
主要功能
调用此过程可对资料进行方差分析或协方差分析。在方差分析中可按用户需要作单因素方差分
析(其结果将与第五章第四节相同)或多因素方差分析(包括医学中常用的配伍组方差分析);当观
察因素中存在有很难或无法人为控制的因素时,则可对之加以指定以便进行协方差分析。
实例操作
[例 6-1]下表为运动员与大学生的身高(cm)与肺活量(cm3)的数据,考虑到身高与肺活量有
关,而一般运动员的身高高于大学生,为进一步分析肺活量的差异是否由于体育锻炼所致,试作控
制身高变量的协方差分析。
运 动 员 大 学 生
身高 肺活量 身高 肺活量
4300
3850
4100
4300
4800
4000
5400
3450
4100
3800
3300
3450
3250
3600
4000
4800
4800
4500
4780
3700
5250
4250
4800
5000
3700
3600
4050
3200
3950
4000
4150
3450
3250
4100
3650
3950
3500
3900
3450
3850
数据准备
激活数据管理窗口,定义变量名:组变量为 group(运动员=1,大学生=2),身高为 x,肺活量
为 y,按顺序输入相应数值,建立数据库,结果见图 。
图 原始数据的输入
统计分析
激活 Statistics 菜单选 ANOVA Models 中的 Simple Factorial...项,弹出 Simple Factorial ANOVA
对话框(图 )。在变量列表中选变量 y,点击Ⅰ钮使之进入 Dependent 框;选分组变量 group,点
击Ⅰ钮使之进入 Factor(s)框中, 并点击 Define Range...钮在弹出的 Simple Factorial ANOVA:Define
Range 框中确定分组变量 group 的起止值(1,2);选协变量 x,点击Ⅰ钮使之进入 Covariate(s)框中。
图 协方差分析对话框
点击 Options...框,弹出 Simple Factorial ANOVA:Options 对话框。系统在协方差分析的方法
(Method)上有三种选项:
1、Unique:同时评价所有的效应;
2、Hierarchical:除主效应外,逐一评价各因素的效应;
3、Experimental:评价因素干预之前的主效应。
本例选 Unique 方法,之后点击 Continue 钮返回 Simple Factorial ANOVA 对话框,再点击 OK 钮
即可。
结果解释
在结果输出窗口中可见如下统计数据:
先输出肺活量总均数和两组的肺活量均数,总均数为 ,运用员组均数为 ,大学
生组为 。
接着协方差分析表明,混杂因素 X(身高)两组间是有差异的(F=,P=),控制其
影响后,两组间肺活量的差别依然存在(F=,P=),故可以认为两组间肺活量的均数在消
除了身高因素的影响之后仍有差别,运动员的肺活量大于大学生,即体育锻炼会提高肺活量。
最后系统输出公共回归系数, = ,该值可用于求修正均数:
= - ( - )
本例为 = - ×( - )=
= - ×( - )=
Y by GROUP
Total Population
( 40)
GROUP 1 2
( 20) ( 20)
Y by GROUP
bc
Yi
' Yi bc X i X
Y运动员
'
Y大学生
'
with X
UNIQUE sums of squares
All effects entered simultaneously
Sum of Mean Sig
Source of Variation Squares DF Square F of F
Covariates 1630763 1 .002
X 1630763 1 .002
Main Effects 1407847 1 .004
GROUP 1407847 1 .004
Explained 6981685 2 .000
Residual 5649992 37
Total 12631678 39
40 cases were processed.
0 cases (.0 pct) were missing.
Covariate Raw Regression Coefficient
X
第二节 General Factorial 过程
主要功能
调用此过程可对完全随机设计资料、配伍设计资料、析因设计资料、正交设计资料等等进行多
因素方差分析或协方差分析。
实例操作
[例 6-2]下表为三因素析因实验的资料,请用方差分析说明不同基础液与不同血清种类对钩端螺
旋体的培养计数的影响。
血清种类(B)
兔血清浓度(C) 胎盘血清浓度(C)
基础液
(A)
5% 8% 5% 8%
缓冲液 648
1246
1398
1144
1877
1671
830
853
441
578
669
643
909 1845 1030 1002
蒸馏水 1763
1241
1381
2421
1447
1883
1896
1926
920
709
848
574
933
1024
1092
742
自来水 580
1026
1026
830
1789
1215
1434
1651
1126
1176
1280
1212
685
546
595
566
数据准备
激活数据管理窗口,定义变量名:基础液为 base,血清种类为 sero,血清浓度为 pct,钩端螺旋
体的培养计数为 X,按顺序输入相应数值,建立数据库。
统计分析
激活 Statistics 菜单选 ANOVA Models 中的 General Factorial...项,弹出 General Factorial ANOVA
对话框(图 )。在对话框左侧的变量列表中选变量 x,点击Ⅰ钮使之进入 Dependent Variable 框;
选要控制的分组变量 base、sero 和 pct,点Ⅰ钮使之进入 Factor(s)框中,并分别点击 Define Range 钮,
在弹出的 General Factorial ANOVA:Define Range 对话框中确定各变量的起止值,本例变量 base 的起
止值为 1、3,变量 sero 的起止值为 1、2,变量 pct 的起止值为 1、2。之后点击 OK 钮即可。
图 析因方差分析对话框
结果解释
在结果输出窗口中,系统显示 48 个观察值进入统计,三个因素按其各自水平共产生 12 种组合。
分析表明,模型总效应的 F 值为 ,P 值 < ,说明三因素间存在有交互作用。单因素
效应和交互效应导致的组间差别比较结果是:
单因素组间比较:
A:基础液(BASE)
F = ,P = ,说明三种培养基培养钩体的计数有差别;
B:血清种类(SERO)
F = ,P < ,说明两种血清培养钩体的计数有差别;
C:血清浓度(PCT)
F = ,P = ,说明两种血清浓度培养钩体的计数无差别。
两因素构成的一级交互作用:
A×B:基础液(BASE)×血清种类(SERO)
F = ,P = ,交互作用明显;
B×C:血清种类(SERO)×血清浓度(PCT)
F = ,P < ,交互作用明显;
A×C:基础液(BASE)×血清浓度(PCT)
F = ,P = ,交互作用不明显。
三因素构成的二级交互作用:
A×B×C:基础液(BASE)×血清种类(SERO)×血清浓度(PCT)
F = ,P = ,交互作用明显。
48 cases accepted.
0 cases rejected because of out-of-range factor values.
0 cases rejected because of missing data.
12 non-empty cells.
1 design will be processed.
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Univariate Homogeneity of Variance Tests
Variable .. X
Cochrans C(3,12) = .34004, P = .036 (approx.)
Bartlett-Box F(11,897) = , P = .069
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
* * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * *
Tests of Significance for X using UNIQUE sums of squares
Source of Variation SS DF MS F Sig of F
WITHIN+RESIDUAL 36
BASE 2 .012
PCT 1 .070
SERO 1 .000
BASE BY PCT 2 .78 .465
BASE BY SERO 2 .011
PCT BY SERO 1 .000
BASE BY PCT BY SERO 2 .003
(Model) 11 .000
(Total) 47
R-Squared = .763
Adjusted R-Squared = .691
第三节 Multivarite 过程
主要功能
调用此过程可进行多元方差分析。此外,对于一元设计,如涉及混合模型的设计、分割设计(又
称列区设计)、重复测量设计、嵌套设计、因子与协变量交互效应设计等,此过程均能适用。
实例操作
[例 6-3]甲地区为大城市,乙地区为县城,丙地区为农村。某地分别调查了上述三类地区 8 岁男
生三项身体生长发育指标:身高、体重和胸围,数据见下表,问:三类地区之间男生三项身体生长
发育指标的差异有无显著性?
甲地区 乙地区 丙地区学 生
编号 身高 体重 胸围 身高 体重 胸围 身高 体重 胸围
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
数据准备
激活数据管理窗口,定义变量名:地区为 G,身高为 X1,体重为 X2,胸围为 X3,按顺序输入
相应数值,变量 G 的数值是:甲地区为 1,乙地区为 2,丙地区为 3。
统计分析
激活 Statistics 菜单选 ANOVA Models 中的 Multivarite...项,弹出 Multivarite ANOVA 对话框
(图 )。首先指定供分析用的变量 x1、x2、x3,故在对话框左侧的变量列表中选变量 x1、x2、
x3,点击Ⅰ钮使之进入 Dependent Variable 框;然后选变量 g(分组变量)点击Ⅰ钮使之进入 Factor(s)
框中,并点击 Define Range 钮,确定 g 的起始值和终止值。
图 多元方差分析对话框
点击 Options...钮,弹出 Multivarite ANOVA:Options 对话框,选择需要计算的指标。在 Factor(s)
栏内选变量 g,点击Ⅰ钮使之进入 Display Means for 框,要求计算平均值指标;在 Matriced Within Cell
栏内选 Correlation、Covariance、SSCP 项,要求计算单元内的相关矩阵、方差协方差矩阵和离均差
平方和交叉乘积矩阵;在 Error Matrices 栏内也选上述三项,要求计算误差的相关矩阵、方差协方差
矩阵和离均差平方和交叉乘积矩阵;在 Diagnostics 栏内选 Homogeneity test 项,要求作变量的方差
齐性检验。之后点击 Continue 钮返回 Multivarite ANOVA 对话框,最后点击 OK 钮即可。
结果解释
在结果输出窗口中将看到如下分析结果:
系统首先显示共 90 个观察值进入统计分析,因分组变量 g 为三个地区,故分析的单元数为 3。
然后输出 3 个应变量(x1、x2、x3)的方差齐性检验结果,分别输出了 Cochran C 检验值及其显著
性水平 P 值、Bartlett-Box F 检验值及其显著性水平 P 值。其中
身高:C = ,P = ;F = ,P = ;
体重:C = ,P = ;F = , P = ;
胸围:C = , P = ;F = , P = ;
可见 3 项指标的方差基本整齐(P 值均大于 )。
90 cases accepted.
0 cases rejected because of out-of-range factor values.
0 cases rejected because of missing data.
3 non-empty cells.
1 design will be processed.
CELL NUMBER
1 2 3
Variable
G 1 2 3
Univariate Homogeneity of Variance Tests
Variable .. X1
Cochrans C(29,3) = .39825, P = .540 (approx.)
Bartlett-Box F(2,17030) = , P = .363
Variable .. X2
Cochrans C(29,3) = .43787, P = .227 (approx.)
Bartlett-Box F(2,17030) = , P = .011
Variable .. X3
Cochrans C(29,3) = .47239, P = .089 (approx.)
Bartlett-Box F(2,17030) = , P = .127
Cochran C 检验和 Bartlett-Box F 检验对考查协方差矩阵的相等性比较方便,但还不够。于是系
统接着分别输出了三类地区(即各个单元)各生长发育指标的离均差平方和交叉乘积矩阵和方差协
方差矩阵。之后作 Box M 检验,Box M 检验提供矩阵一致性的多元测试,本例 Boxs M = ,
在基于方差分析的显著性检验中 F = ;在基于 χ2 的显著性检验中 χ2 = , 两者 P <
,故认为矩阵一致性不佳。
Cell Number .. 1
Sum of Squares and Cross-Products matrix
X1 X2 X3
X1
X2
X3
Variance-Covariance matrix
X1 X2 X3
X1
X2
X3
Cell Number .. 1 (Cont.)
Correlation matrix with Standard Deviations on Diagonal
X1 X2 X3
X1
X2 .853
X3 .415 .581
Determinant of Covariance matrix of dependent variables =
LOG(Determinant) =
Cell Number .. 2
Sum of Squares and Cross-Products matrix
X1 X2 X3
X1
X2
X3
Variance-Covariance matrix
X1 X2 X3
X1
X2
X3
Correlation matrix with Standard Deviations on Diagonal
X1 X2 X3
X1
X2 .697
X3 .482 .734
Determinant of Covariance matrix of dependent variables =
LOG(Determinant) =
Cell Number .. 3
Sum of Squares and Cross-Products matrix
X1 X2 X3
X1
X2
X3
Variance-Covariance matrix
X1 X2 X3
X1
X2
X3
Correlation matrix with Standard Deviations on Diagonal
X1 X2 X3
X1
X2 .680
X3 .595 .886
Determinant of Covariance matrix of dependent variables =
LOG(Determinant) =
Pooled within-cells Variance-Covariance matrix
X1 X2 X3
X1
X2
X3
Determinant of pooled Covariance matrix of dependent vars. =
LOG(Determinant) =
Multivariate test for Homogeneity of Dispersion matrices
Boxs M =
F WITH (12,36680) DF = , P = .000 (Approx.)
Chi-Square with 12 DF = , P = .000 (Approx.)
下面系统输出将三类地区看成一个大样本时的离均差平方和交叉乘积矩阵。如 X1、X2 和 X3 的
离均差平方和分别为 、 和 。在此基础上,进行多元差异的检验。通常有四种
方法:
1、Pillai 轨迹:V =
2、Wilks λ 值:W =
3、Hotelling 轨迹:T =
4、Roy 最大根:R =
式中 λmax 为最大特征值, λi 为第 i 个特征值,s 为非零特征值个数。根据这些值变换的 F 检验均有
显著性(P<),说明三类地区各生长发育指标之间的差别有高度显著性。
i
s
i 1
1
1Σ λ
i
s
i 1
1
1Π λ
i
s
i 1
1
1Σ λ
i
s
1 1
Σ
λ
λ
max
max
这一计算结果对上述三项生长发育指标进行了单因素的方差分析,可见:
X1: SS = , F =
X2: SS = , F =
X3: SS = , F =
差别均有显著性,说明三项生长发育指标各地区间的差别均有显著性。
Combined Observed Means for G
Variable .. X1
G
1 WGT.
UNWGT.
2 WGT.
UNWGT.
3 WGT.
UNWGT.
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Variable .. X2
G
1 WGT.
UNWGT.
2 WGT.
UNWGT.
3 WGT.
UNWGT.
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Variable .. X3
G
1 WGT.
UNWGT.
2 WGT.
UNWGT.
3 WGT.
UNWGT.
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
WITHIN+RESIDUAL Correlations with Std. Devs. on Diagonal
X1 X2 X3
X1
X2 .747
X3 .490 .713
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Statistics for WITHIN+RESIDUAL correlations
Log(Determinant) = .00000
Bartlett test of sphericity = . with 3 D. F.
Significance = .
F(max) criterion = with (3,87) D. F.
WITHIN+RESIDUAL Variances and Covariances
X1 X2 X3
X1
X2
X3
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
WITHIN+RESIDUAL Sum-of-Squares and Cross-Products
X1 X2 X3
X1
X2
X3
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
EFFECT .. G
Adjusted Hypothesis Sum-of-Squares and Cross-Products
X1 X2 X3
X1
X2
X3
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Multivariate Tests of Significance (S = 2, M = 0, N = 41 1/2)
Test Name Value Hypoth. DF Error DF Sig. of F
Pillais .51227 .000
Hotellings