SPSS数据分析
教程
作者:李洪成 姜宏华
第2章 数据文件的
建立和管理
目录
数据管理的特点
SPSS数据编辑器简介
开始SPSS
SPSS的数据编辑器界面
新建数据文件、数据字典
保存文件
读入数据
读入Excel数据
读入文本数据
读入数据库数据
数据文件的合并
添加个案
添加变量
数据文件的拆分
本章学习目标
理解信息、数据与数据处理的基本概念;
了解SPSS数据编辑器的特点,熟悉SPSS的变量视图和数据视图,掌握SPSS常用的工具按钮;
掌握数据录入SPSS软件的方法;
掌握把电子表格、数据库、文本文件等格式的数据文件读入SPSS软件的方法;
掌握SPSS数据集的数据字典;
学习合并两个数据文件的方法;
明确分割SPSS数据文件的方法。
SPSS数据管理的特点
SPSS数据管理器与Excel电子表格十分相似,所见即所得 。
SPSS数据文件的默认格式为*.sav。SPSS 16以及更高版本输出的结果文件的默认格式为*.spv。SPSS统计分析的结果可以用文件的形式保存下来。
SPSS的数据形式
SPSS数据编辑器的每一行数据称为一个个案(Case),对应一个对象的记录 。
每一列数据代表个体的属性,即变量(Variable)
SPSS数据文件是一种有结构的数据文件:
年级 性别 问题1…… 问题n
1 1 ………. 4
2 2 ……… 2
…………………………………...
3 1 ……… 1
文件结构
数据
个案case
变量名
SPSS数据编辑器简介
*
数据编辑器(1)-数据视图
数据编辑器
用户可以直接在数据视图中对数据进行修改。
可以直接在数据视图中进行复制、粘贴,也可以直接修改某个个案的属性值
删除某一行或者某一列,添加一列(插入变量),添加一行(插入个案);
可以进行查找、(批量)查找替换等。
数据编辑器(2) -变量视图
SPSS常用工具按钮
新建数据文件
刚刚完成一项调查或者试验,可以把数据直接输入到SPSS软件中,建立SPSS数据文件。
把数据输入SPSS以前,先定义数据文件的结构。
数据的定义
数据文件的建立
*
数据的输入操作(1)
对12个参加减肥活动的人做了一项调查。每个被调查者有一个ID,然后调查他们的身高、参加活动以前的体重、参加活动以后的体重、性别、政治派别以及8个有关性格的问题。我们把这些收集到的调查问卷结果输入SPSS中。
数据的输入操作(2)
ID号(id)
性别(sex):1:男; 2:女
1, 2, 1, 2, 2, 1, 2, 1, 1, 1, 2, 2
身高(height)
76,59,67,65,63,72,70,68,69,74,68,63
参加活动以前的体重(before)
185 113 145 156 109 191 155 165 175 180 135 118
参加活动以后的体重(after)
176 90 140 135 100 184 130 158 165 172 120 102
数据的输入操作(3)
政治派别(party)
2 1 1 1 1 2 2 2 1 1 2 2
8个有关性格的问题(分别记为e1到e8)
输入数据时候应该注意问题
字符型数据
在SPSS中,字符型数据值是区分大小写的,小写的m和大写的M是不一样的。
字符型数据也可以设置值标签。例如,“sex”变量的两个取值为M,F,他们的值标签分别为Female, Male。
如果值标签为英语,可以单击“拼写”进行拼写检查,以检查值标签的英文拼写。
缺失值处理
如果有数据缺失,SPSS对于字符型数据和数值型数据有不同的处理方式。
对于数值型数据,缺失值默认为“.”;对于字符串型数据,系统默认值为空。
保 存 文 件
在数据输入过程中,要经常注意保存数据,而不要等到所有数据输入完成之后再进行保存。这样可以避免例如计算机故障或者突然断电造成的不必要的的数据丢失。
SPSS可以对变量有选择地进行保存 。可以选择你需要的变量进行保存。
可以选择不同的格式对SPSS数据文件进行保存
设置文件保存的路径
SPSS读入数据
SPSS支持的数据文件格式
SPSS固有的数据文件格式 .sav,便携式文件*.por,*.sys
SAS格式文件
Excel文件
文本文件(有分隔符的文件或者固定宽度的文件)
数据库文件(Acess,Oracle,MySql,Sql Server等)
读入Excel类型的数据(1)
选择【文件】→【打开】→【数据】,文件类型选择Excel
打开数据文件:Chapter 2
读入Excel数据:注意问题
从第一行数据读入变量名 ?
在SPSS读入Excel文件时,必须先关闭要读入的Excel数据文件。
建议在读入Excel文件以前,先仔细检查Excel文件中的数据,确保格式正确,并删除和数据无关的部分以及空行和空列,然后再运行SPSS读入该文件。
读入文本数据(1)
【文件】→【打开】,文件类型选择“文本文件(*.txt,*.dat)”
选择“Chapter 2 ”
读入文本数据(2):注意问题
一定要正确设定变量间的分隔符才能够保证导入数据的正确性。
在点击【下一步】之前,要仔细检查数据预览部分,如发现不正确的部分需要找到出错的原因,及并时返回相应的步骤进行修改。
读入数据库数据
首先需要建立ODBC数据源
读入Access数据库文件Chapter 2
建立ODBC数据源 (1)
在Windows XP中
选择
“开始”菜单→“设置(S)” →“控制面板(C)”
→ “管理工具” → “数据源(ODBC)” ,建立ODBC数据源
建立ODBC数据源 (2)
建立ODBC数据源 (3):输入数据源名称
数据文件的合并(1)
有时候,要把多个数据文件合并为一个数据文件。如下面两个例子所示:
一个公司在全国各地有30多个分公司,每个月公司总部需要把各分公司的销售人员的销售情况合并到一个数据文件中。
一个学校教务部门每一个学期对学生的成绩建立一个数据文件,在最后学生毕业前,需要把学生四个学年的成绩(8个数据文件)进行汇总。
数据文件的合并(2)
上述第二个例子中的合并8个成绩文件和第一个例子中的合并30个子公司的销售情况是不同的。
第一个例子是合并行;第二个例子是合并列。SPSS中分别通过添加记录和添加变量来进行。
数据文件的合并(3)
针对以上两种不同的情况,合并数据文件分为添加变量(或称为合并变量)和添加个案(或称为合并记录、合并个案)。在SPSS中的操作方式分别为添加个案和添加变量两种。
添加个案(1)
添加个案示例(1)
打开两个数据文件和,选择为当前工作数据文件。
选择【数据】→【合并文件】→【添加个案】
添加个案示例(2)
SPSS用“(*)”表示变量来自于当前活动数据文件中的变量,而用“(+)”表示将要和当前数据文件进行合并的数据文件中的变量。
添加个案示例(3)
如果有3个或者以上的数据文件需要合并,可以先合并两个,依次进行。 这样很繁琐。
可以通过编程来实现一次合并3个或者以上的数据文件 (至多一次合并50个文件)。
添加变量(1)
如果有两个数据文件,它们含有相同的个案,但是不同文件含有的属性不同(即不同的变量) ,现在需要把这两个文件合并为一个文件。合并这样的数据文件就是添加变量。
如果需要合并的数据文件中都含有同一个变量,该变量用于标识这些数据文件中的个案,并且可以按照该变量来匹配数据文件中的记录,该变量称为关键变量。
合并变量分类(1)
一对一合并
对于两个数据文件,如果进行一对一合并,一个文件中的每个个案只能根据关键变量匹配另一个文件中唯一的个案。反之亦然。
如果一个文件中的某个个案在另一个文件中找不到个案来匹配,则该个案于第二个文件的变量上的取值为缺失值。反之亦然。
如果一个文件中的某个个案在另一个文件中找到两个或者两个以上的个案来匹配,则该个案只取第二个文件中第一个相匹配的个案来连接。反之亦然。
合并变量示意图:一对一
合并变量分类(2)
有两个数据文件,一个是国家文件 ,它含有3个变量:国家、地区和变量1 ;另一个数据文件是地区数据,该文件含有两个变量:地区和变量2。
国家数据文件中的前3个国家的地区变量值都是1,因此合并后的数据文件中前3个个案都和地区数据文件的第1个个案相匹配。
合并变量示意图:一对多
课堂示例
打开SPSS的两个数据文件: 和 Customer 。
把作为当前工作文件,它记录了对某软件产品A进行的客户满意度调查数据。是基于该产品的历史销售情况,按照工作单位性质和使用A产品的时间分类客户统计的年收入。
分析的目的是比较不同收益类型客户的概要特征。
先按照关键变量“orgntype”(客户工作单位的类型)进行合并文件。选择【数据】→【排序个案】 ,首先按照关键变量“orgntype”排序。
然后选择【数据】→【合并文件】→【添加变量】 进行合并。
数据的拆分
在实际数据分析中,有时候需要按照不同的类别或者组来进行分析。这就需要先把数据文件中不同的组分离出来 。
用【数据】→【选择个案】来分别选出各个组 。
用【数据】→【拆分文件】方式。
在SPSS菜单【转换】→【计算变量】的“如果…”部分进行选择
练习题
数据文件Chapter 2 为例,变量“martial”记录了婚姻状况,现在需要对不同婚姻状况的人进行比较分析。
集体项目
*
*