Statistical Program
for Social Sciences
第一讲 SPSS简介及数据编码录入
1 简介
SPSS是Statistical Program for Social Sciences 的简
称,即社会科学统计程序,由美国SPSS公司1970
年代推出,迄今已有近30年的历史。是国际著名
三大社会科学统计软件包之一(SAS、SPSS、
Statis)。我们现在使用的是SPSS for Windows
版。
2 进入SPSS之前的准备工作
2-1-1数据资料的形式:
矩阵式数据数据要求每一横行为一个个案(Case),
纵列按变量排列,形成矩阵格式。
2-1数据资料的形式及编码
编码
录入
2-1-2 编码的概念:
根据一定的规则将研究资料转换为可进行统计分析
的数码资料的过程。
问题025:您认为打工的外地人对北京市的社会秩
序是否有影响?(单选)
1□有很大影响 2□有较大影响
3□没有影响 4□不好说 4
编码答案
2-1-3编码的步骤:
1)确定变量;
•变量:
用来反映文意概念的量化形式。在统计中往往指最
小的分析单位。编码就是对变量进行编码。变量由
两个部分构成:变量名和变量值。要注意区分何为
变量,何为变量值。在调查问卷中还要注意区分问
题和变量。
问题009:您有几个儿子?几个女儿?
1□儿子_______人
2□女儿________人
2
3
问题
变量1
变量2
变量1的值
变量2的值
2)制作编码表
直接过录
0-1编码
变量名: 一个数据文件中,
一个变量只能有一个唯一名称。码位:某一变量在
数据文件中占据的栏位
码数:
某一变量由几位数组成。该变量是数值型(Numeric)——如定距、定比,
还是字串型(String),如定类、定序。
前者在统计中可以做高级运算,后者则不可以。
不适于被访人回答的问题的编码。
一般采用7,97,997等。
被访人回答不知道时的编码。
一般采用8,98,998等。
被访人拒绝回答某变量时的编码。
一般采用9,99,999等。
问卷中出现漏答时的处理编码。
一般采用9,99,999等。
2
3
100011
3)编码:
根据编码表对问卷进行编码,而后将编码结果记录
在问卷上或编码纸上。
2-2 数据录入
外部式录入
内部式录入
采用DOS、WPS、CCED等软件,按ASCII码
方式录入成文本文件(*.dat;*.txt)。这
种录入方式的特点是,数据之间没有间隔,
录完一个数码后自动后移,录入速度较快。
缺点是容易错位。
采用SPSS数据编辑器(SPSS Data Editor)录
入。其优点是不容易错位,缺点是不能自动
后移,录入速度慢,数据错误不容易修改。
作业:将问卷填答好,并做出问题001
—问题011的编码表,将自己的答案在
问卷上编码。下一节课带问卷上机。
练习:
第二讲 SPSS数据定义
SPSS的运行步骤如下:
录入数据
定义数据
整理数据
统计数据
察看结果
SPSS数据定义的命令共有4个,分别用来定义数据
的变量名、变量名标签、变量值标签和缺失值。
1 变量名定义命令:Data List
1-1命令格式:
Data List File=‘原始数据文件名(*.dat)’
/变量1名 码位 变量2名 码位……变量n名 码位.
这些数据定义命令都要写在SPSS的语句窗口
(Syntax)里,而后运行。
示例:
Data list file=’c:\lianxi\’/
num 1-4 W01 5 W01a 6-7 W02 8 W03 9 W04 10.
或:
Data list file=’c:\lianxi\’/
num 1-4
W01 5
W01a 6-7
W02 8
W03 9
W04 10.
1-2要求:
•变量名不能超过8个字符;
•变量名不能以数字开头;
•变量名中不能包含+,-,×,/、?、=等运
算和逻辑符号。
•当相邻变量名称上存在顺序且码位相同时,可
用简略方法 :
W02 8 W03 9 W04 10.可换为 W02 to W04 8-10.
•当变量值是字符时,在码位后加(a);如:
W7 12(a);
•当变量值包含小数时,在码位后加(n),n表
示小数的位数。如:,在录入时要录成
44679,定义时为:W12 12-16(2);
练习:
问卷 p1变量名定义;
问卷问题010、011变量名定义;
问题012变量名定义;
运行。
2 变量名标签定义命令:Variable labels
该命令是给变量名一个说明标注。
2-1 命令格式:
Variable labels 变量1名 标签 /变量2名 标签
/变量3名 标签 ………/变量n名 标签 .
示例:
Variable Labels num 编号 /W01 性别
/W01a 出生年 /W02 婚姻状况 /W03 文化程度 .
或:
Variable Labels
num 编号
/W01 性别
/W01a 出生年
/W02 婚姻状况
/W03 文化程度 .
或:
Variable Labels
num 编号
W01 性别
W01a 出生年
W02 婚姻状况
W03 文化程度 .
2-2 要求:
•变量名要和已定义过的名称相一致;
•标签用中、西文均可,但长度不要超过120个字符,
即60个汉字。
练习:
问卷 p1变量名标签定义并运行。
3. 变量值标签定义命令:Value labels
该命令是给变量的每一取值加一个说明标注。
3-1 格式:
Value Labels 变量名 值1 ‘标签’ 值2 '标
签' 值3 '标签' …
/变量名 值1 ‘标签’ 值2 ‘标签’ 值3 ‘标
签’ … .
示例:
Value labels
W01 1'男' 2'女'
/W02 1‘未婚’ 2‘已婚’ 3‘离婚后未再婚’ 4‘离
婚后再婚’
5‘丧偶后未再婚’ 6‘丧偶后再婚’ 7‘未婚同居'
/W03 1‘不识字或识字很少’ 2‘初小’ 3‘高小’
4‘初中’
5‘高中中专或中技’ 6‘大专’ 7‘大学本科’ 8
‘研究生以上’
/W04 1‘不识字或识字很少’ 2‘初小’ 3‘高小’
4‘初中’
5‘高中中专或中技’ 6‘大专’ 7‘大学本科’
8‘研究生以上’ 0‘不适用’ .
3-2 要求:
•变量名要和已定义过的名称相一致;
•标签用中、西文均可,但长度不要超过60个字符,
即30个汉字。
练习:
问卷问题001—007的变量值标签定义并运行。
4 缺失值定义命令:Missing Value
4-1 格式:
Missing Value 变量名 变量名 变量名……(缺失值1
,缺失值2,……)
/变量名 变量名 变量名……(缺失值1,缺失值2,
……) .
示例:
Missing Value W01 W02 W03(9)/W04 (0,9)
/W01a (99) .
4-2 要求:
缺失值的定义与前面的命令格式不同,它是按照
缺失值的码位数来排列变量的。有相同码位数的
变量放在一组。
上机作业:
1、在DOS下的Edit编辑器下录入问卷。
2、运用SPSS的4个数据定义命令对问卷的
第一页进行定义。