5 对样本数据的频数分析──统
计图表的制作
第一节 一个单选题或填空题的频数分析
• 频数分析的题形与数据录入
• 单项选择题(只能选择一种)、多项选择
题以及主观题。主观选择题的一些处理方
式与多项选择题的一些处理方式有些相似
之处 。
• 数据录入
只需要把相应的选择的选项所代表的数据
录入 ,对填空题,要把意思相同或相似的
归为一组,并按顺序把这些归纳的组项进
行编号,再录入。
•
第二节 多个单选题交叉分组下的频数分析
• 数据录入
• 根据最终的编号数来设置变量,有多少个
编号就设置多少个变量,在录入数据时,
被选择的项就用“1”来表示,没有选择的
项就不填写 。 两分法
实例 某种商品消费者情况的媒体调查
• 1.您的性别是 A 男 B 女
• 2.您的学历是 A 高中以下 B 大专 C 大本 D 硕士生 E 博
士或博士以上
• 3.您获取商品的信息来源于 A 电视广告 B 报纸广告 C 杂
志广告 D 广播广告 E 其它
• 分析:很显然,第一、二个问题都是单项选择题,而第三
个问题则是不定项选择题,假如我们调查了20份调查问卷,
调查数据可见数据库,其中在第三个问题中,除了已有的
选项外,有了被调查者还在其它的上面填写了网上宣传、
商家(或厂家)的现场促销、亲朋好友的推荐、推销员的
推销)。
• 首先编码:
a.对于第一个题目的选项,设置一个变量,用数
据1表示男、用数据0表示女,
b.对于第二个问题,设置一个变量,用1表示高中
以下、用2表示大专、用3表示大本、用4表示硕士
、用5表示博士或博士以上,
对于第三个问题,
c.设置8个变量(分别对应 电视广告、报纸广告、
杂志广告、广播广告、网上宣传、商家(或厂家)
的现场促销、亲朋好友的推荐、推销员的推销,
这里直接用中文表示它们),只要有选择,就在
相应的数据库上用1表示,没有选择则不选择(或
0)。
• 其次,具体调查数据见以下的数据库
单项的频数分析
根据上面的数据库,打开相应的界面,并把性别的这个变
量移到右边Variable(s)下面,结果如下图所示:
• 按OK,得到以下的分析结果
• 也可以charts….-Chart Type -Pie charts-Continue-OK做
饼图,很显然,由SPSS软件生成的图形与由Excel软件生
成的图形是基本一致的,但由于用Excel软件生成的图形
较容易调节,而且也比较美观,所以一般不由SPSS直接
生成,而是借用Excel来完成。
多项选择题非交叉分析
• 方法 与单项选择题一个样,每个选项处理一次,然后把
所有选项的处理结果合并起来作出一个表格。
• 进入Frequencies的界面,并把把第三题的所有选项都选
进右边的变量栏里,按OK按钮,得出如下结果
信息来源调查表 单位:%
来源 电视 报纸 杂志 广播 网络
商厂促
销
朋友 推销员
百分比 65 45 50 30 45 50 45 55
• 更加美观的结果,Excel来画柱状图:
性别和学历的交叉分析
• 操作流程:
• 同时把性别和学历变量分别移到Row(s)
(表示行)和Column(s)(表示列)下面--
---中间子菜单Cells-----取消Counts下的按
钮,并在Percentages下选择Total按钮----
-Continue按钮回主菜单-----OK
第三节 多项选择题的频数分析——多响应变量分析
• 多项选择题的数据编码和变量设置
a. 多重二分法(multiple dichotomy method),多
项选择题的每一个选项看作一个0-1变量,0代表没
有被选中,1代表被选中。
b.选择项较多,而被调查者最多只选择其中少数几项
时,输入数据时容易出错,采取多重分类法
(multiple category method)
变量个数等于同时选中的选项个数的最大值。每
个变量的选项都和多项选择题的选项相同。每个
变量代表全体被调查者的一次选择,即记录的是
被选中的选项的代码(相当于先定义列向量,分
别表示第一选项、第二选项,….,再赋n个值,
每个变量的值填入n个回答者的多选题编号 )。
• 例 您购车时,哪些因素会影响你的购车决策。(允许选择
3个答案,而且要求被调查者按主次顺序选出答案,如521
,即价格最重要,其次是款式,再次是性能。)
1、性能 2-款式 3-油耗 4-品牌 5-价格 6-颜色 7-其他
• 1. 多重分类法编码表(该表格转置后看,更科学)
变量名 变量标签 编码方案
b1 第一选项 1-性能 2-款式 3-油耗 4-品牌 5-
价格 6-颜色 7-其他
b2 第二选项 1-性能 2-款式 3-油耗 4-品牌 5-
价格 6-颜色 7-其他
b3 第三选项 1-性能 2-款式 3-油耗 4-品牌 5-
价格 6-颜色 7-其他
若某人同时选择价格、款式、和性能,则变量
b1=5b2=2, b3=1。
• 2.定义多项选择题的变量集合
• 两种不同的进入方式 Analyze-﹥Multiple
Response或者Analyze-﹥Tables-﹥Multiple
Response Tables
• Variables in Set:
若按多重二分法编码,将Set Definition框中的变
量放入Variables in Set框,在Variables Are
Coded As中选择dichotomies,在Counted value
右侧框中输入1。
若按多重分类法编码,将Set Definition框中的变
量放入Variables in Set框,在Variables Are
Coded As中选择categories,还需要设定取值范
围,使在该范围内的记录值纳入分析。一般的取
值范围是该多项选择题选项的最大和最小代码
(最小与最大编码数字)。
• 3.定义多重反应分析的变量集的名称、名称标签
• 在Name框是输入多项选择题变量集的名称(英文)
,在Lable框是多项选择题变量集定以一个名称标
签(相应的中文名字)。
• 此例 “GCJCYXYS”--“购车决策影响因素”。
• 4.单击Add钮,将定义完成的“变量集”填加到“
多选集”( Multiple Response sets)中
• 5.单击Close完成 多项选择题变量集的定义
在SPSS的Multiple Response,最多可以定义20
个多项选择题变量集(所以,一次问卷调查一般
不要超过20个的多项选择题)。
• 多项选择题的分析过程
• 频数分析和列联表分析
• 生成多项选择题的频数分析表步骤:
Analyze-﹥Multiple Response-
﹥Freqencies-﹥Mult Response Sets-﹥
将分析对象(本例如购车决策影响因素
$GCJCYXYS)选入右边的Table(s) for框,
其他默认,-﹥OK
• 对170名受访者的调查结果的分析示例
购车决策影响因素多项选择题的频数分析表
Category label
(购车决策影响因素)
C
o
d
e
Count Percengtage of
Responses (%)
Percengtage of Cases
(%)
性能 1 49
款式 2 65
油耗 3 104
品牌 4 92
价格 5 150
颜色 6 40
其他 7 10
Total responses 510
• 多项选择题的列联表分析过程
(Crosstabs),产生多重交叉列联表
• 列联表分析可以通过两种不同的方式进入:
1、从菜单Analyze-﹥Multiple Response-
﹥Crosstabs进入 。
2、从菜单Analyze-﹥Tables-﹥Multiple
Response Tables进入。
• 列的处理:在Mult Response Sets框中,显示已
经定义好得多项选择题变量集,把要分析的变量
集(点击标签)选入Colums框。
• 行的处理:把另外一个选择题的变量放入Rows框,
并定义该变量值的范围(Define Ranges-﹥ 定
义最小值和定义最大值)-﹥Option子对话框的
选择(一般选择其默认状况)-﹥OK。
• 示例
sex*$JCSX Cross tabulation
$JCSX
SEX
决策影响因素
Total
1-性
能
2-款式 3-油耗 4-品牌
5-价
格
6-颜色
7-其
他
性
别
男 Count 34 16 35 33 49 2 5
58% within
sex
%
% % %
%
% %
女 Count 15 51 68 59 101 38 5
112% within
sex
%
% % %
%
% %
Total Count 49 67 103 92 150 40 10 170
• 多项选择题答案的排序分析
• 要求被调查者按主次顺序选出若干答案,此种情况,多项
选择题的数据编码和变量设置只能采取multiple category
method。分析结果若想得到每个选项的交叉列联表,有三
种方法:
1.从菜单Analyze-﹥Multiple Response-﹥Crosstabs进入,
此时需要把行变量放入Rows框,单击Define Ranges钮, 定
义最小值与大值,把代表第一重要、第二重要、...,的变
量放入Columns框,单击OK钮即可。
2.从菜单Analyze-﹥Descriptive Statistics-﹥Crosstabs进
入,把行变量放入Rows框,把代表第一重要、第二重要、
...,的变量放入Columns框,单击OK钮即可。
3.从菜单Analyze-﹥Tables-﹥Multiple Response Tables进
入,把行变量放入Rows框,把代表第一重要变量选入
Columns框,单击OK钮得到第一个列联表,然后分别把代
表第一重要变量换成第二,第三,...,得到第二个列联表、
第三个列联表。注意不能把代表第一重要、第二重要、
...,的变量同时选入Columns框。
第四节 利用Graphs制作统计图
• SPSS图形功能概述
• 1.SPSS创建图形的一般过程
• SPSS图形菜单制作图形可分为三个过程:
• (1)建立数据文件,在数据窗口录入数据,或是
从其它数据文件中读取数据。
• (2)利用SPSS的Graphs模块或其他过程生成
图形。
• (3)修饰生成的图形,新生成的图形往往不符合
统计图要素,例如图形题目、标尺的单位等,对
其做些调整修饰。
SPSS图形功能概述
•2.图形生成与数据文件结构
• 统计图形的生成与数据文件的结构和类型紧密相关。
数据文件结构往往决定着生成图形的类型,即使来自同一资
料,整理成不同结构的数据文件,也会生成不同的统计图形
SPSS图形功能概述
•3.图形生成与数据的度量尺度
• 在定义变量时,要在Measure栏中设置其度量尺度(也称为测量水
平),其在数据分析中的作用不是很明显,但在用图表生成器(Chart
Builder)绘制图形或绘制交互式图形时却很重要,如果测量水平设置不
正确将会影响图形的绘制。
• 例如,在绘制复式条形图时需选择分类变量,分类变量的测量水平
只能是名义尺度或定序尺度,对应的变量是数值型或字符型,用数字代
表分类(如,0代表男性,1代表女性),当不是这两种测量水平之一时,
将不能作为分类变量使用。
SPSS图形功能概述
•4.Graphs各菜单的功能
•(1)图表生成器(Chart Builder)
• 图表生成器是 for Windows及其以后版本中新添的绘制图形的
特色功能,它是由早期版本中Graphs菜单中的Gallery过程发展形成的。其界面
如图所示。
变量列表框
画布区域
图形类型选择框
SPSS图形功能概述
•4.Graphs各菜单的功能
•(2)传统模式创建图形(Legacy Chart)
•
• 利用传统模式创建图形(Legacy Chart)是直接生成
SPSS图形的主要方式。和交互模式不同的是传统图形的生
成模式是以对话框设置的方式创建的,这一点和前面的统计
分析功能的对话框操作类似。操作时需要在各级对话框中选
择图形的变量,设置变量产生的图形类型和参数以及其他的
选项,例如对缺失值的处理等。
SPSS图形功能概述
•4.Graphs各菜单的功能
•(3)交互模式创建图形(Interactive)
•
• 交互图形是利用SPSS的交互操作方式创建的图形,当
生成基本图形以后,还需要对图形做进一步的设置和编辑,
以便得到效果满意且具有较高质量的图形。在图形输出窗口
中,可以利用图形的交互式功能选择图形的组成元素并编辑
和修改它们的属性,例如颜色、填充模式、图形的标题以及
位置等。图形的交互操作提高了创建图形的质量,交互式的
特点也使得创建图形的灵活性更大。
各种统计图的创建
•1.条形图
•(1)条形图的功能
•
• 条形图(Bar Charts)描述定类或定序变量的分
布,用宽度相等直条的高度来表示非连续性资料的
数据大小,用于性质相似的数据进行比较。
各种统计图的创建
•1.条形图
•(2)条形图的类型
•
•简单条形图(Simple)
•复合条形图(Clustered)
•堆栈条形图(Stacked)
•
(1)Summaries for groups of cases
此选项为默认选项。表示统计量按个案分
组方式组织,即将根据分组变量对所有个
案进行分组,然后根据分组后的个案数据
创建条形图
(2)Summaries of separate variable
变量分组模式,表示将为每个变量创建条
形图
(3) Values of individual cases 个
案模式,表示将为分组变量中的每一个个
案生成一个条形图,条带的长度表示观测
值的大小。当数据文件中包含大量个案时,
不适宜用个案模式条形图来描述
各种统计图的创建
•1.条形图
•(3)条形图的生成
•以复式条形图的生成为例进行说
明
•选择Graph→ Legacy
Dialogs→ Bar,弹出上一页图3-
2所示的“Bar Charts”对话框,
图形类型选择Clustered,条形图
模式选择Summaries for groups
of cases,单击Define按钮弹出
如图3-3所示的对话框。
•
•
图3-3
各种统计图的创建
•1.条形图
•(3)条形图的生成
•以复式条形图的生成
•为例进行说明
•确定分类变量
•选择复合分类变量
•确定直条表示(Bars Represent)
•的方式和统计量
•
变量
列表
各种统计图的创建
•1.条形图
•(3)条形图的生成
•生成的图形结果如图
各种统计图的创建
•2.线图
•(1)线图的功能
•
• 线图(Line Charts)是用线条的上下波动的
形式,来反映连续性的相对资料的变化趋势。它主
要用于表示现象在时间上的变化趋势、现象的分配
情况和两个现象之间的依存关系等。
各种统计图的创建
•2.线图
•(2)线图的类型
– 简单线图(Simple Line Chart):用一条折线
表示某个现象的变化趋势;
– 多重线图(Multiple Line Chart):用多条折线
同时表示多种现象的变动趋势;
– 垂直线图(Drop-line Line Chart):反映某些
现象在同一时期内差距的统计图。
•
各种统计图的创建
•2.线图
•(2)线图的类型
各种统计图的创建
•2.线图
•(3)线图的生成
• 以多重线图的生成为例进行说明
• 选择Graph→ Legacy Dialogs→Line,弹出上页图3-5
所示的Line Charts(线图)对话框,选择Multiple(多重线
图),Data in Chart Are选项组中选择“Summaries of
groups of cases”(个案分组模式),单击Define按钮弹出
如图3-6所示的对话框 。
各种统计图的创建
•2.线图
•(3)线图的生成
• 以多重线图的生成为
例进行说明
•选择分类变量
•确定折线表示(Line
Represent)的方式和统
计量
各种统计图的创建
•2.线图
•(3)线图的生成
• 以多重线图的生成为例进行说明
• 生成的图形如图所示
各种统计图的创建
•3.饼图
•(1)饼图的功能
•
• 饼图(Pie Charts)也称作圆图,是用圆的整
体面积代表被研究对象的总体,按各构成部分的比
重把圆面积分成若干个扇形,用以表示对象的部分
对总体的比例关系的统计图。
各种统计图的创建
•3.饼图
•(2)饼图的类型
•
•Summaries for groups of cases 个案
分组模式;
•Summaries of separate variables 变
量分组模式;
•Values of individual cases 个案模式。
•
•
各种统计图的创建
•3.饼图
•(3)饼图的生成
•选择分类变量,
•即定义饼图的分片
•确定分片代表的含义
•
各种统计图的创建
•3.饼图
•(3)饼图的生成
•
各种统计图的创建
•4.高低图
•(1)高低图的功能
•
• 高低图(High-Low Charts)是一种说明某种现象在单位
时间内变化情况的统计图,它适合描述每小时、每天、每周
等时间内不断波动的市场信息资料。例如股票、商品价格等,
高低图既说明某些现象在短时间内的变化,也说明它们长期
的变化趋势。
各种统计图的创建
•4.高低图
•(2)高低图的类型
•
•
(1)Simple High-low-close 简单高低
图。该图利用小方框表示某段时间内的
最终数值,用小方框上下的触须表示该
段时间内取值的最大值和最小值。这种
图形适合用于股票、期货和外汇金融等,
它说明每天的最高价格、最低价格和收
盘时的价格;
(2)Cluster high-low-close 分组高低
图。与简单高低图类似,但是它可以同
时描述两种或两种以上证券或期货的价
格情况;
(3)Simple rage bar 简单极差图。这
种图形用长条的长度代表每个时间段最
高值与最低值之差;
(4)Clustered range bar 分组极差图。
与简单极差图类似,但是可以描述两个
或两个以上证券或金融的情况
(5)Difference area 差异区域图。这
种图形利用不同的曲线表示同一段时间
内的两种不同情况,并且用阴影填充曲
线之间的区域。
各种统计图的创建
•4.高低图
•(3)高低图的生成
• 以简单高低图的生成为例进
行说明
•
各种统计图的创建
•4.高低图
•(3)高低图的生成
• 以简单高低图的生成为例进行说明
• 生成的高低图如3-12所示
各种统计图的创建
•5.箱图
•(1)箱图的功能
•
• 箱图(Boxplot)又称为箱线图,它是一种用来描述数据分
布的统计图形,它可以用来表示观测数据的中位数、4分位
数和极值等描述性统计量,从视觉的角度观测变量值的分布
情况 。
各种统计图的创建
•5.箱图
•(2)箱图的类型
•
•简单箱图
•复合箱图
各种统计图的创建
•5.箱图
•(3)箱图的生成
•以简单箱图为例进行说明
•在选择Simple(简单箱图)
类型,选择“Summaries of
groups of cases”个案分组模
式,单击Define按钮,弹出如
图的对话框
•设置:
•
•选择分类变量
•确定绘制箱图的变量
各种统计图的创建
•5.箱图
•(3)箱图的生成
•以简单箱图为例进行说明
•生成的箱图如图3-15所示
说明:
(1)图中每个箱形的含义是:从开始的线
段到矩形框包含了1/4的观测数据,从矩形
框的低端到矩形框中间的线段包含1/4的观
测数据,从这条线到矩形框结束又包含1/4
的观测数据,从矩形框结束到顶端的线段
包含1/4的观测数据。
(2)恰有一半的数据位于箱形所在的区域。
(3)当最小或最大的观测值距箱形的距离
比箱形本身的长度要大好几倍时,箱图中
箱形外的线并不一定是从最小的观测值开
始并到最大的观测值结束。在这种情况下
两端用点标上观测值即可,这种值被称为
离群值,也就是非正常值。
各种统计图的创建
•6.误差条图
•(1)误差条图的功能
•
•误差条图(Error Bar)是一种描述数据总体离散情况分布
的统计图形,可以反映数据的离差情况,并且描绘正态分布
资料的描述性指标,如均值、标准差,并由此求得参数数值
范围、总体均值的置信区间等。
各种统计图的创建
•6.误差条图
•(2)误差条图的类型
– Simple 简单误差条图。
对分类轴变量的每个类型
生成一个分布误差条形图;
– Clustered 复合误差条图。
对分类轴上的变量的每一
类型生成一簇误差条形图,
每一簇中误差条形图将区
分变量显示。
各种统计图的创建
•6.误差条图
•(3)误差条图的生成
•
•选择Simple(简单误
差条图)类型,选择
“Summaries of
groups of cases”个案
分组模式,单击Define
按钮,弹出如图的对话
框。
各种统计图的创建
•6.误差条图
•(3)误差条图的生成
•
•选择分类变量
•确定绘制误差条图的变量
•确定误差条图中条带的含
义
各种统计图的创建
•6.误差条图
•(3)误差条图的生成
•
•生成的误差条图如所示
•从图中可以观察到各科成
绩在置信度为95%的成绩
置信区间的误差条图。图
中的圆点表示平均数,上
下两条横线表示置信区间
的上下限和标准误差。
各种统计图的创建
•7.金字塔图
•(1)金字塔图的功能
•
•金字塔图(Population Pyramid),也称人口金字塔图,
利用图形直观描述分类变量中不同分类的某种属性在各个区
间取值的频数。例如,医疗机构对某种药物进行对比试验,
得到服药和没服药的人员的体重数据,我们可以将两类人员
体重分布的频数分裂表示成长条状,然后依次罗列在一条坐
标纵轴上,形成一塔图形。利用金字塔图可以直观地表示出
某种属性的人员的变化规律 。
各种统计图的创建
•7.金字塔图
•(2)金字塔图的生成
•选择Graph→ Legacy Dialogs→ Population Pyramid,
弹出如图所示的“Define Population Pyramid”对话框
• (1)选择分类变量和属性变量
分类变量是作为拆分金字塔的变
量,属性变量是描述分类变量属
性的变量
(2)确定计算频数的方式
在“Count”选项组中确定计算频
数的方式,有两个选项:
①Compute counts from data
利用数据计算频数值,此选项为
默认选项;
②Get counts from variable 利
用其他变量获得频数值。选择该
项,表示频数值保存在某一变量
中。
各种统计图的创建
•7.金字塔图
•(2)金字塔图的生成
•
•生成的金字塔图形如图所示
各种统计图的创建
•8.散点图
•(1)散点图的功能
•
•散点图又称散布图或相关图,它是以点的分布反映
变量之间相关情况的统计图形,根据图中各点分布
走向和密集程度,判定变量之间协变关系的类型。
具体创建过程是利用在二维或三维空间中绘制出两
个或三个变量确定的点,然后通过这些点的分布特
征来显示数据分布特征。
各种统计图的创建
•8.散点图
•(1)散点图的功能
•
•散点图又称散布图或相关图,它是以点的分布反映
变量之间相关情况的统计图形,根据图中各点分布
走向和密集程度,判定变量之间协变关系的类型。
具体创建过程是利用在二维或三维空间中绘制出两
个或三个变量确定的点,然后通过这些点的分布特
征来显示数据分布特征。
各种统计图的创建
•8.散点图
•(2)散点图的类型
– Simple Scatter 简单散点图。
描述两个变量之间的关系;
– Overlay Scatter 重叠散点图。
利用将两幅简单散点图叠加到
一张图上的形式同时描述多个
变量之间的两两关系;
– Matrix Scatter 矩阵散点图。
利用类似矩阵的形式,在一张
图上同时描述多个变量之间的
两两关系;
– 3-D Scatter 三维散点图。描述
三个变量之间的相互关系;
– Simple Dot 简单圆点图。描述
一个变量在各个值的分布情况。
各种统计图的创建
•8.散点图
•(3)散点图的生成
• 以重叠散点图的生成为
例进行说明
•确定重叠散点图的配对变量
各种统计图的创建
•8.散点图
•(3)散点图的生成
• 以重叠散点图的生成为例
进行说明
•重叠散点图
第五节 统计图的编辑与利用
• 参见第4节
• Excel 绘制图形有如下重要特点:
• ①功能强大。Excel 97、Excel 2000、Excel
2002 均提供了14 种标准图表类型,每种图表
类型中含有2—7 种子图表类型;还有20 种自
定义图表类型可以套用。
• ②修饰后的图形美观好看。用户可以对图表区、
绘图区、数据系列、坐标轴(标题)、图例、
图表标题的格式,如文字的颜色、字体、大小,
图背景图案、颜色等等进行修改调整,使图表
爽心悦目。
第六节 利用Excel绘制统计图
• ③图与数据关系密切,具有“即改即可见”的
效果。当图和数据放在一张工作表上时,改变
产生图的数据,其图形将发生相应变化;将鼠
标放在图中某数据点上,在鼠标下方将弹出一
个文本框给出数据点的具体数值;用鼠标单击
绘图区中的“数据系列”标志,其图所属数据
单元格将被彩色框线围住,便于用户查看图形
的数据引用位置。
• ④图形中也可实现统计功能。在“数据系列”
点击右键可以向散点图、线图、条图等添加趋
势线,并可给出趋势线的方程与决定系数。
• 具体例子略