第三章 量表技术
测量和量表
量表技术
量表的评价
测量和量表
基本概念
测量
根据某些预先制定的规则或物体的特性分配
序号或其他符号
市场营销调研测量的不是物体本身,而是物
体的特性。
测量对特性序号分配的要求:
一是分配过程必须是同构的
二是序号分配规则应标准化
量表
也称标度、计算,涉及到产生一个将被测
量物体定位的连续统一体
态度测量
不喜欢为1、喜欢为2、很喜欢为3
满意度测量
不满意为1、满意为2、很满意为3
测量的主要尺度
定类尺度(nominal scale)
是一种标记方法,其中数字只用作对物体
进行识别和分类的标志或标签。该序号不
反映物体所拥有的特性的数量。
定序尺度(ordinal scale)
是一种排序尺度,分配给物体的数字表明
物体拥有的一些特性的相对程度。定序尺
度只表示了相对位置,没有反应物体间差
别的大小。
定矩尺度(interval scale)
相邻两个序号之间的差值相等,包含了定
序尺度的所有信息,且能够比较物体之间
差别的大小。
定比尺度(ratio scale)
拥有定类、定序、定矩尺度的所有性质,
还有一个绝对零点。该尺度可以对物体进
行鉴别、分类和排序,并且比较它们的间
距或差别,计算尺度值的比值也有意义。
测量的主要尺度
尺度 基本特性 普通实例 营销实例 描述性分析 推论性统计
定类 数字用于对物
体的识别和分
类
社会保险
号、足球
运动员的
编号
品牌号、商
店类型、性
别分类
百分比、众
数
卡方、二项
式检验
定序 数字代表物体
的相对位置,
但没有指明差
距的大小
质量排序、
联赛中的
各队排名
偏好排序、
市场地位、
社会阶层
百分位数、
中位数
序数相关、
ANOVA
定距 物体之间可比
较的差距,零
点是任意定的
温度 态度、观点、
指数
全距、平均
数、标准差
简单相关、t
检验、回归
分析、因子
分析ANOVA
定比 零点是固定的,
可以计算尺度
值得比
长度、重
量
年龄、收入、
成本、销售
额、市场份
额
几何平均数、
调和平均数
变异系数
主要测量尺度的举例说明
定类尺度
定序尺度 定矩尺度 定比尺度
编号 商店名 偏好排序 偏好等级
1——7
前三个月的
消费额
1 爱家 7 5 0
2 民生 2 7 200
3 军人服务社 8 4 0
4 百盛 3 6 100
5 开元 1 7 250
6 家世界 5 5 35
7 沃尔马 9 4 0
8 骡马市 6 5 100
9 世纪金花 4 6 0
10 唐城 10 2 10
量表技术的比较
量表技术
比较量表 非比较量表
配对比较 等级顺序 常量和 连续评分
量表
量表
分 项 评
分量表
Likert 语义差别 等值差距
量表技术
配对比较量表(paired comparison scaling)
等级顺序量表(rank-order scaling)
常量和量表(constant sum scaling)
连续评分量表(continuous rating scale)
Likert量表
语意差别量表(semantic differential scale)
等值差距量表(Thurston Scales)
李嘉图法
配对比较量表
(paired comparison scaling)
这种方法是把调查对象配对,让被调查者一一
比较选择答案。还可以设计成具有评价等级的
比较形式,即在比较对象的上方设计双极标度
评价等级,等级可以是五级、七级、九级等,
调查时请被调查者按照比较对象的差异程度选
择适当答案。
优点:应用广泛,特别适用于比较对象的数量
较少时。
缺点:当比较对象很多时,调查结果偏差大。
青岛 汉斯 宝鸡 百威 燕京
青岛 0 0 1 0
汉斯 1 0 1 0
宝鸡 1 1 1 1
百威 0 0 0 0
燕京 1 1 0 1
总分 3 2 0 4 1
注:1表示该列的品牌比相应行的品牌更受欢迎,0表示该行品牌比相应
列品牌更受欢迎。
每一列数据相加之和为一个品牌受欢迎的程度
例1:下面有10对啤酒品牌,请指出您更喜欢每一对中的那一个啤酒品牌。
例2:请比较下面各对电视机品牌的质量,并在适当空格上打勾。
质量好 非常 稍微 两者相当 稍微 非常 质量差
长虹对康佳 —— —— —— —— ——
长虹对海尔 —— —— —— —— ——
长虹对日立 —— —— —— —— ——
长虹对松下 —— —— —— —— ——
康佳对海尔 —— —— —— —— ——
康佳对松下 —— —— —— —— ——
… —— —— —— —— ——
海尔对松下 —— —— —— —— ——
… —— —— —— —— ——
松下对日立 —— —— —— —— ——
… —— —— —— —— ——
等级顺序量表
(rank-order scaling)
等级顺序量表是同时向被调查者提供几个
事物,请被调查者根据一定的标准对其排
序。
优点:便于被调查者进行比较衡量,资料
统计整理较为简便。
缺点:不能反映各调查事项重要性程度的
差异量级,只能获得定序数据。
等级顺序量表
(rank-order scaling)
设计顺位问句时须注意事项:
决定顺位的项目不应超过10个;
顺位取到几位,根据调查目的而定。
适用范围
对有关事物重要性先后次序进行调查,多用此
测量消费者对品牌的偏好和态度。
例:请对下面有关房屋装修事项按您认为的重
要性程度排序,从重要到不重要的序号依次为
1,2,3,…….
装修设计 ( )
装修费用 ( )
装修材料 ( )
装修质量 ( )
装修施工单位的选择 ( )
常量和量表(constant sum scaling)
常量和量表也叫做数值分配量表,是要求被调
查者在固定数值范围内(10-100),对所测事
物依次分配一定数值,从而作出不同评价。
优点:比较简单,并且能够得到人们对事物的
微小区别看法。
缺点:分配的数字可能比规定的多或少,给事
后的资料整理带来困难。
例:对某种商品的三种品牌在消费者心中的信誉高低进行调查,
要求消费者按喜爱程度对三种品一 一打分,每个评价项目总分为
100分。例如某消费者的打分结果如下表所示:
品牌
项目
A B C 合计
1 70 20 10 100
2 50 30 20 100
3 30 40 30 100
总计 150 90 60
从各品牌的总得分可以看出,A品牌得分最高,说明A品牌是该消费者
最喜欢的品牌。如果调查了100个消费者,就需把100个人得分数值相加
后再除以人数,从而得到该项目的最后得分。
连续评分量表(continuous
rating scale)
连续评分量表也称作图示评分量表,是要求被
调查者在一条直线上的适当位置作出标记为研
究对象打分,这条直线从一个极端到另一个极
端。评分分数可以是数字的或文字描述的。
优点:易于建构。
缺点:评分麻烦,提供的信息少。
例:
①请你为民生百货公司的服务态度打分。
态度很差-------------------------------------态度很好
②请你为民生百货公司的商店环境打分。
环境很差-------------------------------------环境很好
0 10 20 30 40 50 60 70 80 90 100
③请你为民生百货公司的商场布置打分。
布置很零乱---------------------------------布置有特色
很差 一般 很好
Likert量表
Likert量表要求被调查者对有关研究对象的每
一个陈述语句表示同意或不同意的反应态度。
一般每个量表项目有5个反映类别,从强烈反
对到强烈赞成,数值可以是-2—2,或者是1—
5。分析可以逐项进行,或者通过对项目求和
计算每个调查对象的总评分。
优点:易于构建和执行,被调查者容易理解如
何使用量表
缺点:调查过程费时
适用于:邮件访谈、电话访谈和人员访谈
例:
请根据下面提示表达你对每种观点同意或反对的态度。
提示:1=强烈反对 2=反对 3=既不反对也不同意
4=同意 5=强烈同意
强烈反对 反对 中立 同意 强烈同意
1.民生商店的商品品质高 ---- ---- ---- ---- ----
2.民生商店服务很差 ---- ---- ---- ---- ----
3.我喜欢在民生商店购物 ---- ---- ---- ---- ----
4.我不喜欢民生商店的广告 ---- ---- ---- ---- ----
5.民生商店的商品花样多 ---- ---- ---- ---- ----
6.民生商店的商品价格公道 ---- ---- ---- ---- ----
语意差别量表(semantic differential
scale)
语意差别量表是由两个意义对立的形
容词构成一组双极标度,以评价产品、
品牌、企业或观念等。在意义对立的
两个形容词中间,又分为不同级别,
一般有五级、七级、九级或十一级等。
语意差别量表(semantic differential
scale)
问题设计示例:
请根据您对某商店的评价在适当的空格上打勾。
非常 比较 稍 一般 稍 比较 非常
态度热情 态度冷淡
价格便宜 价格昂贵
环境清洁 环境肮脏
光线明亮 光线灰暗
商品新颖 陈旧商品
语意差别量表的分析方法
总分分析法
对各评价等级赋值,然后把每一个被调查者所
选择的评价分数加总,其总分就是该被调查者
对调查事物的总体评价。
图上分析法
是在对各评价等级赋值后,把所有被调查者对
每一对评价项目的打分加总,然后计算平均值,
并把各评价项目的平均值用折线连接起来,根
据图中折线对调查事物进行分析。
图上分析法示例
+3 + 2 +1 0 -1 -2 -3
态度热情 — — — — — — — 态度冷淡
价格便宜 — — — — — — — 价格昂贵
环境清洁 — — — — — — — 环境肮脏
光线明亮 — — — — — — — 光线灰暗
商品新颖 — — — — — — — 陈旧商品
图6-2 某商店形象的调查结果
等值差距量表(Thurston Scales)
等值差距量表是由被调查者自行选定问题,并建立
数值标尺表示态度差异。其设计步骤如下:
由调查者提出大量调查问句,约需100--200条。
选择20-30个被调查者评价调查问句,评价分7、
9、11级等。
计算各问句的次数、平均值或中位数及标准差。
根据各问句的平均值或中位数确定其落入组别。
在每组中选出两个标准差最小的语句,作为问卷
语句。
等值差距量表(Thurston Scales)
优点
避免了由调查者设计问题可能产生的主观
片面性,调查结果相对准确可靠。
缺点
问题设计费时繁琐,实际应用并不广泛。
李嘉图法
李嘉图法与等值差距量表相似,即要先列出一
系列与调查事物有关的意见。不同之处在于等
值差距量表只要求被调查者选出自己同意的意
见,不要求表示态度强度,而李嘉图法则要求
被调查者表示自己同意与否的态度强度。
李嘉图法
应用过程
设计若干条问题。其中有利意见和不利意见的
数量基本相当。
建立意见差别强度的分类等级。常用有三、五
等级。
规定有利意见与不利意见的评分办法。
意见程度评分标准参考表
意见程度类别 有利意见的评分标准 不利意见的评分标准
非常同意 5 +2 1 -2
同意 4 +1 2 -1
不确定 3 0 3 0
不同意 2 -1 4 +1
非常不同意 1 -2 5 +2
请被调查者按自己想法选择对各问题的同意程度。
计算每个被调查者的总分数。
选择问卷语句。
量表的评价
量表评价
信度 效度 可推广性
重 复
测 试
信度
复
本
信
度
内 部
一 致
性 信
度
内容效度 标准效度 建构效度
收 敛
效度
判 别
效度
法 则
效度
测量的准确性
调查量表获得的测量值是一个事物某种特性的一次
观察值,其中包含由许多因素引起的测量误差,即
XO=XT+XS+XR
式中 XO——观察到的分数和测量值
XT——特性的真实得分
XS——系统误差
XR——随机误差
系统误差指每次测量时以同一种方式影响得分的稳
定因素;
随机误差指每次测量时以不同方式影响观察得分的
暂时因素。
测量中误差的来源:
影响分值的相对稳定因素,如智力、社会愿望
和教育
短期或暂时的人员因素,如健康、情感、疲劳
场所因素,如其他人的存在、噪声等
量表项目的增加或减少
量表的用法说明或题项说明不够清楚
机械因素,如印刷质量差、问卷设计拙劣
量表执行中的误差,如被调查者之间的差异
分析因素,如在计分和统计分析中的差异
信度(reliability)
信度是指当测量重复进行时,同一量表产生一
致性结果的程度。
信度与测量方法的正确性和精确度有关,故也
定义为测量中免除随机误差XR的程度。当
XR=0,测量就是完全可信的。
信度通过确定量表中系统变化的比例来评价。
评价信度的方法有重复测试法、复本法和内部
一致性法。
重复测试法
重复测试法指在两次不同的时间、在尽可能一
致的条件下执行同一个量表的调查,时间间隔
一般为2-4周。最后通过计算相关系确定两次
测量的相似程度,相关系数越高,信度越高。
不足之处:一是对时间间隔非常敏感,时间间
隔越长信度越低。二是被调查者在第一次接受
调查后可能改变对所调查问题的态度。第三,
有可能无法进行重复测试。
一般重复测试法最好与其他方法结合使用。
复本法
复本法指构建两个等价的量表,在不同时间对
同一个被调查者进行测试,然后对调查结果进
行相关分析以评价信度。间隔时间为2-4周。
缺点:
设计两个量表耗时耗钱
设计两个等价量表并不是一件容易的事
内部一致性法
采用分半信度法,即把量表中的项目分成两半,
对两半的分值进行相关分析。相关性越高说明
内部一致性越好。
一般用ɑ系数进行内部一致性分析。ɑ系数值在
0~1之间变化,一般等于或小于时,就说明
内部一致性信度差。
注意事项:当量表中包括了不同方面的几组相
互独立的项目时,就不能统一进行内部一致性
信度测量,而要分别对这几组项目进行信度测
量。
效度(validity)
效度是指观察值之间的差异所反映的物体之间
被测特性的真实差异的程度。完美的效度要求
没有测量误差(XO=XT , XR=0)。
效度包括内容效度、效标效度和建构效度。
内容效度(content validity)
内容效度也叫表面效度或逻辑效度,是指一个
量表实际测量到的内容与所要测量的内容之间
的吻合程度。
较好的内容效度必须满足两个条件:
一是确定好内容范围,并使测量的全部项目均
在此范围内。
二是测量项目应是已界定的内容范围的代表性
样本。
内容效度的检验
逻辑分析法。由调研人员或请专家对测量题项
与原定调查目的的吻合程度作出判断,检验所
选题项是否能代表所要测量的内容或主题。这
种方法是直觉主观的,分析结果因人而异,故
不能单独用来衡量量表的效度。
统计分析法。主要采用单项目与量表综合相关
分析法获得评价结果,即计算每个题项得分与
总分的相关系数,根据相关性是否显著判断量
表是否有效。
效标效度(criterion validity)
效标效度又称准则效度、实证效度、统计效度、
预测效度或标准关联效度,是指用不同的几种
测量方式或不同的指标对同一变量进行测量,
并将其中的一种方式作为准则(效标),用其
他的方式或指标与这个准则作比较,如果其他
方式或指标也有效,那么这个测量即具备效标
效度。
在效度分析中要选择一个合适的准则十分困难。
一个好的效标需要符合四个条件:有效性,客
观性,可靠性,实用性。
结构效度(construct validity)
结构效度也称构想效度、建构效度或理论效度,
是指量表反映概念和命题内部结构的程度。一
般通过比较测量结果与理论假设来检验。
结构效度的检验方法:
相关分析
因子分析
结构方程模型
信度和效度之间的关系
信度是效度的必要条件,两者关系要点如下:
信度低,效度不可能高
信度高,效度未必高
效度低,信度很可能高
效度高,信度也必然高
实用性
量表的实用性就是指经济、方便和诠释性。
经济性:开发量表的成本要在预算之内;
方便性:操作简便,说明清楚;
诠释性:即要有详尽的量表解释说明。
作业
定类尺度、定序尺度、定矩尺度和定比尺度之间
的重要差距是什么?
说明下面测量对象可用4种基本尺度测量的属性。
a、商店顾客;
b、一家企业不同部门的盈利能力
讨论下面各量表的优缺点。
a、李克特量表和语义差别量表
b、配对比较量表和常量和量表
用常量和量表设计一个对4个品牌手机的消费者认
知度的品牌评价量表。评价维度:款式、通讯性
能、功能齐全性、品牌形象