第 5 章 制定营销测量方案
学习目标
理解测量的基本概念
了解测量的各种尺度及其应用
掌握营销调研常用量表
掌握信度与效度之间的关系
引例
国国家统计局决定从 2011 年 1 月起开始实施新的房价统计制度方法。《住宅销售价格
统计调查方案》已于 16 日公布了,并将于 18 日发布依据《新方案》统计的今年 1 月份 70
个大中城市房价数据。
此次新房价统计调查方案作出四方面调整,包括数据采集方式的调整、调查指标的调整、
指数计算方法的调整、以及数据发布方式和时间的调整。
1、网签数据代替房企直报数据
基础数据来源渠道的调整是这次房价统计改革的重要内容。《新方案》规定,直辖市、
省会城市、自治区首府城市(不含拉萨市)、计划单列市等 35 个大中城市新建住宅销售价格
数据,直接采用当地房地产管理部门的网签数据,不再采用样本数据。
之所以作这样的调整,主要有三个方面的原因。一是数据齐全。网签数据涵盖了新建商
品住宅的全部交易情况。二是信息完整。网签数据包含有地址、楼层、价格和金额等详细信
息,有助于价格指数的计算。三是获取方便。经过不断的改进和完善,房地产管理部门在网
签数据管理与使用方面积累了丰富的经验,数据提取比较容易。
统计局强调,网签数据的采用数量取决于各个城市当期新建住宅的实际成交量。鉴于各
个城市新建商品住宅成交量不可能完全相同,网签数据采用数量也就会存在差别。但由于各
个城市的网签数据记录了当期新建住宅的实际成交情况,因此不论数据量大小,据此计算的
房价指数可以反映当地实际情况。
2、70 个大中城市房价涨幅平均数不再发布
《新方案》实施后,国家统计局不再计算和发布全国 70 个大中城市房价涨幅的平均数,
重点发布各个城市不同对比基期的分类指数和总指数。
统计局表示,之所以这样做,主要有以下三方面的考虑:一是用平均数表示一组数据,
具有直观简明的特点。但是平均数在样本值离散程度较大的情况下有一定的局限性。也就是
说在个体差异较大的情况下,往往会削峰填谷,抹平个体间的差异。二是不再计算和发布平
均数,重点发布各个城市的房价数据,既有助于社会公众及时了解所在城市房价的具体变化,
也有利于更好地为地方政府有效调控房价提供服务。三是,这也是一些专家学者的建议。如
有的专家指出,综合平均价格指数概念过于模糊,无法与某个时点相对应,并且在各季度
(或各月份)房价变动比较大的时候,计算出的平均值更是缺乏实际意义。过于强调全国综
合的数字容易引起误读,会掩盖各个城市的典型特征。
3、划定 90 平方米和 144 平方米基本分类设置标准
《新方案》规定,二手住宅销售价格通过重点调查与典型调查相结合的方式派人调查采
集。由于这种调查属于非全面调查,调查样本的规模大小及其分布直接关系到基础数据的代
表性,因此,关于“75%以上”的规定完全是为了确保调查数据来源的代表性,提高二手住宅
销售价格基础数据的真实性和准确性。
《新方案》还调整了基本分类设置标准,突出了新建住宅和二手住宅,设置了 90 平方
米及以下、90-144 平方米和 144 平方米以上指标。从各地的政策落实情况看,大多数大中
城市都以 144 平方米(120 平方米×120%)作为享受优惠政策普通住宅与非普通住宅的建筑
面积分界点。
《新方案》增加了计算定基价格指数的内容,首轮基期确定为 2010 年。选择 2010 年作
为对比基期,主要基于三个方面的考虑:一是与国民经济和社会发展五年规划期保持一致。
二是 2010 年的基础数据资料较为完整并且易于获取,可操作性强。三是与 CPI、PPI 定基价
格指数的对比基期保持一致,方便数据分析和使用。与同比价格指数相比较,房价定基价格
指数在使用上更为直观方便,以便观察不同时期房价的变化情况。
资 料 来 源 : 李 春 : 《 统 计 局 : 18 日 将 公 布 新 调 查 方 法 统 计 后 的 房 价 数 据 》, 新 华 网 ,
年 02 月 16 日,有改动。
制定营销测量方案是营销调研中一个重要的环节。合理的量表设计、精心编制的抽样计
划、训练有素的访问人员、科学的数据分析技术都十分重要。只有这样才会收集到比较完整
的数据和比较准确的数据。
第 1 节 测量的基本概念
测量是指调研者根据特定的规则对研究对象的某些特征分派数字或其它符号的过程。需
要注意的是,所测量的不是物体本身,而是它的某些特征。例如,不能测量桌子,只能测量
它的宽度、高度、重量、颜色或其它的相关特征。另外,科学的测量不是随意地将数字或其
它符号分派给研究对象,而是按照特定的规则进行的。
测量的过程是一个从抽象到具体的过程。测量的基本步骤有四步,一是概念操作化;二
是分派指标;三是实施测量;四是信度与效度的评估。
一、概念操作化
概念操作化是指将数字或符号所指代的内涵,用可测量的事实或行为表达出来,从而对
某一概念达成共识的过程。概念操作化的实质是将抽象的概念回归到经验事实与现象。对于
具体的属性,例如高度,通常都有比较清晰的共识;对于一些抽象的概念,例如产品质量,
却可能存在多种理解。有人认为质量好就是指做工精细;有人认为就是指服务态度好;有人
认为就是指价格昂贵;有人认为就是指品牌好,等等。因此,在进行测量之前,一定要清楚
测量什么,要在对概念的内涵达成共识的基础上,确定概念包括哪几个主要方面(也称维
度)。
———————————————————————————————————————
例 5-1“消费行为”的概念操作化
(1)对概念进行界定
“消费行为”指消费者对产品的购买和使用,以及对产品的处置(如对喝完的奶茶包装的
处理、对未喝完的饮料进行储存)
(2)确定维度
在相关文献基础上结合专家访谈,确定 3 个维度:消费观念、对品牌的忠诚度、购买
以及使用行为
(3)确定最终测定问题
在每个维度上确定要测定的问题,其表现为多个问题形式。也就是说,确定在“消费观
念”方面应当提哪些问题,在“对品牌的忠诚度”方面应当提哪些问题,在“行为”方面应当提
哪些问题。
在“消费观念”维度上提以下几个问题:对产品的感觉,是否购买品牌产品,购买该产
品的预期支出。
在“对品牌的忠诚度”维度上提以下几个问题:对该品牌的特定偏好,对该品牌的重复
购买,品牌转换的情况
在“购买和使用行为”维度上就提以下几个问题:购买次数、消费量、消费场所、购买
地点、消费情景、重复购买的次数。
———————————————————————————————————————
二、分派指标
分派指标指通过对指标分派数字或者其它符号,从而确定测量规则的过程。对于许多抽
象的概念,例如某品牌的知名度,顾客忠诚度是无法直接观察测量的,因此要用一系列可以
测量的指标来反映。例如,在市场调研中,对于测量某品牌的知名度,我们可以用“消费者
中知道该品牌的人数百分比”进行测量。
———————————————————————————————————————
例 5-2 分派“消费量”和“购买地点”的测量指标
平时,你平均每天大概喝几瓶饮料?(单选)
1、 不喝 2、一瓶 3、两瓶 4、三瓶 5、三瓶以上
在当地,如果购买饮料,你会选择去哪里购买?
1、 大型商场 2、连锁超市 3、小商店 4、报刊亭 5、其它地方
———————————————————————————————————————
三、实施测量
实施测量是指按照已确定的规则,对测量对象进行测量,收集信息,并用数字或符号记
录测量结果的过程。 例如,顾客对产品的评价信息通过调查问卷收集;而购买行为通过口
头报告和日志记录来收集信息。
四、信度与效度的评估
信度与效度的评估是对测量结果的精确度和准确度的评估,旨在保证测量结果能很好地
反映所测属性的真实值。评价信度的方法包括重测信度、复本信度和内部一致性信度。效度
可以通过内容效度、标准关联效度和结构效度来评价。在检测信度和效度之前,需要对测量
的准确性有一定的了解,因为它是评估量表的基础。
第 2 节测量的基本尺度
测量尺度也称测量的等级或测量的层次,指的是赋予测量对象的数字和其它符号的含
义及其所允许的数学运算,可分为定类、定序、定距和定比四种主要测量尺度。
一、定类尺度
定类尺度(Nominal scale)是各类测量尺度中最低的一种,在本质上是一种分类体系。
即将测量对象的不同属性或特征加以区分,标以不同的数字或符号。在市场调查中,对诸如
消费者的性别、职业、婚姻状况、宗教信仰等特征的测量,都是常见的定类尺度的测量。它
们分别将消费者分成“男性与女性”,“干部,教师,白领,商人,专业技术人员……”,“未
婚者,已婚者,离婚者……”,以及“佛教,伊斯兰教,耶稣教……不信教”等各种不同的群
体或类别,而每一个消费者则分别属于或者不属于其中某个类别。
定类尺度的测量实质是一种分类体系,设计这类尺度时应注意其互斥性、穷尽性和完
备性。即所分的类别既要相互排斥,互不重叠,又要对各种可能的情况包罗无遗。这样,我
们所测量的每一个调查对象都会在我们的分类体系中占据并且只占据一个类别。例如将性别
分成“男性”和“女性”两类。
定类尺度是市场调研中使用率最高的,也是四种测量尺度中测量等级最低的,其他三
类尺度中,无一例外的包含着定类尺度的分类功能。
二、定序尺度
定序尺度(Ordinal scale)也称等级尺度或排序尺度,其数字和符号不仅代表类别,而
且还反映事物或现象的高低、大小和先后顺序的差异。定序尺度能够表示一个调研对象具有
的某种特征是否比另一个调研对象更多还是更少,但没有表明相差多少。排在前面的调研对
象与后面的相比有更多的某种特性,但是到底相差多少是未知的。在营销研究中,调研人员
可以用定序尺度对相对的态度、观点、感受和偏好进行等级排列。
必须注意的是这一尺度上的间距不能准确代表其测量的特征量的相差多少。因此,普
通的加、减、乘、除都不能用于顺序尺度,对于中心趋势的适当测量是众数、中位数,百分
数或四分位数可以用来测量离散程度。
三、定距尺度
定距尺度(Interval scale)也称为等距尺度或区间尺度。定距尺度除了包含定序尺度的
所有信息外,还能够确定不同等级的间隔距离和数量差别。日常生活中常见的例子有温度、
成绩等。营销调研中用评价量表获得的分值通常被看做是定距数据。
定距尺度的零点以及测量的单位都是人为设定的。因为没有自然零点,例如在冬天,
我们可以测得北京的气温是 0℃,但这并不代表北京“没有温度”,而只是代表北京的气温达
到了水的“结冰点的温度”。从测量的角度看,此时的“0”只不过是一个特定的数字而已,它
是人为决定的。变量可以进行加减运算,但乘除却没有意义。对于定距变量,除了计算其众
数、中位数、均数外,还可以计算算术平均值、标准差、简单相关系数等营销研究中常用的
统计量。那些可用于定类和定序数据的统计分析方法也可以用于定距数据。
在实际调研中,有时定序和定距尺度的区分并不是绝对的。一个定序变量可以传达部
分有关距离的信息,因此有时在统计分析时,可能会把它近似地看成定距变量对待。
四、定比尺度
定比尺度(Ratio scale)也称为等比尺度或比例尺度。不仅具备前面三种尺度的所有功
能,而且还有自然零点,因此可以进行加减乘除运算。如对人们的收入、年龄、出生率、性
别比等所进行的测量都是定比尺度的测量。对于定比变量,计算比值是有意义的。身高体重、
年龄、销售额、购买频率等都是以定比尺度测量的变量。不过,在态度、观点、感受和偏好
等方面的测量,定比尺度就非常困难。绝对零点的存在意味着定比尺度可以进行所有的算术
运算,还有几何平均数、调和平均数。
选择恰当的测量尺度对于营销测量相当重要。表 5-1 是四种测量尺度的比较。
表 5-1 四种测量尺度的比较
测量水平 量表描述 涉及的典型变量 描述性统计
定类 用数字识别对象类别,判断
属于/不属于
归类,如男性/女性、
用户/非用户
频数、百分比/众数
定序 除识别外,数字还用于确定
顺序,判断更大/更小
排序,如对酒店或银
行的偏好、对食品口
味打分
加上中位数
定距 除类别和顺序外,数字还用
于判断距离,判断间距的相
等性
复杂构架的偏好,如
温度、某品牌的认知
水平
再加上算术平均数
定比 综合上面三种特性,再加上
绝对零点,判断比例的相等
性
进行精确测量,如销
售数额、年龄、收入
再加上几何平均数、调
和平均数
———————————————————————————————————————
例 5-3 对洗发水的偏好
表中以某个消费者对洗发水品牌的偏好和购买为例,给出了各种测量尺度的虚拟例子。
表中第 2 列的编号属定类变量,用来识别不同的品牌(例如 1 代表力士洗发水,3 代表海飞
丝洗发水,6 代表舒蕾洗发水),数字的大小并不代表洗发水的优劣;偏好排序(表中第 3
列)是定序变量,表示调查对象对不同品牌的偏好顺序,其中潘婷是最受欢迎的品牌,其次
是力士,对清扬的偏好排在最后;第 4 列的偏好等级用的是定距尺度,其中偏好排序列前两
位的品牌的得分相同,都是 7 分,而排最后的品牌最低,只有 3 分,表明对力士和潘婷的偏
好程度其实相差很小;最后一列的购买量是定比变量,从中可以看出潘婷的购买量最大,约
为力士的 倍,飘柔的 5 倍。
主要测量尺度的例子
名牌名称 定类尺度编号 定序尺度偏好排
序
定距尺度偏好等
级(1-7)
定比尺度购买量
(支)
力士 1 2 7 3
潘婷 2 1 7 5
海飞丝 3 4 4 0
飘柔 4 3 6 1
清扬 5 6 3 0
舒蕾 6 5 4 0
———————————————————————————————————————
第 3 节 营销调研常用量表
量表是一个纽带,它连接着研究目标与被研究者。调研的目的必须转化为具体的问题和
测量指标才能从被访者那里搜集到所需的数据和信息。量表在营销调研中起着重要的作用。
如果量表设计的不合理,那么精心编制的抽样计划、训练有素的访问人员、科学的数据分析
技术都将徒然无用。不恰当的设计必将导致信息收集的不完整和数据的不准确,最终导致资
源的浪费。
一、量表的定义和特征
量表是一种测量工具,它是用来对主观的或抽象的概念进行定量化测量的程序,对事物
的特征变量根据特定的规则分派数字或符号,因此形成了不同测量水平的测量量表,又称为
测量尺度。量表相当于一把“尺子”,用于精确度量一个较抽象的或综合性较强的概念,特别
是态度和观念(如生育态度、种族偏见、政治倾向)的不同程度和差异。
量表分为一维和多维。一维量表用于测量应答者或者客体的单一特性。例如,我
们可以设计一种量表来测量消费者对价格的敏感性。虽然我们可能会设计好几个题项
来测量它,但这些题项都可以结合为单一的测量,并把所有消费者放在一条称为就挨
个敏感程度的线谱上。多维量表是指某个主体或者客体需要用多个维度量表来测量。
例如,大众汽车通过“富裕程度、价格敏感性、对汽车的欣赏水平”三个维度来确定自
己的 消费者。
量表比单一指标或单项问题的测量能获得更多、更真实、更准确的信息,能通过间接的、
定量的方式衡量那些不能够直接观察和度量的社会现象。
量表的点数是调查问卷设计中的一个重要的考虑因素。研究结果表明,多点数一般优于
少点数,量表的测量信度随点数的增加而提高,辨别力也随之加强。当量表点数从 2 点增加
到 7 点时,信度显著提高;7 点以后,信度提高幅度趋于平缓;当量表点数取到 11 以上时,
信度提高减少;20 点以上时,信度下降。因此,量表点数在 5 点到 11 点这个范围,是比较
理想的。
二、量表的常用形式
营销调研中常见的量表形式可以从比较量表和非比较量表来分类。如图 5-1 中比较量表
有配对比较量表、等级顺序量表、常量和量表;非比较量表有李克特量表、语义差异量表和
瑟斯顿量表。下文将首先介绍营销调研、社会研究中广泛应用的李克特量表,然后依次对各
种量表进行介绍说明。
分项评分量表
量表
非比较量表比较量表
配对比较 等级顺序 常量和 连续评分量表
瑟斯顿李克特 语义差异
图 5-1 量表分类图
(一)李克特量表
李克特量表(Likert scale)是由伦斯·李克特根据一般量表方法发展而来的,该量表后来
又被许多调研组采用并进行改动。李克特量表是社会研究中广泛应用的一种量表形式。李克
特量表要求被调查者对有关研究对象的每一个陈述语句表示同意或不同意的反应态度。一般
每个量表项目有 5 个反映类别,即 5 点量表,从强烈反对到强烈赞成,数值可以是-2—2,
或者是 1—5,随着研究的不断深入,又出现了 7 点量表和 9 点量表等形式。进行具体分析
时既可以逐项进行,也可以根据对项目求和计算出的总评分展开。
1.李克特量表的特征
(1)由一套态度项目构成,假设每一项目具有同等的态度数值,根据受试者反应同意与
不同意的程度给予分数,所有项目分数的总合即为个人的态度分数,这个分数的高低即代表
个人在量表上的位置,表示同意或不同意的程度。
(2)因素量表可含不同构面,为多元量表,李克特也属于因素量表之一。
2.李克特量表的制作过程:
(1)收集 50~100 与测量主题有关的陈述语句,各种陈述和说法应当比较分散,以覆盖
所研究问题的一个足够宽的范围。
(2)对每个陈述语句,设定项目选项,对每个选项赋予一个分值。有些说法是正向表述
的,有些是负向的。在计算累加的态度总分时,需要对负向说法的得分作逆向处理。
(3)选择部分受测者对全部项目进行预测试,根据受测者的各个项目的分数计算代数和,
得到个人态度总得分,并依据总分高低将受测者排序。预测试人数最好在 20 人以上。
(4)将调查中得分最高的 25%的人与得分最低的 25%的人进行比较,然后计算出每道
题的分辨力系数。分辨力系数是绝对数,取值越小就说明题目的分辨力低,应考虑删除。
分辨力系数=℃(得分最高的 25%的人在这一问题上的平均分-得分最低的 25%的人这
一问题上的平均分)/总分均值℃
(5)根据试调查的数据进行量表的信度和效度分析。根据分析的结果,去除影响信度
和效度的陈述或说法,从而得到有较高信度和效度的李克特量表。
———————————————————————————————————————
例 5-4 关于非营利医院市场导向的李克特量表
非常
不同
意
比较
不同
意
中
立
比较
同意
非常
同意
1、医院定期对患者进行有关医院承诺落实情况的调查 1 2 3 4 5
2、医院在充分了解患者需要的基础上制定发展战略以谋求竞争优势 1 2 3 4 5
3、医院定期进行患者满意度调查,并请患者提出建议 1 2 3 4 5
4、医院定期与患者及家属座谈,以了解他们未来的需求 1 2 3 4 5
5、医院高层管理者定期讨论竞争对手的优势和劣势 1 2 3 4 5
6、医院经常与能够影响患者选择的相关人员和机构进行交流 1 2 3 4 5
7、医院对医疗行业内的重大变化不敏感 1 2 3 4 5
8、医院定期审视环境因素的改变对患者就医行为可能产生的影响 1 2 3 4 5
9、医院与所辖区域政府保持密切的联系 1 2 3 4 5
10、医院各部门之间能定期沟通市场需求和市场竞争的相关信息 1 2 3 4 5
11、医院定期在内部传播材料,向各科室和医务人员提供患者信息 1 2 3 4 5
12、当医院主要患者群和患者来源地发生了重要事件时,医院所有
人员都会在短期内知道
1 2 3 4 5
13、患者满意度调查材料会定期传播到医院的各部门和临床科室 1 2 3 4 5
14、患者满意是医院的经营服务目标 1 2 3 4 5
15、医院凭借自身现有或潜在的竞争优势吸引患者 1 2 3 4 5
16、医院依据自身市场定位指导医疗业务和医疗服务开发方向 1 2 3 4 5
17、医院不关注顾客的意见与抱怨 1 2 3 4 5
18、发现医疗服务令患者不满意时,能够及时采取措施进行纠正 1 2 3 4 5
19、当患者提出改进服务的建议时,医院有关部门就会及时相互协
调,努力予以完善
1 2 3 4 5
20、管理部门与临床部门之间关于医疗业务拓展策划的沟通较少 1 2 3 4 5
21、某部门发现了竞争者的重要信息时,通常不能及时提醒其他部
门加以警惕
1 2 3 4 5
资料来源:2006 中国市场营销研究中心年会论文,“我国非营利医院市场导向量表的构建”,陈凯
(二)语义差异量表
语义差异量表(semantic differential scale)又叫语义分化量表,这是一种态度
测量技术。20 世纪 50 年代后发展起来,是一次性集中测量被测者所理解的某个单词
或概念含义的测量手段。针对这样的词或概念设计出一系列双向形容词量表,请被测
者根据对词或概念的感受和理解,在量表上选定相应的位置。
语意差异量表是由两个意义对立的形容词构成一组双极标度,以评价产品、品牌、
企业或观念等。在意义对立的两个形容词中间,又分为不同级别,一般有 5 级、7 级、
9 级或 11 级等。
1.语义量表的使用方法
(1)确定所测量的词或概念的维度供受访者判断。
(2)界定两个相反的术语代表每一维度的两极。(为防止回答偏差,最好将彼此
有关系的项目位置加以变化。)
(3)做出语义差异的计分表。 可以对语义差别量表中的不同项目根据受访者的
回答进行打分。结果数据可用来分析不同测量对象、不同受访者的相同点和不同点。
还可将各项目的得分加总,用以比较不同测量对象整体形象的偏好等级。
(4)通过语义差异量表,我们可以对相互比较的两组或者多组品牌或者研究对象
作出比较。因为在受访者的心目中,不同比较对象的差异程度以通过连点画线和计算
的方式表现出来。
2.语意差别量表的分析方法
(1)总分分析法
总分析法是对各评价等级赋值,然后把每一个被调查者所选择的评价分数加总,
其总分就是该被调查者对调查事物的总体评价。
(2)图上分析法
图上分析法是在对各评价等级赋值后,把所有被调查者对每一对评价项目的打分
加总,然后计算平均值,并把各评价项目的平均值用折线连接起来,根据图中折线对
调查事物进行分析。
———————————————————————————————————————
例 5-5 用语义差异量表请消费者对某个品牌饮料的进行评价:
请你从以下几个方面对饮料进行评价,在最能表明您的评价的位置上做上标记
1 2 3 4 5 6 7
品牌名气大+-------+-------+-------+-------+-------+-------+品牌名气小
品质好 +-------+-------+-------+---- ---+-------+-------+品质差
档次高 +-------+-------+-------+-------+-------+-------+档次低
包装精美 +-------+-------+-------+-------+-------+-------+包装部精美
品味好 +-------+-------+-------+-------+-------+-------+品位差
包装时尚 +-------+-------+-------+-------+-------+-------+包装无时尚感
广告动人 +-------+-------+-------+-------+-------+-------+广告不动人
促销吸引人+-------+-------+-------+-------+-------+-------+促销不吸引人
———————————————————————————————————————
(三)瑟斯顿量表
瑟斯顿量表(Thurstone scale),全称“瑟斯顿态度量表”(Thurstone attitude scale),也有
称沙斯通量表。瑟斯顿量表通过应答者在若干(一般 9—15 条)与态度相关的语句中选择是
否同意的方式,获得应答者关于主题的看法。每条语句根据其类别都有一个分值,要求受测
者指出他同意的陈述,根据受测者所同意的陈述或意见的分值,通过分值平均数求得受测者
的态度分数。分数越高,说明受测者对某一问题持有的态度越有利;分数越低,说明持有的
态度越不利。总体而言,瑟斯顿量表应用情况较少。
瑟斯顿量表的制作过程如下:
(1)由调查者提出若干个指标项目。
(2)将这些表述提供给一组评定人员,通常在 10-20 人左右,要求他们对每一个项目
测量变量的强度进行评判(通过赋值,譬如 1-13 分),对关系最弱的赋值 1 分,对关系
最强的赋值 13 分,关系强度中等待赋予中间值,依次类推,赋予每一个项目一个分值。
(3)根据评定人员给予每一个项目的分数,计算平均数和标准差,平均数反映了评定
人员对某语句态度的集中程度,而标准差则反映了他们态度的离散程度。从而选出得到
裁判共识最多的项目,并剔除没有得到共识的项目。
(4)在得到共识的项目中,选择代表 1-13 分(一个或者多个)项目。在真正调查时向
受访者提出,要求他们回答。
———————————————————————————————————————
例 5-6 电视商业广告态度测量的沙氏通量表:
(1) 所有的电视商业广告都应该由法律禁止
(2) 看电视广告完全是浪费时间
(3) 大部分电视商业广告是非常差的
(4) 电视商业广告是非常差的
(5) 电视商业广告并不过分干扰欣赏电视节目
(6) 对大多数电视商业广告我无所谓好恶
(7) 我有时喜欢看电视商业广告
(8) 大多数电视商业广告是挺有趣的
(9) 只要有可能,我愿意电视上看过广告的商品
(10) 大多数商业广告能帮助人们选择更好的商品
(11) 电视商业广告比一般电视节目更有趣
(四)连续评分量表
连续评分量表(continuous rating scale)也称作图示评分量表,是要求被调查者在一
条直线上的适当位置作出标记为研究对象打分,这条直线从一个极端到另一个极端,调
查对象未被局限于从由调研人员事先设定好的分数中选择。评分分数可以是数字的或文
字描述的,下面例子说明了连续评分量表的 3 种形式。这种量表类型评分麻烦且不可靠,
所以在营销调研中的应用有限。但随着计算机应用和相关技术的快速发展,量表值可由
相关软件计算完成,因此具有应用前景。
———————————————————————————————————————
例 5-7 用连续评分列表对家乐福超市进行评价
1.请你为家乐福超市人员的服务态度打分。
态度很差------------------------------------------------态度很好
2.请你为家乐福超市的购物环境打分。
环境很差------------------------------------------------环境很好
0 10 20 30 40 50 60 70 80 90 100
3.请你为家乐福超市的商品布置打分。
布置很零乱---------------------------------------------布置有特色
很差 一般 很好
———————————————————————————————————————
(五)配对比较量表
在配对比较量表(paired comparison scale)中,受测者被要求对一系列对象两两进
行比较,在两个被比较中的对象中做出选择 。“1”表示受测者认为这一项目更重要,“0”
表示认为另一个项目更重要。将各行取值进行加总,得到比较得分。
配对比较方法克服了等级排序量表存在的缺点。首先,对受测者来说,从一对对象
中选出一个肯定比从一大组对象中选出一个更容易;其次,配对比较也可以避免等级量
表的顺序误差。但是,因为一般要对所有的配对进行比较,所以对于有 n 个对象的情况,
要进行 n(n-1)/2 次配对比较。因此,被测量的对象的个数不宜太多,以免使受测者产生
厌烦而影响应答的质量。
———————————————————————————————————————
例 5-8 某电脑经销商非常想了解几种电脑品牌在消费者心目中的地位,就可以采用配
对比较量表。如果将 A 品牌和 B,C,D 另外三种品牌的电脑进行比较,即可将 A 品牌
与其余三种品牌组合成 6 对,要求受访人员成对比较,并指出哪一种品牌较好。假设在
本次调查中选用的样本量为 100,如果 A 与 B 的比较回答中回答 A 佳,则在 A 较 B 佳
栏目下记录一人,如果共有 20 人这样认为,则频数为 20。全部 6 对电脑品牌比较后所
得的结果见表 5-4
认为 i 品牌较 j 品牌为佳的人数分布
i
j
A B C D
A ---- 80 70 40
B 20 ---- 30 15
C 30 70 ---- 35
D 60 85 65 ----
为了更进一步分析,可将频数转化为频率,见下表
i
j
A B C D
A
B
C
D
合计
表中,各品牌与自身比较的比率均是 ,将每栏的比率相加,就可得到受访者对各个
品牌的态度值。四种电脑品牌的态度值相比,显然 B 品牌最受欢迎。调查所得的结果是:
B()>C()>A()>D()
———————————————————————————————————————
配对比较量表适用于商品品牌(或规格、花色等)不多,而且消费者对各种品牌的
商品比较了解的情况。
(六)等级顺序量表
等级顺序量表将许多研究对象同时展示给受测者,并要求他们根据某个标准对这些
对象排序或分成等级。这种测量水平,不仅能区分不同类别,而且能排出等级或顺序,
如胖瘦、大小、高矮、上中下、名次等。等级量表反映事物的类别的差不必相同,不具
有等距性。排序的对象不能太多,否则易出现错误或遗漏。
———————————————————————————————————————
例 5-9 对国际足坛的豪门俱乐部按照偏好的顺序进行排列,选出你最喜欢的球队并填写 1,
然后找出第二位偏爱的球队并填写 2,继续这一步骤直到你对所有球队按偏好的顺序进行了
排列,任何两个品牌不应该得到相同的排序数。偏好的标准由你决定,没有正确或错误的答
案,尽量保持一致。
足球俱乐部名称 等级顺序
1.巴萨罗纳 2
2.皇家马德里 6
米兰 5
4.切尔西 4
5.曼联 3
6.拜仁慕尼黑 7
7.阿森纳 1
8.国际米兰 8
9.利物浦 9
10.热刺 10
———————————————————————————————————————
(七)常量和量表
常量和量表(constant sum scale)也叫做数值分配量表,是要求被调查者在固定数
值范围内(10-100),对所测事物依次分配一定数值,从而作出不同评价。
———————————————————————————————————————
例 5-10 用常量和量表对三种品牌进行调查
对某种商品的三种品牌在消费者心中的信誉高低进行调查,要求消费者按喜爱程度对
三种商品一一 打分,每个评价项目总分为 100 分。例如某消费者的打分结果如下表所示:
品牌
消费者
A B C 合计
1 70 20 10 100
2 50 30 20 100
3 30 40 30 100
总计 150 90 60
从各品牌的总得分可以看出,A 品牌得分最高为 150 分,说明 A 品牌是该消费者最
喜欢的品牌,平均得分为 50 分。如果调查了 100 个消费者,就需把 100 个人得分数值
相加后再除以人数,从而得到该品牌的最后得分。
量表是营销测量过程中收集数据的重要工具,科学合理的设计量表至关重要,调研人员
还要根据所测对象的不同特征,调研的环境及想要得到的数据类型进行合理的选择量表。
表 5-1 为各种量表之间的比较。
表 5-1 常用量表的比较
李克特量表
语义差异
量表
瑟斯顿量表 配对量表 等级量表 常量和
方法 加总量表法 因素法 等距法 配对法 顺 序 等 级
法
数 值 分 配
法
内容 受测者对相
关的陈述语
句发表自己
的看法
在每一个
区间,反映
人们对相
反词汇的
反应强度
应答者通过
对相关的态
度语句对主
题的看法
受测者被
要求对一
系列对象
两两进行
比较得分。
将同时展
示给受测
者,对许多
研究对象
对象排序
调查者对
所测事物
依次分配
数值,作出
不同评价
优点 容易构建执
行;容易理
解
清 楚 有 效
的 描 绘 形
象
调 查 结 果 相
对准确可靠
应用广泛
易于比较
便于比较,
整 理 资 料
简便
容 易 设 计
量表
缺点 调查过程费
时
设计量表
比较费时
问题设计费
时繁琐,应用
并不广泛
当 比 较 对
象很多时,
调 查 结 果
偏差大
只能获得
等级数据,
不具有等
距性
分配数字
困难,难以
处理数据
三、设计量表的基本步骤
1.编拟预试问卷
在预试问卷的编制或修订上,应根据研究目的、相关文献数据与研究结构等方面加以考
虑,如果有类似的研究工具,可根据研究当时的实际情形,加以修订、增删;如果是自己重
新编制问卷,问卷内容应依据研究结构的层面,加以编制。在编制量表时,应注意:
℃在多数情况下,5 点量表比较可靠,选项超过 5 点,一般人难有足够的辨别力。
℃3点量表限制了温和的意见与强烈意见的表达,5点量表则正好可以表示温和意见与强
烈意见之间的区别,7点量表、9点量表可以更为细致的区分态度差异,但存在一定填答障碍,
具体选择时需要根据调研主题的特点进行判断。
℃由于人口变量的异质性关系,对于没有足够辨别力的人而言,使用七点量表法,会导
致信度的丧失;对于具有足够辨别力的人而言,使用 5 点量表,又令人有受限的不适感。以
上问题至目前还没有一个很好解释理由,然而通过预试,可以发现这些问题的存在。
℃量表的点数愈多,选答分布的情形就愈广,变异数也会变得更大,有些人认为这种情
形在统计检验上会具有很好的区别力,然而,(1)这种选答很广的分布缺乏可信度,故意义
不大;(2)较大的选答变异数表示也会有较大的抽样误差,就统计数据分析而言,是不该
有太大的变异数的。
2.预试
℃ 预试问卷编拟完成后,应实施预试,预试对象的性质应与将来正式问卷要抽取得对象性
质相同,如研究对象为中学生,则预试的受试者也应为中学生,预试对象人数以问卷中包括
题项数目的不同而有所区别,当包括的题数分别为 40 题、35 题、25 题时,则预试对象,最
好在 200 位至 120 位之间,题数越多则需要的预试对象越多。如果样本较为特殊,在预试人
数的选取上可考虑再酌减一些。
预试时选取样本数应考虑问卷量是否进行因素分析。因为因素分析时,以较大样本分析
所呈现的因素组型,比一个只用较小样本所出现的因素组型要稳定。进行因素分析时,量表
的题项数愈多及预期要有较多的因素层面的话,进行因素分析时,应包括愈多的受试者。有
关学者建议,进行因素分析时,量表题项数与预试人数比例约为 1:1 最为合适。
3.整理问卷与编号
℃ 问卷回收后,应一份一份检查筛选,对于数据不全或不诚实填答的问卷,应考虑将其删
除;对于填答时皆填同一性答案者,是否删除,研究者应考虑问卷题项本身的内容与描述,
自行审慎判断。筛选完后的问卷应加以编号,以便将来核对数据之用;之后再给予各变量、
各题项一个不同代码,并依问卷内容,有顺序的键入计算机。窗口版 SPSS 可以读取传统文
书文件的数据(配合简短愈发文件程序)、微软 Office 应用软件中 Excel、Access 之文件、
传统数据文件等,研究者可依自己的习惯,挑选一种自己最熟悉的应用软件,以快速、有效
的方式将数据键入计算机中。(研究者最好是选用一种 office 软件输入数据或直接在 SPSS
数据窗口编辑区键入数据)
4.项目分析
℃ 项目分析即在求出每一个题项的“临界比率”,简称 CR 值,其求法是将所有受试者在预
试量表的得分总和依高低排列,得分前 25%至 33%者为高分组,得分后 25%至 33%者为低
分组,求出高低二组受试者在每题得分平均数差异的显著性检验(多数数据分析时,以测验
总分最高的 27%及最低的 27%,作为高低分组界限),如果题项的 CR 值达显著水准(<.05
或<.01),即表示这个题项能鉴别不同受试者的反应程度,此为题项是否删除首先考虑的。
5.再测信度
℃ 如果要继续求出量表的再测信度,要以正式量表对同一组受试者前后测验两次,根据受
试者前后两侧测验分数得分,求其积差相关系数。再测信度又称稳定系数,反应量表的稳定
与一致性程度,一般而言,间隔时间愈长,稳定系数愈低。至于最后定稿的正式量表题项数,
应该为多少题最为适宜,实无一定而绝对的标准。就一般情形而论,若该份量表是测量一种
“普通的”或多重向度的变量,其题数在 20~25 题,即已足够;若要测量的是特定的变量,
以 7~10 题为宜;若每个量表包括不同因素层面之子量表时,每个子量表(因素层面)所包
括的题项以 3~7 题较为适宜。
6.因素分析
项目分析后,为检验量表的结构有效度,应进行因素分析。所谓结构效度是指态度量表
能测量理论的概念或特征的程度。因素分析目的即找出量表潜在的结构,减少题项的数目,
使之变为一组较少而彼此相关较大的变量,此种因素分析方法,是一种“探索性的因素分析”。
7.信度分析
因素分析完成后,继续要进行分析的是量表各层面与总量表的信度检验。所谓信度就是
量表的可靠性或稳定性。
8 确定最终量表
在这些评价的基础上,确定最终量表。至于最后定稿的正式量表题项数,应该为多少题最
为适宜,实无一定而绝对的标准
———————————————————————————————————————
例 5-11 名人推荐者道德名誉对名人广告效果的影响
自 20 世纪初力士香皂在其广告中使用女明星以来,名人广告在商业广告中所占的比例
及所受到的关注都大幅增长。在中国国内,20 世纪 80 年代末,潘虹、李默然等明星开创名
人参与广告拍摄的先河后,众多的广告主都不惜重金请各类名人拍摄广告,以求达到更好的
营销效果。但是,由于一些名人的绯闻,导致人们对名人的道德声誉的关注。为了研究推荐
者道德声誉对名人广告效果的影响,丁夏齐等(2004)开展了一项研究。
在这项研究中,为了设计测量名人道德声誉的量表,首先进行了一项预实验,设定某唱
片公司为一张音乐 CD 做促销广告的情景,并提供了多位真实歌星作为备选的名人推荐者。
60 名普通消费者和 30 名广告专业工作者参加问卷调查,部分人还参加了小组访谈。预实验
的结果表明,中国人对个人道德修养比较重视,广告效果受消费者对名人推荐者道德声誉评
价的影响很大。在预实验的基础上,通过文献回顾和借鉴 Ohanian(1991)开发的量表,构
建了一个测量名人推荐者吸引力、一致性、专业性、可信赖性和道德声誉的初始量表,该量
表含 26 个条目。150 名大学生被试参加了问卷的预测验,共同度(communality)小于
的条目被删除,将初始的 26 个条目简化为 22 个。
接着,在北京对普通中国消费者实施了问卷测量。第一次测量的数据被用于探索性因素
分析,第二次的被用于验证性因素分析。每次分析都使用了 300 个有效被试的数据。问卷构
建时包含了对名人推荐者道德声誉进行评价的条目,并得到了五因子的结构。诸如“吸引
力”、“一致性”、“专业性”、“可信赖性”等,与前人的结果相当一致。“道德声誉”则是新得到
的,该因子包括“名人推荐者有良好声誉”、“名人推荐者尊重社会道德”、“名人推荐者没有
丑闻”等条目。探索性因子分析和验证性因子分析的结果均表明,所设计的量表具有较好的
信度与效度。最终的量表由 22 个条目构成,其名称及因子负载见表
因子载荷(n=300)
条目
因子 1 因子 2 因子 3 因子 4 因子 5
Q4.名人推荐者有吸引力
Q18.名人推荐者长得漂亮
Q5.名人推荐者令人愉快
Q15.我喜欢名人推荐者
Q22.我知道名人推荐者
Q6.名人推荐者能给产品带来积极的联想
Q11.名人推荐者的身份和产品相适应
Q10.名人推荐者可以代表消费者的身份
Q16.名人推荐者的形象与产品相一致
Q13.我认同这种推荐
Q9.产品可以和名人推荐者联系起来
Q14.产品适合于我
Q1.名人推荐者有产品知识
Q2.名人推荐者有产品使用经验
Q17.名人推荐者可以熟练使用产品
Q12.名人有资格做产品的推荐
Q21.名人推荐者是可靠的
Q20.名人推荐者是可信赖的
Q3.名人推荐者是诚实的
Q7.名人推荐者有良好声誉
Q8.名人推荐者尊重社会公德
Q19.名人推荐者没有丑闻
案例来源:丁夏齐等:《名人推荐者道德声誉对名人广告效果的影响:中国消费者的研究》,《“宝洁”
奖论文集》,中国信息协会市场研究业分会,2004,有改动。
———————————————————————————————————————
第 4 节 信度与效度评估
理想的营销调研能够提供精确、清晰、及时的数据。由于概念的定义,指标的分派和实
际测量的误差,测量值和真实值往往有一定的误差,即测量误差。我们以 M 表示测量值,A
表示真实值,E 表示误差,则它们之间的关系可由下式表示:
M=A+E
误差分为系统性误差和随机性误差。系统误差是由于概念操作化过程中的偏差所造成的
持续性误差,常导致测量结果普遍偏高和偏低。例如小商贩对秤砣做了手脚,那么每次称的
东西都会高估物品实际的重量,这就是系统误差。随机性误差也会影响测量结果,但从本质
上讲是暂时的,并不是规律性产生的。
为了保证测量的准确性,能够很好地反映所测属性的真实水平,通常要进行信度和效
度评估(见图 5-3)。
图 5-3
一、信度
信度指的是测量数据的可靠性,主要指实际测量的内容与应当测量的内容之间的一致
性和稳定性。信度系数描述测量信度的数量指标,以相关系数来表示。 信度可用不同时间
测量的评估
效度信度
内部一致性信度复本信度重测信度 内容效度 标准关联效度 结构效度
重复测量的结果或不同测量方法所给出的结果之间的一致性来衡量。具体的评估方法包括
重测法、复本法和折半法。
(一)重测信度
1.定义
重测信度是在类似的条件下,在两个不同的时间先后测量两次,根据两次测量的结果计
算两次测量值之间的相似程度,相关系数越高,表示重测信度越高。这是一种最常用、最普
遍的信度检查方法。用重复测试的方法确定信度要注意,它对时间间隔非常敏感,即在两次
测量之间发生的某些事件、活动,会使后一次测量的结果在客观上发生改变,使两次的相关
系数不能准确地反映两次测量的实际情况。一般重复测试法最好与其他方法结合使用。
2.形式
3、使用的前提条件:
℃测验所测的特质必须是稳定的,即被测的特征和属性在两次测验之间没有发生变化。
℃把握适当的时间间隔
℃两次施测期间被试的效果没有差别
(二)复本信度
1.定义
复本信度采取的是另一种思路:通过构建了两个等价的量表形式,对同一个调查对象进
行测量,对所得到的测量结果进行相关分析以评价信度。这种方法克服了上述重测信度的缺
点,但它要求两个量表完全等价,这是一件非常困难的事。
2.形式
施测 再测
时间间隔
相关系数
3、使用的前提条件:
℃施测所用的两个复本必须是真正平行的测验
① 各份测验测量的是同一种心理特性。
① 各份测验具有相同的内容和形式。
① 各份测验的题目不应重复。
① 各份测验题目数量相等,难度和区分度大体相同。
① 各份测验的分数分布(平均数和标准差)大致相等。
① 复本编好后,应再测一次,以确保各份测验的等值。
℃被试要有条件接受两个测验。
(三)内部一致性信度
1、定义:
指的是测验内容的一致性或测验内部所有题目的一致性(项目同质性)程度。又称同质
性信度。
2、计算方法
内部一致性信度最常用计算方法的是分半法。分半法指将测量对象在测量结果中按测量
项目的奇偶号分成两组,计算这两组分数之间的相关系数,即折半信度。例如,一个忠诚度
测量包括 50 个项目,如果用折半信度来衡量其内在的一致性,则需要把 50 个项目分为两部
分,再求相关系数。一般用 Cronbach's Alpha 系数进行内部一致性分析。Cronbach's Alpha 系数
值在 0~1 之间变化,一般等于或小于 时,就说明内部一致性信度差。
以工作倦怠感问卷为例分析信度以下为第一位受试者勾选实例:
十分 十分
测验 A 测验 B最短时间
相关系数
不
同意
不
同意
未定 同意
同意
1、对工作感觉到有挫折感…………………………………… 1 2 ○3 4 5
2、觉得自己不被了解………………………………………… 1 ○2 3 4 5
3、我的工作让我情绪疲惫…………………………………… 1 2 3 4 ○5
4、我觉得我过度努力工作…………………………………… 1 2 ○3 4 5
5、面对工作时,有力不从心的感觉………………………… 1 2 ○3 4 5
6、工作时感到心灰意冷………………………………………… 1 ○2 3 4 5
7、觉得自己推行工作的方式不适当………………………… 1 ○2 3 4 5
8、想暂时休息一阵子或另调其他职务………………………… 1 ○2 3 4 5
9、只要努力就能得到好的结果……………………………… 1 2 3 ○4 5
10、我能肯定这份工作的价值……………………………… 1 2 3 ○4 5
11、认为这是一份相当有意义的工作………………………… 1 2 3 ○4 5
12、我可以由工作中获得心理上的满足…………………… 1 2 3 ○4 5
13、我有自己的工作目标和理想……………………………… 1 2 3 ○4 5
14、我在工作时精力充沛…………………………………… 1 2 ○3 4 5
15、我乐于学习工作上的新知……………………………… 1 2 3 ○4 5
16、我能够冷静的处理情绪上的问题………………………… 1 2 3 4 ○5
17、从事这份工作后,我觉得对人变得更冷淡……………… 1 ○2 3 4 5
18、对某些同事所发生的事我并不关心…………………… 1 ○2 3 4 5
19、同事将他们遭遇到的问题归咎于我…………………… 1 ○2 3 4 5
20、我担心这份工作会使我逐渐失去耐性…………………… 1 2 ○3 4 5
21、面对民众时,会带给我很大的压力………………………… 1 ○2 3 4 5
22、常盼望有假期,可以不用上班……………………………… 1 2 ○3 4 5
下面是针对 100 位预试对象的实际填答情形,开展的信度分析。100 位预试对象的实际
填答情形,请见本章结尾的附录。第一行 NUM 为受试者编号,A1-A21 代表第 1 题到第 22
题的题号代号。
将题项分成四个因素层面,分别为:
1. 因素层面一:A1、A2、A3、A4、A5、A6、A7、A8、A9 共九题
2. 因素层面二:A10、A11、A12、A13、A14、A15 共六题
3. 因素层面三: A16、A17、A18、A19 共四题
4. 因素层面四: A20、A21、A22 共三题
求各因素层面及总量表之间的内部一致性信度
按图 5-4 出现“Reliability Analysis”(信度分析)的对话窗口(见图 5-1)
图 5-4
操作 1(图 5-5)
将第一个层面的题项选入右边“Items”(项目)框内,例题中的第一个层面为 A1、A2、A3、
A4、A5、A6、A7、A8、A9。在“Mode”的方框中选取“Alpha”(内部一致性℃系数检验)。
图 5-5
操作 2(图 5-6,5-7)
按“Statistics” (统计量)钮,出现“Realiability Statistics”(信度分析:统计量)次对话窗
口(见图 5-6)。在“Descriptives for”)描述统计对象框中选取“Scale if item deleted”(删除
项目后之量尺摘要),按 “Continue”(继续)钮,回到“Reliability Analysis”(信度分析)
对话窗口。按 “OK”钮,“OUTPUT-SPSS Viewer”结果窗口,会出现第一个层面的信度检验结
果。
图 5-6
图 5-7
操作三
回到数据文件窗口,重复前述步骤,分析第二层面(A10、A11、A12、A13、A14、A15)、
第三层面(A16、A17、A18、A19)第四层面(A20、A21、A22)的信度检验结果,操作
方法相同。
以下数据为每个层面分析结果
第一层面的分析结果
可靠性统计量
Cronbach's Alpha 项数
.852 9
项统计量
均值 标准偏差 N
A1 .71181 100
A2 .93225 100
A3 .89052 100
A4 .87132 100
A5 .75879 100
A6 .83333 100
A7 .93008 100
A8 .89691 100
A9 .82975 100
第二层面分析结果
可靠性统计量
Cronbach's Alpha 项数
.813 6
项统计量
均值 标准偏差 N
A10 .77823 100
A11 .86480 100
A12 .86552 100
A13 .97917 100
A14 .92982 100
A15 .93325 100
第三层面分析结果
可靠性统计量
Cronbach's Alpha 项数
.695 4
项统计量
均值 标准偏差 N
A16 .84423 100
A17 .85345 100
A18 .78135 100
A19 .69711 100
第四层面分析结果
可靠性统计量
Cronbach's Alpha 项数
.413 3
项统计量
均值 标准偏差 N
A20 .88763 100
A21 .71181 100
A22 .83871 100
总量表的分析结果
可靠性统计量
Cronbach's Alpha 项数
.897 22
结果说明:
由以上信度检验报表,可以发现四个分量表的 Alpha 系数分别为 、、、
,而总量表的℃系数为 ,以四个分量表来看,除分量表四的信度稍低外,其余三
个分量表系数℃系数在 以上,此外,总量表的℃系数为 ,代表此量表的信度颇佳。
以此例题而言,如要提高分量表四的信度,除对题项内容词句修饰外,如时间许可可增
删题项,再挑选新的受试者预试一次。如果时间不允许,在研究论文限制中,应加以说明,
以作为未来进一步研究的参考。
资料来源:作者根据相关资料整理
———————————————————————————————————————
在提高测量的信度方面并无捷径可走,只有坚持科学严谨的工作作风和实事求是的科
学态度,尽可能采用科学的测量指标与方法,选择合适的测量工具并进行必要的预测试,以
及开展必要的人员培训和良好的现场监督与指导等,才能获得比较可信的测量结果。
二、 效度
效度指的是测量的准确程度或有效程度,理想的效度要求没有测量误差。信度好是效
度好的必要条件,但不是充分条件。即有效的测量必须是可信的,但可信的测量不一定有效。
当一项测量所测的是它希望测量的事物时,我们就说它是一项有效的测量。反之就称为测量
不具有效度。
测量的效度具有三种不同的类型,即内容效度、标效关联效度和结构效度,他们分别
从不同的方面反映测量的准确程度。同时,人们在评价各种测量的效度时,也往往用这三种
类型作为标准。
(一)内容效度
内容效度指测量所选择的项目是否符合测量目的和要求。首先需要知道所测量的概念
是如何定义的;其次,需要知道这种测量所收集的信息是否和该概念密切相关;然后,评价
者才能做出这一测量是否具有内容效度的结论。
判断内容效度不是一件简单的事情,调研者可以用下列步骤来判断内容效度:对所要测
量的概念或者对象进行仔细和准确度界定。竭力收集相关的文献资料,以及举行小组访谈,
尽量列出可能包括对内容。召开作家座谈会,研讨量表中应该包括哪些内容。对量表进行预
测试,也可以通过开放式提问来了解可能包括在内的其他内容。
(二)效标关联效度
效标关联效度又称实证效度、经验效度、准则关联效度。它是指测验对个体的效标行
为表现进行估计的有效程度。例如,可以通过调查,询问消费者在今后一段时间内购买某种
产品的意愿,然后再收集其实际购买数据。将预测的购买与实际的购买相比较,就可以评价
所测量的购买意愿对实际购买行为的标准效度。效标关联效度包括两种类型:预测效度和同
时效度。
预测效度是指一个准则变量的未来值可以通过当前量表的测量来预测的程度。测效度的
效标资料需要过一段时间才可搜集到。此种效度对人员的选拔和安置工作非常重要。常用的
效标是专业训练的成绩、实际工作的表现等。
同时效度关注的是预测变量和准则变量之间的关系,两者均在同一个时点上评估。同时
效度的效标资料是与测验分数同时搜集的。例如大学入学考试可以用中学成绩作效标。同时
效度常用的效标是在校的学业成绩、教师的等级评定、临床检查等。
(三)结构效度
结构效度是指测验对理论构想或特质的测量程度。确认结构效度要求对被测构念有清楚
的定义,对该结构与其他结构之间的关系有合理的假设。
评价结构效度有两种统计方法:收敛效度和区别效度。收敛效度是指用来测量同一架构
的不同测量工具之间的相关程度。区别效度是指利用相同的测量方法测定不同的特征或者概
念,区别不同他洪泽或者概念的程度,就是不同特征或者概念应是低度相关。假设我们设计
一个多项量表来测量顾客在商店的购买倾向。理论上认为这种购买倾向由四种个性变量一起:
高度的自信、低价位需求、高特色需求,以及高水平的适应性。而且,理论上还认为,在商
店的购买倾向与品牌忠诚度或者高度的争强好胜不存在相关性。
三、信度和效度之间的关系
信度与效度都是一种相对量,而不是一种绝对量,即它们都表示一种程度。对于同一
种对象,人们常常采取不同的测量方法,采用不同的测量准则,这样就会在信度与效度两方
面产生差别。
信度是效度的必要条件,如果一个测量值是不可信的,它不可能是有效的;但是信度
不是效度的充分条件,因为即使随机误差为零,还可能存在系统误差,因此测量值虽然具有
很好的一致性和稳定性,但仍然可能偏离真实值。下图更加直观地显示了信度与效度的关系。
靶 A 的结果显示随机误差小,但系统误差大,因此具有高信度但低效度;靶 B 的结果
显示随机误差和系统误差都小,因此具有高信度和高效度;靶 C 的结果显示随机误差和系
统误差都大,因此信度和效度都低。最后我们可以这样概括两者的关系:
(1) 信度低,效度不可能高。因为如果测量的数据不准确,也并不能有效地说明所研
究的对象
(2) 信度高,效度未必高。例如,如果我们准确地测量出某人的经济收入,也未必能
够说明他的消费水平。
(3) 效度低,信度很可能高。例如,即是一项研究未能说明社会流动的原因,但它很
有可能很精确很可靠地调查各个时期各种类型的人的流动数量。
(4) 效度高,信度也必然高。
基本概念
测量 概念操作化 分派指标 测量尺度 定类尺度 定比尺度
定距尺度 定比尺度 量表 问卷 测量误差 随机误差 系统误差
信度 效度
xx
xx
xx
xx
x
x
x
x
A.高信度
低效度
B.高信度
高效度
C.低信度
低效度
图 5-8,信度与效度的关系
思考题
1.什么是测量?如何对抽象的概念进行测量?
2.各种测量尺度之间的优缺点是什么?
3 调查问卷有效性的判别标准是什么?
4.如何设计量表?
5.信度与效度之间的关系是什么?
附录
下面是 100 位预试对象的实际填答情形,第一行 NUM 为受试者编号,A1-A21 代表第
1 题到第 22 题的题号代号。
NU
M
A
1
A
2
A
3
A
4
A
5
A
6
A
7
A
8
A
9
A
10
A
11
A
12
A
13
A
14
A
15
A
16
A
17
A
18
A
19
A
20
A
21
A
22
001 3 2 3 3 3 2 2 2 4 4 4 4 4 3 4 2 2 2 2 3 2 3
002 3 2 2 2 2 2 2 3 3 3 3 3 3 3 4 3 2 2 2 2 4 4
003 3 3 3 3 3 2 2 3 2 2 2 2 3 3 3 3 3 2 3 3 3 3
004 3 3 3 3 3 2 2 3 2 2 3 3 3 3 4 3 2 2 2 2 2 2
005 3 3 3 3 3 2 3 3 3 3 3 3 3 3 3 3 2 1 2 2 3 2
006 4 4 4 3 4 3 3 3 3 3 2 3 4 4 3 1 2 1 3 3 3 3
007 4 4 4 3 4 4 4 4 2 2 2 1 3 2 2 4 4 3 3 4 3 4
008 3 2 3 3 3 2 3 3 3 3 2 2 4 3 3 3 2 3 2 4 3 3
009 2 2 2 2 2 1 1 1 4 4 4 4 4 4 4 4 1 2 2 2 2 3
010 3 3 3 2 2 2 3 2 4 3 2 2 2 2 3 3 3 2 3 3 3 2
011 3 4 2 3 3 3 3 3 3 3 4 4 4 4 4 2 2 3 3 4 3 4
012 3 3 2 2 3 2 3 1 3 3 2 3 3 2 3 3 3 2 3 2 2 3
013 3 4 4 4 3 4 3 3 3 3 4 3 4 4 4 4 2 3 3 2 3 4
014 3 3 3 3 4 4 4 4 2 3 3 3 3 3 3 3 3 2 3 3 3 3
015 3 3 3 3 3 3 2 2 2 3 3 2 2 2 3 3 4 3 3 2 3 2
016 2 2 3 3 2 2 3 3 3 4 4 3 3 3 4 4 2 2 2 3 3 4
017 4 3 4 3 4 4 4 1 3 4 4 2 4 3 4 2 1 2 2 1 2 2
018 3 3 3 2 2 3 2 3 2 2 2 2 3 2 3 3 3 3 2 2 2 3
019 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 1 2 1 1 1 3 3
020 3 4 4 4 1 3 4 4 2 4 3 4 3 4 4 4 1 3 4 4 2 4
021 2 2 3 2 3 2 2 2 2 3 2 3 2 2 3 2 3 2 2 2 2 3
022 2 2 2 2 3 3 3 3 3 3 3 3 2 2 2 2 3 3 3 3 3 3
023 2 2 2 2 3 3 3 3 3 3 3 2 2 3 2 3 2 2 2 2 3 2
024 3 4 4 4 1 3 4 4 2 4 3 2 2 2 2 3 3 3 3 3 3 3
025 2 2 3 2 3 2 2 2 2 3 2 3 2 3 4 4 4 1 3 4 4 2
026 2 2 2 2 3 3 3 3 3 3 3 3 3 2 2 3 2 3 2 2 2 2
027 2 2 2 2 3 3 3 3 3 3 3 3 2 2 2 2 2 3 3 3 3 3
028 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 2 2 2 2 3 2
029 2 2 2 2 3 3 3 3 3 3 3 3 3 2 3 3 3 3 3 3 3 3
030 3 4 4 4 3 4 3 3 3 3 4 3 4 4 4 4 4 1 3 4 4 2
031 3 3 3 3 4 4 4 4 2 3 3 3 3 3 3 3 2 2 2 2 3 2
032 3 3 3 3 3 3 2 2 2 3 3 2 2 2 3 3 2 2 2 2 3 2
033 2 2 3 3 2 2 3 3 3 4 4 3 3 3 4 3 3 3 3 3 3 3
034 4 3 4 3 4 4 4 1 3 4 4 2 4 3 4 4 4 1 3 4 4 2
035 3 3 3 2 2 3 2 3 2 2 2 2 3 2 3 3 2 3 2 2 2 2
036 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 2 2 3 3 3 3 3
037 3 4 2 3 3 3 3 3 3 3 4 4 4 4 4 2 2 3 3 4 3 4
038 3 3 2 2 3 2 3 1 3 3 2 3 3 2 3 3 3 2 3 2 2 3
039 3 4 4 4 3 4 3 3 3 3 4 3 4 4 4 4 2 3 3 2 3 4
040 3 3 3 3 4 4 4 4 2 3 3 3 3 3 3 3 3 2 3 3 3 3
041 3 4 2 3 3 3 3 3 3 3 4 4 4 4 4 2 2 3 3 4 3 4
042 3 3 2 2 3 2 3 1 3 3 2 3 3 2 3 3 3 2 3 2 2 3
043 3 4 4 4 3 4 3 3 3 3 4 3 4 4 4 4 2 3 3 2 3 4
044 3 3 3 3 4 4 4 4 2 3 3 3 3 3 3 3 3 2 3 3 3 3
045 4 3 4 3 4 4 4 1 3 4 4 2 4 3 4 2 1 2 2 1 2 2
046 3 3 3 2 2 3 2 3 2 2 2 2 3 2 3 3 3 3 2 2 2 3
047 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 1 2 1 1 1 3 3
048 3 4 4 4 1 3 4 4 2 4 3 4 3 4 4 4 1 3 4 4 2 4
049 2 2 3 2 3 2 2 2 2 3 2 3 2 2 3 2 3 2 2 2 2 3
050 2 2 2 2 3 3 3 3 3 3 3 3 2 2 2 2 3 3 3 3 3 3
051 2 2 2 2 3 3 3 3 3 3 3 2 2 3 2 3 2 2 2 2 3 2
052 3 4 4 4 1 3 4 4 2 4 3 2 2 2 2 3 3 3 3 3 3 3
053 2 2 3 2 3 2 2 2 2 3 2 3 2 3 4 4 4 1 3 4 4 2
054 4 3 4 3 4 4 4 1 3 4 4 2 4 3 4 2 1 2 2 1 2 2
055 3 3 3 2 2 3 2 3 2 2 2 2 3 2 3 3 3 3 2 2 2 3
056 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 1 2 1 1 1 3 3
057 3 4 4 4 1 3 4 4 2 4 3 4 3 4 4 4 1 3 4 4 2 4
058 2 2 3 2 3 2 2 2 2 3 2 3 2 2 3 2 3 2 2 2 2 3
059 2 2 2 2 3 3 3 3 3 3 3 3 2 2 2 2 3 3 3 3 3 3
060 2 2 2 2 3 3 3 3 3 3 3 2 2 3 2 3 2 2 2 2 3 2
061 3 4 4 4 1 3 4 4 2 4 3 2 2 2 2 3 3 3 3 3 3 3
062 2 2 3 2 3 2 2 2 2 3 2 3 2 3 4 4 4 1 3 4 4 2
063 3 4 4 4 1 3 4 4 2 4 3 4 3 4 4 4 1 3 4 4 2 4
064 2 2 3 2 3 2 2 2 2 3 2 3 2 2 3 2 3 2 2 2 2 3
065 2 2 2 2 3 3 3 3 3 3 3 3 2 2 2 2 3 3 3 3 3 3
066 2 2 2 2 3 3 3 3 3 3 3 2 2 3 2 3 2 2 2 2 3 2
067 3 4 4 4 1 3 4 4 2 4 3 2 2 2 2 3 3 3 3 3 3 3
068 2 2 3 2 3 2 2 2 2 3 2 3 2 3 4 4 4 1 3 4 4 2
069 3 3 3 3 3 4 3 2 3 2 2 2 3 2 4 3 2 3 2 2 2 3
070 3 4 3 4 3 3 3 2 4 2 2 2 4 2 3 3 2 4 2 2 2 4
071 3 2 2 4 3 4 3 2 4 3 2 2 4 3 4 3 2 4 3 2 2 4
072 3 3 2 4 3 3 2 2 4 2 2 2 4 2 3 2 2 4 2 2 2 4
073 4 3 3 3 4 4 2 2 1 3 3 3 1 3 4 2 2 1 3 3 3 1
074 3 3 3 3 4 3 3 3 3 4 3 3 3 3 4 3 3 3 3 3 3 4
075 3 4 2 3 3 3 4 2 3 3 3 4 2 3 3 3 4 2 4 2 3 3
076 3 3 3 3 3 3 3 2 2 3 3 3 2 2 3 3 3 2 3 2 2 3
077 3 4 3 4 3 3 4 4 4 3 3 4 4 4 3 3 4 4 4 4 4 3
078 3 2 2 4 3 3 3 3 3 4 3 3 3 3 4 3 3 3 3 3 3 4
079 3 3 2 4 3 4 3 4 3 4 4 3 4 3 4 4 3 4 3 4 3 4
080 4 3 3 3 4 3 3 3 2 2 3 3 3 2 2 3 3 3 3 3 2 2
081 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
082 3 4 4 4 1 3 4 4 4 1 3 4 4 4 1 3 4 4 4 4 4 1
083 2 2 3 2 3 2 2 3 2 3 2 2 3 2 3 2 2 3 2 3 2 3
084 2 2 2 2 3 2 2 2 2 3 2 2 2 2 3 2 2 2 2 2 2 3
085 2 2 2 2 3 2 2 2 2 3 2 2 2 2 3 2 2 2 2 2 2 3
086 3 4 4 4 1 3 4 4 4 1 3 4 4 4 1 3 4 4 4 4 4 1
087 2 2 3 2 3 2 2 3 2 3 2 2 3 2 3 2 2 3 2 3 2 3
088 4 3 4 3 4 4 3 4 3 4 4 3 4 3 4 4 3 4 3 4 3 4
089 3 3 3 2 2 3 3 3 2 2 3 3 3 2 2 3 3 3 3 3 2 2
090 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
091 3 4 4 4 1 3 4 4 4 1 3 4 4 4 1 3 4 4 4 4 4 1
092 2 2 3 2 3 2 2 3 2 3 2 2 3 2 3 2 2 3 2 3 2 3
093 2 2 2 2 3 2 2 2 2 3 2 2 2 2 3 2 2 2 2 2 2 3
094 2 2 2 2 3 2 2 2 2 3 2 2 2 2 3 2 2 2 2 2 2 3
095 3 4 4 4 1 3 4 4 4 1 3 4 4 4 1 3 4 4 4 4 4 1
096 2 2 3 2 3 2 2 3 2 3 2 2 3 2 3 2 2 3 2 3 2 3
097 3 4 4 4 1 3 4 4 4 1 3 4 4 4 1 3 4 4 4 4 4 1
098 2 2 3 2 3 2 2 3 2 3 2 2 3 2 3 2 2 3 2 3 2 3
099 2 2 2 2 3 2 2 2 2 3 2 2 2 2 3 2 2 2 2 2 2 3
100 2 2 2 2 3 2 2 2 2 3 2 2 2 2 3 2 2 2 2 2 2 3