L GD 在选拔企业中高级管理
人才方面的实证研究
彭平根
(上海师范大学应用心理学系 , 上海 ,200234)
丁 彪
(华东师范大学心理学系 ,上海 ,200062)
苏永华
(中国四达国际经济技术合作公司上海分公司测评咨询中心 ,上海 ,200021)
摘 要 本研究利用在为某企业人才招聘活动中提供大型人才测评服务时所收集到的数据 ,分析研究了无
领导小组讨论测评技术的信效度。结果表明 ,在 L GD 测评技术中 ,评价者经过系统培训后 ,其评分者信度较
高 ,但在不同要素的评价方面存在一定的差异性 ;在效度方面 ,通过多种途径的数据检验都表明 L GD 是一种
比较有效的人才测评技术。同时 ,本研究还得出结论 ,与个性品质方面的评价相比 ,L GD 在评价个人的能力
素质特征方面更有优势。另外 ,结合本次人才测评的实际操作经验 ,研究者还提出了有关 L GD 测评实施过程
的应用建议。
关键词 : 无领导小组讨论 测评技术 评分者信度 效度
1 问题的提出
无领导小组讨论 (Leaderless Group Discussion ,
简称 L GD)作为评价中心技术的常用方法 ,主要应
用于中高级管理人才的测评与选拔。该方法在国外
的企业及各类行政事业性部门得到了广泛的应用。
在国内 ,随着最近几年各级各类专业人才测评机构
的成立 ,适应社会市场的需求 ,这一方法在高级公务
员选拔以及企业管理干部的素质测评与选拔等方面
也已经逐步得到推广应用。但从相关文献检索的结
果来看 ,发现国内对此方法的研究大多停留在介绍
使用的层面 ,较多地提及诸如 L GD 测评技术的设
计、实践的实施操作步骤和方法以及评分实施细节
等问题 ,而很少从测量学的专业角度对这一人才测
评技术进行相关的专业研究分析。事实上 ,L GD 作
为一种人才测评技术 ,其信度和效度是研究者与实
际工作者都极为关心的一个问题。因此 ,无论是从
专业理论研究的角度还是社会应用实践出发都有必
要要求相关的研究人员在这个领域进行探讨。
2001 年 5 月份 ,我们给武汉的某上市公司做了
一次大型的人才测评 ,为其选拔中高级管理人才提
供指导。其间 ,我们就运用了无领导小组讨论的测
评方法。因为本次参加测评的对象为来自全国各地
的求职者 ,共有 232 人参加了无领导小组讨论这一
测评活动 ,因而样本有一定的代表性。利用这次测
评收集到的数据我们对该方法的信效度等实证指标
作了一次系统分析 ,并对该方法在实际的应用中应
注意的有关问题结合本次实际操作提出了几点建
议。
2 研究过程
2. 1 样本 (被评价者)分布情况
本次研究的主要对象是参加了 L GD 测评的人
员 ,这部分被评价者共有 232 人 ,共分为 34 组 ,每组
6 —8 人不等。此次人才测评直接为人才招聘提供
指导 ,因此有许多求职者都先后接受了其他人才测
评技术服务 ,其中参与情景模拟游戏 ( Game) 的被评
价者有 224 人 ,参与以 HR 个性测验为代表的多项
心理测验的 333 人。在这里收集另外几种测评方法
的相关数据是为 L GD 技术提供效度方面的证据所
用 。具体的样本分布情况见表 1。
2. 2 测评的基本要素设计
考虑到本次测评的实际应用要求 ,在设计各测
评方法的测评要素及评价标准时 , 一方面我们以工
表 1 参与 L GD 测评的样本分布情况
统计量 人数 百分比
性别
男 186 70. 2 %
女 46 19. 8 %
年龄
20~29 岁 59 25. 4 %
30~39 岁 145 62. 5 %
40~50 岁 28 12. 1 %
学历
大专 21 9. 0 %
本科 157 67. 7 %
硕士及以上 54 23. 3 %
合计 232 100 %
作分析为出发点 ,通过调查与访谈相结合的方法 ,同
675 心 理 科 学 2002 年 第 25 卷 第 5 期
时也考虑该企业根据他们自己的实践经验所提出的
岗位特殊要求等综合因素来确定拟测评的基本要
素 ,然后在文献调查及专家讨论的基础上针对每一
测评要素制定相应的评价标准。经过这样的操作步
骤 ,最后我们确定在无领导小组讨论中 ,主要的测评
要素为表达能力、逻辑分析能力、决策能力、沟通能
力、组织协调能力、应变能力以及自信心、真诚、宽
容、情绪稳定性、性格的内外倾向性等 (个性特征中
的真诚、宽容两个品质是应客户企业的要求确定
的) ;而在情景模拟游戏中则主要测评被试的责任
心、合作性、决策能力、组织协调能力以及沟通能力
等要素 ; HR 个性测验的主要测评要素是责任心、进
取心、真诚、自信心、诚实性、情绪稳定性等。多种测
评方法测评某些共同要素的技术设计能为我们收集
L GD 的效度提供非常有价值的实证数据资料。
2. 3 L GD 测评基本过程
无领导小组讨论的施测过程严格按照评价中心
技术的要求进行。担当评委的评价者由心理学专
家、企业总裁以及该企业人力资源部的人事专家共
6 人组成 ,评委们事先都经过系统的培训 ,培训的内
容主要有 L GD 测评技术的基本原理、测评要素设计
的原因 (为什么要设计这些测评要素) 、每一测评要
素的含义、要素的评分标准、观察与评分的技巧及具
体要求 (客观公正公平) 等 ,培训的重点是使他们能
准确理解和掌握每一测评要素的内涵及评分过程中
的注意事项 ,如不对任何被评价者给予任何的相关
提示或讨论的方向导引等。在测评过程中 ,评价者
的主要任务就是观察被试的行为表现 ,根据评分标
准独立地作出自己的评判。
2. 4 研究结果
2. 4. 1 L GD 的信度分析
关于多个评委对多个被试进行评价的测评方
法 ,在考察其信度水平时一般是看其评分者信度。
评分者信度代表了 N 名评委在某同一小组内评分
的一致性水平。在本研究中 ,拟采用肯德尔和谐系
数 W 作为衡量指标。因为在 L GD 的测评过程中 ,
所有小组的评委都由固定的测评专家担任 ,因此在
考察其评分者信度时 ,我们随机抽查了其中的 1 个
小组 (第 16 组) ,对每一测评要素考察其 W 系数值
的大小及其相关是否显著。研究结果见表 2。
表 2 的数据表明 ,作为衡量 L GD 测评技术评分
者信度指标的 W 系数都达到了统计学上的可接受
水平 ,除了真诚要素的 W 值略低 ( w = 0 . 383 , p < .
05) 外 ,其余的 W 值范围均在 0 . 523 至 0 . 793 之间 ,
并且经检验都达到了差异显著性水平 ( p < . 01) 。
进一步分析发现 ,如果把测评要素简单地分类为能
力 (表达能力、分析判断能力、沟通能力、组织协调能
力、决策能力、应变能力)与个性特征 (自信心、真诚、
宽容、情绪稳定性、性格的内外倾向性)的话 ,从表中
数据可清晰地看出 ,作为衡量能力要素组内评分一
致性指标的 W 系数值 (6 个能力要素的平均 W 系
数值为 0. 675)要高于个性要素的 W 值 (5 项个性的
平均 W 系数值为 0. 542) 。由此我们可以得出结
论 ,L GD 的评分信度是较好的 ,但在不同要素的评
价方面存在一定的差异 ,总体上各位评价者对能力
方面的素质特征评价一致性要略高于个性特征的评
价一致性。亦即表明评价者对有关能力素质特征方
面的测评维度在要素的内涵理解及测评标准的把握
方面一致性水平较高。
2. 4. 2 L GD 的效度分析
关于 L GD 测评技术的效标收集是一项比较有
难度的工作。一般而言 ,若能进行追踪研究 ,收集到
接受 L GD 测评的被评价者在若干年之后的工作业
表 2 L GD 组内评分一致性考察结果 (肯德尔和谐系数 W)
测评要素 第 16 组
(6 名评委 8 名考生)
W p (Sig. )
表达能力 0. 793 0. 002
分析判断能力 0. 669 0. 009
沟通能力 0. 607 0. 001
组织协调能力 0. 644 0. 000
决策能力 0. 689 0. 000
应变能力 0. 649 0. 000
自信心 0. 569 0. 001
真诚 0. 383 0. 024
宽容 0. 590 0. 001
情绪稳定性 0. 523 0. 003
性格的内外倾向性 0. 647 0. 011
绩数据 ,这种数据应该是一个比较有价值的效标 ,但
目前这种技术假设要求受到诸多客观条件的制约 ,
因此我们只能利用目前已有的相关研究资料来完成
效度的检验工作。好在本次人才招聘活动给我们提
供了许多有利条件 ,因为在此次招聘活动中 ,我们除
了给求职者提供 L GD 测评外 ,还进行了多项心理测
验 (包括个性测验、能力测验) ,开展了 L GD、情景模
拟游戏、结构化面谈、文件筐测验、背景调查等综合
测评服务 ,由这些测评提供的相关数据 ,我们可以从
两个方面来检验 L GD 的效度。
第一 ,在各项测评的所有数据出来后 ,我们根据
测评技术及其理论解释 ,并根据专家小组的讨论意
775第 5 期 彭平根等 :L GD 在选拔企业中高级管理人才方面的实证研究
见 ,给每一位被评价者作出了一个综合的等级评定。
这种等级评定共分五等 ,等级 3 以上的 ,我们推荐公
司录用安置 ,等级 2 以下的则建议不予录用。这种
综合等级评定的数据又可以从两个角度作为考察
L GD 效度的效标。其一 ,我们把每一位被评价者的
L GD 总得分 (根据要素权重加权处理后的总分) 转
化为百分位等级分数 ,然后再划分为五等 ,这样每一
位被评价者的 L GD 得分就各有了一个等级序列。
再以被评价者的最后所得的综合评定等级作为效
标 ,考察它们之间的相关。经统计分析表明 ,这两者
的相关系数 (斯皮尔曼相关)值为 0. 410 ( p < . 001) 。
这说明 L GD 有较高的效标关联效度 (同时效度) 。
其二 ,我们也可以通过检验 L GD 测评结果与最后综
合评定结果之间的符合程度来作为效度的依据。研
究分析表明 ,在随机抽取的 73 名被试中 ,经过 L GD
测评获得等级评定为 3 级以上者最后在综合评定中
仍然获得 3 级以上评定 (即推荐录用) 的被试有 36
名 ,即符合程度为 49. 3 % ;在 L GD 测评中被评定为
2 级以下最后在综合评定中等级同样在 2 级以下
(即建议不予录用)的被试有 12 名 ,符合程度为 16.
4 %。因为这两种评定结果 (推荐录用与建议不予录
用)都可以作为检验 L GD 测评是否有效的一个证
据 ,因此 ,可以把这两个比例相加所得的结果 (为
65. 7 %) 作为 L GD 测评技术效度的一个检验指标。
上述研究分析表明 ,L GD 测评技术是比较有效的。
根据上述研究分析的思路 ,我们进一步考察了
L GD 在测评被评价者的能力要素方面的效度指标。
结果发现 ,如果仅依据能力要素的评分作出等级评
估 ,它与被评价者最后所获得的综合评定的等级相
关系数为 0. 447 ( p < . 001) ,而符合程度 (用百分比
衡量)为 71. 2 %(推荐录用符合比例 57. 5 % ,建议不
予录用的符合比例为 13. 7 %) 。这两组数据都要略
高于以 L GD 全部测评要素作为评定标准时的结果。
这说明 L GD 在评价能力要素方面更有效。这一结
果也与前面在信度分析时得出的“L GD 在能力要素
评价上评分者信度更高”的结果一致。
第二 ,对于 L GD 测评技术 ,本研究还考察了被
评价者在同期接受的系列心理测验以及情景模拟游
戏中与 L GD 有共同测评要素的相关情况。虽然每
种测评技术或方法都有不同的测评维度 ,但在共有
的测评维度上其要素的内涵是基本一致的 ,因此作
这样的考察是切实可行的。在本研究中 ,重点考察
了 L GD 测评中涉及到的沟通能力、决策能力、组织
协调能力等能力要素与情境模拟游戏中共同的能力
要素之间的相关 ,以及自信心、宽容性、情绪稳定性
和内外倾向性等个性要素与 HR 个性测验中共同的
个性要素之间的相关。相关的研究数据结果见表
3。
表 3 几种不同的测评方法在共同
的测评要素上的相关情况表
共同的测评要素
(以 L GD 为准)
与情境模拟
游戏的相关
与 HR 个性
测验的相关
沟通能力 0. 377 3 3 ———
决策能力 0. 316 3 3 ———
组织协调能力 0. 390 3 3 ———
自信心 ——— 0. 173 3
情绪的稳定性 ——— 0. 084
宽容性 ——— 0. 060
性格的内外倾向性 ——— 0. 076
注 : 3 p < . 05 , 3 3 p < . 01
分析表 3 的数据可以发现 ,在能力方面的测评
要素上 ,通过 L GD 技术测得的沟通能力、决策能力
以及组织协调能力等能力要素与在情境模拟游戏中
测得的这些共同要素之间的相关系数分别为 0.
377、0. 316 和 0. 390 ,三个系数的值虽不高 ,但都在.
01 水平上显著相关。而在个性维度上 ,考察的四个
要素自信心、情绪的稳定性、宽容性和内外倾向性与
在 HR 个性测验中所测得的这些共同要素相关很
低 ,其值分别为 0. 173、0. 084、0. 060 和 0. 076 ,且除
了自信心这一测评要素在. 05 水平上达到显著相关
外 ,其它几个要素的相关都不显著。上述结果表明
L GD 在评价能力方面的要素时比较有效 ,但在个性
维度的评价方面不如心理测验 (个性测验)有效。
3 结论及其建议
根据以上对研究结果的分析与讨论 ,我们可以
得出以下结论 :
(1)在 L GD 测评技术中 ,评价者经过系统培训
后 ,其评分者信度较高 ,但在不同要素的评价方面存
在一定的差异 ,总体上对能力方面的素质特征评价
一致性要略高于个性特征方面的评价一致性。
(2)在效度方面 ,通过多种途径的数据检验都表
明 L GD 是一种比较有效的人才测评技术 ,进一步的
研究分析还发现 ,在评价能力要素等测评维度方面
其有效性要高于对个性维度的评价。
这表明 ,无领导小组讨论在评价个人的能力素
质特征方面有其优势 ,但在评价个性品质等方面的
素质特征时应该慎重选择。如果要运用 L GD 对个
性特征进行评价 ,则应对要素含义作出更加精确的
875 心 理 科 学 第 25 卷
解释、评价标准要更加客观易操作 ,在培训评委时这
方面的培训内容也应适当加强。
因为研究者在测评技术设计、测评要素的确立、
评分标准的制定及评分解释等多个环节上都参与了
L GD 的整个测评过程 ,借鉴这次测评的实践操作经
验及其感受 ,我们认为在 L GD 测评技术的实施过程
中 ,有以下几个方面的问题要引起注意和重视 :
第一 ,测评要素的确立方面应以科学的工作分
析作出基础 ,严格遵循人才测评技术中有关要素设
计的基本原则 ,如针对性原则 (针对某一岗位或职位
类别设计合理的测评要素体系) 、选择性原则 (不可
能也没必要对所有要求的素质特征都做出测评 ,而
只是选择其中对工作影响较大的、有一定代表性的
素质特征进行测评。在保证测评质量的前提下 ,应
尽量减少测评要素体系中要素的数目) 、内涵明确的
原则 (每一测评要素都必须有明确的定义 ,使用内涵
明确的词语来表示) 、不重复原则 (所设计出来的测
评要素在外延上应该相互不包容 ,同一测评内容不
能出现在两个要素中) 、操作性原则 (设计出来的所
有要素都应该是能够进行客观测量和评价的) 。
第二 ,要为 L GD 选择合适的讨论题目及其相关
的背景材料。题目及其背景材料的选择对于 L GD
技术至关重要 ,因为它会直接影响小组讨论过程中
组员的参与程度。题目过于专业化 ,势必把那些不
熟悉该专业领域的被试置于一个不利地位。另外 ,
对大多数人来说 ,题目本身应该是富于讨论空间的 ,
也就是说 ,应该保证让大多数被试都能有比较广阔
的发表自己观点的空间。
第三 ,在评价者的素质方面无论提多高的要求
都不过分。因为 L GD 技术的评分虽有客观的可操
作的标准 ,但它终究是一种主观评价。这就要求担
当评委的评价者必须经过科学的选择和严格系统的
培训 ,同时还要求他们具有较强的责任感 ,最好有相
当的心理学基础。
第四 ,在参与 L GD 测评的被评价者小组成员的
组成方面 ,如果可以调整的话 ,尽量在性别、年龄的
组成方面适当均衡 ,不要某组全部是女性或男性 ,也
不要全部是年长和年轻的 ,适当的比例搭配可以协
调讨论的气氛 ,使评委更容易作出比较评价。在人
数的多少方面 ,有许多学者认为是 5 —7 人为宜 ,我
们认为应该是 6 —8 人为佳。不是要多一个人 ,而是
强调人数的组成应该是双数而不是单数 ,因为在测
评过程中我们碰到好几次类似的情况 ,那就是在组
员在意见争执不下的情况下 ,有被试提出投票表决 ,
双数组成的小组很容易形成平衡的局面 (如 4 :4) ,
这样就迫使他们继续就问题展开讨论 ,而不是在刚
开始讨论不久就以这样的方式来迅速得出某一结
论。因为在 L GD 评定过程中 ,评委希望看到的是一
个持久热烈的讨论场面 ,这样才有利于评分。
4 参考文献
1 朱庆芳 1 国家公务员录用考试心理素质测评 1 北京 ,中
国人事出版社 ,2000
2 苏永华 1 情景模拟测评 (L GD)研究 1 华东师范大学 2000
年博士论文
3 吴志明 1 评价中心的构想效度和结构模型 1 心理学报12001 ;33 (4)
(接第 557 页)
4 皮亚杰著 1 傅统先 ,陆有铨译 1 儿童的道德判断 1 山东
教育出版社 ,1984
5 格莱因著 ,计文莹等译 1 儿童心理发展的理论 1 湖南教
育出版社 ,1983 :158 - 168
6 李伯黍 1 品德心理研究 1 华东化工学院出版社 ,1992
7 Warrington , E. K. , Weiskrantz , L . . The Effect of Prior
Learning on Subsequent Retention on Amnesic Patients.
Neuropsychologia ,1974 ;12 :4192428
8 杨治良等 1 内隐社会认知的初步实验研究 1 心理学报 ,
1997 ;1 :17 - 21
9 杨治良 1 社会认知具有更强的内隐性 1 心理学报 ,1998 10 Jacoby , L . L . . A Process Dissociation Framework :Separating Automatic from Intentional Uses of Memory .Journal of Memory and Language ,1991 ;30 :513254111 倪伟 1 我国品德心理研究 20 年的回顾与反思 1 心理学动态 ,2001 :1 ,52 - 5612 卢格著 ,陈德民等译 1 人生发展心理学 1 学林出版社 ,1996 :608 - 63613 Shium Andrew Chen1 杨治良等 1“攻击性行为”社会认知的实验研究 1 心理学报 ,1996 ;2 :75 - 7914 叶茂林 1 材料性质与内隐攻击性启动效应的实验研究1 心理科学 ,2001 ;4 :418 - 421
975第 5 期 彭平根等 :L GD 在选拔企业中高级管理人才方面的实证研究
low processing loads , students withlearning disabilities scored
significantly lower than those of the excellent group. Under two
processing load conditions , three indexes played a different role
in accessing retrieval capabilities of visuospatial working memo2
ry : under the low processing load condition , the working memo2
ry span and error rates in retrieval were better indexes than re2
trieval speed ; under the high processing load condition , working
memory span and retrieval speed were better indexes than error
rates in retrieval.
Key Words : learning disabilities , working memory , span
of visuospatial working memory , error rates in retrieval , re2
trieval speed.
A COMPARATIVE STUDY OF THE SCIENTIFIC CONCEPT
FORMATION PROCESS OF ADULTS AND MIDDLE
SCHOOL STUDENTS
M u Xiaoyong
(Suzhou University)
The purpose of this study was to compare the scientific for2
mation process of adults and middle school students. The scien2
tific concepts included reaction force , conservation of mechanical
energy , entropy and field. The results showed thatthe scientific
concept formation process was divided into three steps. Firstly ,
it progressed gradually or oscillated. Secondly , it came to a
plateau and thirdly , arrived at a mutative process or a sudden
change. It was found that the gradual progress of adults was
longer than that of middle school students , and the plateau of
adults came later and lasted longer than that of middle school
students. The results showed that the more abstract the scientif2
ic concept was , the bigger the mutative span of middle school
students would be.
Key Words : scientific concept , gradual progress or oscilla2
tion , plateau , mutative process.
REPORTS OF THE DIAGNIOSTIC TEST OF ACHIEVE2
MENT FACTORS ON TRIAL IN SOUTHJIANGSU
He Dongliang
(Changshu College)
Dong X uanru
( Psychology Department , East China Normal University)
This study , based on the Diagnostic Test of Achievement
Factors introduced from Japan , made sample tests on primary
and secondary school students in south Jiangsu to test the usabil2
ity of this testing method in the Mainland. The studyshowed
that DTAF were both reliable and effective. The result coming
from the analysis of each component diagram concerned indicat2
ed that most of the problems in the questionnaire designed by
DTAF were compact , well organized , and highlydiscriminating.
This paper probed into achievement motivation ,planning , tech2
nique and surroundings , all of which were important factors that
influenced the students’learning.
Key Words : Diagnostic Test of Achievement Factor ,
achievement motivation , planning , surroundings.
A STUDY OF THE LEADERLESS GROUP DISCUSSION AP2
PLIED TO CHOOSING SENIORMANAGERS IN ENTER2
PRISES
Peng Pinggen , Ding Biao
(Department of Psychology , East China Normal University)
S u Yonghua
(China Star Shanghai Branch Assessment Center)
With data obtained in the human resources assessment for
enterprises , this article studied the reliability and validity of the
Leaderless Group Discussion (L GD) . The results showed that
L GD was a reliable and valid assessing technique. If the evalua2
tors were well trained , the reliability of L GD would be satisfy2
ing , but there was difference among the assessing factors. At
the same time , this research drew the conclusion that L GD
could better assess ability than personality.
Key Words : leaderless group discussion , assessment tech2
nology , valuator reliability , validity.
A STUDY OF COMPUTER DYNAMIC GRAPHICS’FUNC2
TION IN TEXT LEARNING
Zeng Meiying
(Normal College of Vocational and Technical Training of Beijing
UnionUniversity)
The study examined computer dynamic graphic’s function
in texts learning. The result indicated that its function was re2
lated to the characteristic of the text , and also related to the way
in which learning was measured. Computer dynamicgraphics
greatly facilitated the maintenance of the abstract text by im2
proving its comprehension. But they disturbed the first record2
ing of the text and had no use for the concrete text .
Key Words : computer , dynamic graphic , learning of
texts.
ON THE PREDICAMENTS AND PROSPECTS OF DEVEL2
OPMENTS OF PSYCHOLOGY
Chang Chun - Hsing
( Taiwan Normal University)
During the recent years , western psychologists have made
strong criticism of the approaches of psychology development . In
summary , the predicaments of psychology development in the
past were caused by : l) a discrepancy among theories ,philosophi2
cal psychology or scientific psychology , that tried to explain hu2
man nature but in effect checked the growth of the right condi2
tions for science ; 2) the advocacy of natural science and the lack
of self - dependent consciousness ; and 3) an emphasis on scien2
tific methods , and the neglect of human nature , which led to
the difficult situation of a procrustean bed. With regard to the
development of psychology at home , an out - and - out western2
ization is definitely wrong but it is necessary to tap the cream of
western psychology on the foundation of indigenous culture , to
bring about basic and applied psychologies of our own. The au2
thor worked out a four - competence instruction project with an
eye to arouse the interest in the research and development of ap2
plied psychology with an indigenous orientation.
Key Words : normal science , demand characteristics ,scien2
tific methodological basis , human nature basis , indigenous cul2
ture approach , four - competences instruction.
046 心 理 科 学 第 25 卷