如何面试?
结构化面试不是可选项,是必选项
从「我觉得」到「证据显示」的唯一可靠路径
Schmidt & Hunter (1998) · Campion et al. (2020)
一个真实场景
2 / 14
两位面试官 · 一个候选人 · 一场无效争论
HR:「这个人感觉不错,很有灵气」
用人经理:「不太踏实,感觉飘」
→ 争论半小时,靠「职级高的人」拍板
三个月后,入职者表现平平——
两人的感觉都是对的,也都是错的——
因为两人评估的,根本不是同一件事。
数据说话:两种面试的本质差距
3 / 14
非结构化面试
(凭感觉 · 漫谈式)
14%
预测效度
≈ 仅 14% 有效判断
≈ 86% 是噪音
VS
结构化面试
(定维度 · 问行为 · 校评分)
63%
预测效度
= 非结构化的 倍
= 真正的有效判断
数据来源:Schmidt & Hunter (1998),Psychological Bulletin,124(2),262–274
各类选拔方法对工作绩效的预测效度对比
4 / 14
结构化面试(含STAR追问) � 最高效
工作样本测试
工作知识测试
一般认知能力测试
结构化面试(纸笔)
参考资料查阅
非结构化面试 ⚠️ 噪音为主
第一印象 / 直觉判断 ⚠️ 接近随机
高效基准线
* Schmidt & Hunter (1998) 元分析研究
感觉从哪里来:五大面试认知偏见
5 / 14
锚定效应
第一印象决定了整个
面试走向,后续信息
被第一印象所左右
证实偏见
只听符合自己初始判
断的信息,自动忽略
反驳证据
类我效应
更青睐与自己相似的
人(背景、说话风格、
经历)
顺序效应
候选人的出场顺序影
响判断;最后几位受
疲劳影响被低估
光环效应
某个优点(名校/名企
背景)让所有其他维
度评分偏高
每一轮都在用相同的偏见机制做判断 → 轮数越多,偏见叠加越多,而不是被稀释
结构化面试三步框架:定维度 · 问行为 · 校评分
6 / 14
① 定维度
确定评估标准
▸ 基于岗位分析提炼核心能力项
▸ 所有候选人按同一维度评估
▸ 维度数量控制在 5-6 个
▸ 每维度配行为锚定量表(BARS)
② 问行为
STAR追问法
▸ 追问具体行为事件
▸ Situation / Task / Action / Result
▸ 区分「说」和「做」
▸ 避免假设性问题和引导性提问
③ 校评分
多考官独立评分
▸ 独立打分,不当场讨论
▸ 用评分卡统一标准
▸ 分歧点用证据辩论
▸ 防止高职位者主导结论
核心:让每位面试官评估同一件事,结论才能被整合,决策才有依据
Step 1「定维度」:如何确定评估标准?
7 / 14
四步确定能力维度
① 岗位分析
通过工作分析确定该岗位的核心职责与关键产出
② 提炼能力项
从职责中归纳 5-6 项岗位所需的核心能力
③ 定义行为锚定
为每个能力项设定低/中/高三种典型行为描述
④ 统一提问
所有候选人用相同题目,评估相同维度
维度数量建议
维度过多 → 面试时间不够,每个维度评估不深
维度过少 → 评估覆盖面不足,以偏概全
✓ 最佳实践:5-6 个核心能力维度
常见核心能力维度(示例)
• 逻辑思维与问题解决
• 沟通表达能力
• 团队协作与影响
• 学习能力与成长性
• 抗压与韧性
• 岗位专业技能
行为锚定量表(BARS):让评分标准「可视化」
8 / 14
以「沟通表达能力」为例 — 同一维度下不同等级的行为描述对比
低分(1-2分)
• 表达模糊,缺乏重点
• 无法清晰陈述自己的观点
• 面对质疑时回避或无法回应
中分(3-4分)
• 表达基本清晰,能陈述自己的观点
• 有一定逻辑性
• 在深度或说服力上仍有提升空间
高分(5分)
• 表达清晰有力,逻辑严密
• 能根据受众调整沟通方式
• 有效回应质疑,说服力强
关键原则:行为锚定必须基于「可观察的行为」,而非性格特质或主观印象
ὑ� 「沟通能力好」→ ὑ� 「能向非技术人员清晰解释技术方案,并获得对方认同」
⚠ 锚定描述要具体到「说了什么/做了什么」,而非「具有什么特点」
Step 2「问行为」:STAR追问法深度拆解
9 / 14
S
Situation
情境
当时的具体情境是什么?
背景、条件、外部环境如
何?
追问示范:
「请描述你接手那个项目时的具体情况」
T
Task
任务
你当时的职责和目标是什么
?要解决什么问题或达成什
么指标?
追问示范:
「你在那个项目中具体负责什么?」
A
Action
行动
你本人具体采取了哪些行动?
注意:不是「我们」,是「我
」
追问示范:
「你具体做了什么?遇到最大困难是什么?」
R
Result
结果
最终结果如何?用数据说话。
你学到了什么?
追问示范:
「最终结果如何?有没有量化数据?」
STAR追问示范:有效提问 vs 无效提问
10 / 14
� 引导性 / 假设性问题
「你觉得在高压环境下应该怎么沟通?」
⚠ 候选人会给「标准答案」而非真实行为,无法验证
� 抽象 / 理论性问题
「你的沟通能力怎么样?」
⚠ 只能得到自我评价,没有行为证据支撑
� STAR行为式提问
「过去三个月,你有没有和跨部门同事出现过分歧?请举例说明当时的情况,你具体是怎么处理的,结果如何?」
⚠ 引发具体行为事件,可追问细节,可验证真伪
追问三原则:① 多问「我」少问「我们」 ② 多问结果少问感受 ③ 多追问细节避免泛泛而谈
Step 3「校评分」:如何避免考官主观偏差?
11 / 14
评分流程四步走
① 独立打分
每位考官单独评分,不当场讨论结果,避免互相影响
② 使用评分卡
按预设的行为锚定标准打分,而非凭印象打分
③ 有据可查
每项评分须备注候选人说了什么/做了什么,作为证据
④ 汇总求同
分歧项对照行为证据讨论,不靠职位高低拍板
评分时常见偏差
⚠ 严格程度不一:有的考官给分普遍偏高,有的偏低
⚠ 对比效应:前一位候选人影响后一位的评分
⚠ 近期偏好:面试尾声的记忆更深刻,影响整体判断
应对方法
→ 每位考官用同一张评分卡,锚定统一
→ 候选人顺序随机,不按同一批次排列
→ 评分后在讨论前先写出结论再交流
→ 定期组织考官校准会议,对齐标准
结构化面试实操注意事项
12 / 14
� 应当做的
• 提前熟悉评分维度和STAR题库
• 每个维度至少追问 1-2 个行为事件
• 用「还有呢」「能举个例子吗」追问细节
• 记录候选人的关键原话,作为评分依据
• 对同一职位的所有候选人使用相同题目
• 面试后立即评分,避免记忆衰减
� 应当避免的
• 被候选人的名校/名企背景影响评分
• 只问一道题就下结论
• 对「不符合预期」的答案选择性忽略
• 面试前浏览简历时形成第一印象
• 当场讨论候选人,打分受他人影响
• 用「我觉得」「这个人感觉」下结论
核心原则:结构化面试的核心是「行为证据」,不是「印象分」——把结论建立在候选人说了什么、做了什么上
关键启示:从「我觉得」到「证据显示」
13 / 14
ὑ� 非结构化面试 ≈ 86% 噪音 凭感觉漫谈,有效判断不足两成
⚠️ 感觉 ≠ 洞察力 面试官的「感觉」是偏见,不是判断力
ὑ� 结构化面试 = 行为证据 把招聘决策建立在候选人说了什么、做了什么
ὑ� 统一维度 → 结论可整合 不同面试官的结论可以汇总比较
⚡ 高质量 2-3 轮 > 低质量 5 轮 结构化面试轮数少但判断准
「感觉」不是洞察力,是偏见的别名。结构化面试是把招聘决策从「我觉得」变成「证据显示」的唯一可靠路径。
总结
▸ 非结构化面试 ≈ 86% 噪音
预测效度仅 ,接近随机,与有效选拔无缘
▸ 结构化面试预测效度
是非结构化面试的 倍,把决策权交给证据
▸ 三步框架:定维度-问行为-校评分
统一的维度 + STAR追问 + 独立评分 = 可整合结论
▸ 五大认知偏见系统叠加
锚定·证实·类我·顺序·光环,轮数越多偏见越深Schmidt & Hunter (1998) · Campion et al. (2020) · 安迪曼咨询
14 / 14