技术招聘中标准化考试的回归
技术招聘中标准化考试的回归
技术招聘中 SAT 分数的复兴
一些技术初创公司正重新开始在职位申请中要求提供 SAT 分数,将其作为验证原始、非 AI 辅助认知能力的手段。随着生成式 AI 使传统的筛选工具(如简历、求职信和家庭作业)更容易实现自动化,这一趋势应运而生,因为它可能会掩盖候选人的实际“原始动力”。
虽然标准化考试通常被视为过时,但支持者认为它们提供了一个客观的基准,用于衡量基础流利度,这比经过润色的、由 AI 生成的作品集更难伪造。
然而,使用几十年前的分数会引入显著的噪声,因为这些考试反映的是候选人作为青少年的状态,而非其当前的专业能力。
基于证据的绩效预测指标
并非所有的招聘评估都是平等的。研究表明,一种结合了特定方法的组合可以为知识型工作的专业成功提供最高的预测效度。
高效能方法
- 结构化面试: 这些目前被认为是绩效最强的预测指标之一。为了发挥作用,它们需要一致的问题、标准化的评分标准以及经过培训的面试官,以最大限度地减少偏见。
- 工作样本和职位知识测试: 让候选人执行具有代表性的实际工作片段(例如,试用期或特定的技术任务)可以提供对能力的直接观察。
- 认知能力测试: 这些仍然是强大的预测指标,特别是对于学习曲线陡峭或有重度培训要求的职位,尽管它们的预测能力通常低于结构化面试。
- 评估中心: 通过利用模拟和多名评估者,这些方法对于预测管理能力非常有效,但对于普通招聘来说通常过于昂贵且耗时。
低效能方法
- 非结构化面试: 由于容易受到光环效应、印象管理和“与我相似”偏见的影响,随意的“聊天”是效率最低的预测指标之一。
- 脑筋急转弯: 曾由 Google 和 Microsoft 等公司推广,现在被广泛认为是在浪费时间,且无法预测工作绩效。
- 人格测试: 像 Myers-Briggs 这样的工具通常被认为在预测专业成功方面是无效的。
使用 SAT 分数作为指标的挑战
将 SAT 分数作为招聘筛选器会带来若干技术和伦理挑战,这可能会削弱其作为数据点的效用:
- 分数不一致性: SAT 评分量表已经多次更改(在 1600 和 2400 的最大值之间切换),这使得很难比较来自不同时期的候选人。
- 环境噪声: 分数受到考试时环境条件的严重影响,包括辅导课程的可及性、家庭稳定性以及候选人在 17 岁时的心理状态。
- 范围有限: 标准化考试可能代表了通用智能或好奇心,但无法衡量基本的专业特质,如可靠性、协作能力和沟通技巧。
适应 AI 时代的招聘
为了对抗由 AI 生成的申请材料所产生的“完美、虚假的明星”效应,招聘经理被鼓励转向可验证、受监考的且最新的评估方式。
推荐的抗 AI 替代方案
- 实时、限时练习: 在现场或通过受监考的远程会议进行技术测试,可以防止候选人使用 LLMs 来实时生成答案。
- 防御性工作评审: 如果使用了家庭作业项目,随后的面试应该侧重于对工作的“审讯”,要求候选人辩护其逻辑并解释其过程,以确保工作是其本人完成的。
- 现场白板演示: 回到物理白板演示可以允许面试官实时观察候选人的思维过程。
- 实时角色扮演: 对于 GTM (Go-To-Market) 或销售职位,实时模拟是衡量人际交往和沟通技巧最有效的方式。
社区对标准化考试的看法
行业专业人士之间的讨论揭示了对这些测试效用的分歧:
"SAT 分数与 IQ 的相关性为 .81,而 IQ 是为数不多能与知识型工作绩效产生强正相关的因素之一。了解候选人的 SAT 分数可能会带来很多 alpha。"
相反,其他人认为此类要求可以作为一种文化过滤器或对高素质候选人的威慑:
"我有一个朋友,他拥有硕士学位,在第一天上班时发现了一份要求提供 SAT 分数的工作……当他发现招聘一个拥有研究生学位的人时竟然如此看重 SAT 分数时,他不想为这样一家公司工作了。"