AI 中的政治偏见:主要 LLM 倾向分析
AI 中的政治偏见:主要 LLM 倾向分析
A June 2026 study by Trakkr 揭示了六个主要 AI 模型中有四个在政治和经济轴线上表现出中左倾向。这项研究强调了 AI 回答中的系统性倾向,其中 Grok 被确定为最右翼,而 Gemini 在多次运行中表现最为稳定。
AI 模型政治倾向
大多数主要 AI 模型都表现出政治倾向,尽管程度和一致性有所不同。Trakkr 的分析使用了涵盖政治、经济、言论和社会的题库,发现大多数模型倾向于中左翼。
模型排名与定位
- Grok: 被确定为政治光谱中最右翼的模型。
- Gemini: 被指出是“最稳健”的模型,在多次运行中表现出最高的回答一致性。
- DeepSeek 和 Gemini: 这两个模型都被发现位于政治光谱的中心附近。
自我报告与测量偏见之间的差异
AI 模型对自己政治倾向的描述与其在面对敏感问题时的实际回答之间存在可衡量的差距。当被直接询问其偏见时,几个模型声称自己是中立的,但测量结果显示其倾向于左翼。
测量值 vs. 声称的倾向(经济轴线)
| Model | Gap (Measured vs. Claimed) | Observation |
|---|---|---|
| Grok | +0.36 | 测量值比其声称的更偏右 0.36 |
| Claude | +0.34 | 测量值比其声称的更偏左 0.34 |
| ChatGPT | -0.29 | 声称中立,但测量结果偏左 |
| Llama | -0.17 | 声称中立,但测量结果偏左 |
| DeepSeek | +0.01 | 声称中立且位于中心附近 |
| Gemini | 0.00 | 声称中立且位于中心附近 |
方法论与数据完整性
为了确保结果反映的是模型的内部权重而非实时网络数据,Trakkr 在禁用网络搜索的情况下进行了测试。这种方法将模型固有的倾向与外部检索增强生成 (RAG) 的影响隔离开来。
关键测试参数
- 数据收集: 4,400 个回答于 2026 年 6 月从六个模型中收集。
- 映射: 模型被绘制在双轴地图上:一个经济轴(左到右)和一个社会轴(自由意志主义到威权主义)。
- 分析: 使用中立分类器从原始回答中读取有符号立场、模棱两可的措辞和拒绝类型。
- 一致性: 模型以“云团”而非单个点表示,以展示多次运行中回答的完整分布,从而允许测量运行之间的稳定性。
- 参考点: 模型位置是相对于基于 CHES 2024 和 V-Dem 专家调查的现实世界人物的相对位置。