AI 中的政治偏見:主要 LLM 傾向分析
AI 中的政治偏見:主要 LLM 傾向分析
A June 2026 study by Trakkr 揭示了六個主要 AI 模型中有四個在政治和經濟軸線上偏向中左立場。這項研究強調了 AI 回應中的系統性偏向,其中 Grok 被識別為最偏右,而 Gemini 在多次運行中表現最為穩定。
AI 模型政治傾向
大多數主要 AI 模型都表現出政治傾向,儘管程度和一致性有所不同。Trakkr 的分析使用了涵蓋政治、經濟、言論和社會的題庫,發現大多數模型偏向中左立場。
模型排名與定位
- Grok: 被識別為政治光譜中最偏右的模型。
- Gemini: 被指出是「最穩定」的模型,在多次運行中其回應展現出最高的一致性。
- DeepSeek 和 Gemini: 這兩個模型都被發現位於政治光譜的中間位置。
自我報告與實測偏見之間的差異
AI 模型對其自身政治傾向的描述與其在面對敏感問題時的實際回應之間存在可衡量的差距。當被直接詢問其偏見時,幾個模型聲稱自己是中立的,但實測結果顯示其偏向左翼。
實測與聲稱的傾向(經濟軸線)
| Model | Gap (Measured vs. Claimed) | Observation |
|---|---|---|
| Grok | +0.36 | 實測比聲稱的更偏右 0.36 |
| Claude | +0.34 | 實測比聲稱的更偏左 0.34 |
| ChatGPT | -0.29 | 聲稱中立,但實測偏左 |
| Llama | -0.17 | 聲稱中立,但實測偏左 |
| DeepSeek | +0.01 | 聲稱中立且位於中心附近 |
| Gemini | 0.00 | 聲稱中立且位於中心附近 |
方法論與數據完整性
為了確保結果反映的是模型的內部權重而非即時網路數據,Trakkr 在禁用網路搜尋功能的情況下進行了測試。這種方法將模型固有的傾向與外部檢索增強生成 (RAG) 的影響隔離開來。
關鍵測試參數
- 數據收集: 於 2026 年 6 月從六個模型中收集了 4,400 個回答。
- 映射: 模型被繪製在雙軸地圖上:一個經濟軸(左至右)和一個社會軸(自由意志主義至威權主義)。
- 分析: 使用中立分類器來從原始回答中讀取帶有正負號的立場、規避性言論和拒絕類型。
- 一致性: 模型以「雲狀圖」而非單點表示,以展示多次運行中回應的完整分佈,從而能夠衡量運行間的穩定性。
- 參考點: 模型位置是相對於基於 CHES 2024 和 V-Dem 專家調查的現實世界人物。