AIにおける政治的バイアス：主要LLMの傾向分析

Trakkrによる2026年6月の研究により、6つの主要なAIモデルのうち4つが政治的・経済的軸において中道左派に寄っていることが明らかになりました。この研究は、AIの回答における系統的な偏りを浮き彫りにしており、Grokが最も右派寄り、Geminiが複数回の実行において最も安定していることが特定されました。

AIモデルの政治的傾向

ほとんどの主要なAIモデルは政治的な傾向を示していますが、その程度や一貫性は様々です。政治、経済、言論、社会を網羅する質問バンクを使用したTrakkrの分析では、大多数のモデルが中道左派に寄っていることが判明しました。

モデルのランキングと位置付け

Grok: 政治的スペクトラムにおいて最も右派寄りのモデルとして特定されました。
Gemini: 「最も安定した」モデルとして注目され、複数回の実行にわたって回答に最も高い一貫性を示しました。
DeepSeek と Gemini: 両モデルとも、政治的スペクトラムの中央付近に位置していることが判明しました。

自己申告と測定されたバイアスの乖離

AIモデルが自身の政治的傾向をどのように説明するかと、論争のある質問に対して実際にどのように回答するかとの間には、測定可能な乖離が存在します。バイアスについて直接尋ねられた際、いくつかのモデルは中立を主張しましたが、測定結果では左派寄りであることが示されました。

測定値 vs. 主張された傾向（経済的軸）

モデル	乖離（測定値 vs. 主張）	観察事項
Grok	+0.36	主張よりも0.36右派寄りとして測定される
Claude	+0.34	主張よりも0.34左派寄りとして測定される
ChatGPT	-0.29	中立を主張するが、左派寄りとして測定される
Llama	-0.17	中立を主張するが、左派寄りとして測定される
DeepSeek	+0.01	中立を主張し、中央付近に位置する
Gemini	0.00	中立を主張し、中央付近に位置する

方法論とデータの整合性

結果がリアルタイムのウェブデータではなく、モデルの内部的な重みに反映されるよう、Trakkrはウェブ検索を無効にした状態でテストを実施しました。このアプローチにより、モデル固有の傾向を外部の検索拡張生成（RAG）の影響から分離することができます。

主要なテストパラメータ

データ収集: 2026年6月に6つのモデルから4,400件の回答を収集しました。
マッピング: モデルは2軸のマップ上にプロットされます：経済的軸（左から右）と社会的軸（リバタリアンから権威主義）です。
分析: 生の回答から、署名されたスタンス、ヘッジング（回避的表現）、および拒否のタイプを読み取るために、中立的な分類器が使用されました。
一貫性: モデルは単一の点ではなく「クラウド（雲）」として表現され、複数回の実行にわたる回答の広がりを示すことで、実行ごとの安定性を測定できるようにしています。
参照点: モデルの位置は、CHES 2024およびV-Demの専門家調査に基づく実世界の人物との相対的な関係で示されます。

AIにおける政治的バイアス：主要LLMの傾向分析

AIにおける政治的バイアス：主要LLMの傾向分析

AIモデルの政治的傾向

モデルのランキングと位置付け

自己申告と測定されたバイアスの乖離

測定値 vs. 主張された傾向（経済的軸）

方法論とデータの整合性

主要なテストパラメータ

Sources