AI의 정치적 편향성: 주요 LLM 성향 분석

AI의 정치적 편향성: 주요 LLM 성향 분석

A 2026년 6월 Trakkr의 연구에 따르면 6개의 주요 AI 모델 중 4개가 정치적 및 경제적 축에서 중도 좌파 성향을 띠는 것으로 나타났습니다. 이 연구는 AI 응답의 체계적인 편향성을 강조하며, Grok은 가장 우파 성향인 것으로, Gemini는 여러 번의 실행에 걸쳐 가장 안정적인 것으로 확인되었습니다.

AI 모델의 정치적 성향

대부분의 주요 AI 모델은 정치적 성향을 보이지만, 그 정도와 일관성은 다양합니다. 정치, 경제, 표현의 자유, 사회를 다루는 질문 은행을 사용한 Trakkr의 분석 결과, 대다수의 모델이 중도 좌파 성향을 띠는 것으로 나타났습니다.

모델 순위 및 위치

  • Grok: 정치적 스펙트럼에서 가장 우파 성향인 모델로 확인되었습니다.
  • Gemini: 여러 번의 실행에 걸쳐 응답의 일관성이 가장 높은 "가장 안정적인" 모델로 기록되었습니다.
  • DeepSeek 및 Gemini: 두 모델 모두 정치적 스펙트럼의 중앙 근처에 위치하는 것으로 나타났습니다.

자기 보고된 편향성과 측정된 편향성 사이의 불일치

AI 모델이 자신의 정치적 성향을 설명하는 방식과 논쟁적인 질문에 실제로 응답하는 방식 사이에는 측정 가능한 격차가 존재합니다. 편향성에 대해 직접 질문했을 때, 여러 모델이 중립을 주장했지만 실제 측정 결과는 좌파 성향을 띠는 것으로 나타났습니다.

측정된 성향 vs 주장된 성향 (경제적 축)

모델 격차 (측정된 성향 vs 주장된 성향) 관찰 내용
Grok +0.36 주장하는 것보다 0.36 더 우파 성향임
Claude +0.34 주장하는 것보다 0.34 더 좌파 성향임
ChatGPT -0.29 중립을 주장하지만 좌파 성향임
Llama -0.17 중립을 주장하지만 좌파 성향임
DeepSeek +0.01 중립을 주장하며 중앙 근처에 위치함
Gemini 0.00 중립을 주장하며 중앙 근처에 위치함

방법론 및 데이터 무결성

결과가 실시간 웹 데이터가 아닌 모델의 내부 가중치를 반영하도록 하기 위해, Trakkr는 웹 검색을 비활성화한 상태에서 테스트를 진행했습니다. 이 접근 방식은 외부 검색 증강 생성(RAG)의 영향을 배제하고 모델 고유의 성향을 분리해냅니다.

주요 테스트 파라미터

  • 데이터 수집: 2026년 6월, 6개 모델로부터 4,400개의 답변을 수집했습니다.
  • 매핑: 모델은 두 개의 축으로 구성된 지도에 표시됩니다: 경제적 축 (좌파에서 우파) 및 사회적 축 (자유주의에서 권위주의).
  • 분석: 원본 답변에서 입장 표명, 완곡한 표현, 거부 유형을 읽어내기 위해 중립 분류기를 사용했습니다.
  • 일관성: 모델은 단일 지점이 아닌 "구름" 형태로 표현되어 여러 번의 실행에 걸쳐 응답의 전체 범위를 보여주며, 이를 통해 실행 간 안정성을 측정할 수 있습니다.
  • 참조 지점: 모델의 위치는 CHES 2024 및 V-Dem 전문가 설문조사를 기반으로 한 실제 인물들과의 상대적 위치를 나타냅니다.

Sources