Anthropic Claude Fable 5 및 Mythos 5 출시

Anthropic Claude Fable 5 및 Mythos 5 출시

개요

Anthropic은 Claude Fable 5를 출시했으며, 이는 "Mythos 클래스" 모델로 분류됩니다. 전체 Mythos 5 모델은 Project Glasswing(특정 사용 사례를 가진 고액 기업 고객)에서만 제한적으로 제공되지만, Fable 5는 일반 사용자를 위해 안전하게 만든 버전입니다. Anthropic은 Fable 5의 능력이 이전에 제공된 모든 일반용 모델을 능가한다고 주장합니다.

성능 및 벤치마크

Claude Fable 5는 특히 전문 기술 및 직업 분야에서 이전 모델에 비해 큰 개선을 보여주지만, 벤치마크마다 향상 정도가 고르지는 않습니다.

코딩 및 에이전시 작업

Fable 5는 에이전시 코딩에서 상당한 성능 향상을 보입니다. SWE-bench ProFrontier Code(Cognition의 벤치마크)에서 Fable 5는 이전에 13.4점의 점수를 기록한 Opus 4.8의 점수를 두 배 이상 뛰어넘습니다.

법률 및 일반 벤치마크

  • 법률 벤치마크: Fable 5는 Opus 4.8보다 약 30% 우수하며 GPT-5.5보다도 뛰어납니다.
  • 일반 성능: 이 모델은 Opus 4.8과 GPT-5.5 모두를 능가하지만, 도구 사용 및 컴퓨터 사용 벤치마크에서는 코딩에서 보인 거대한 도약에 비해 격차가 적은 것으로 나타났습니다.

가격 및 접근 티어

API 가격

Fable 5와 Mythos 5는 입력 토큰 백만 개당 $10, 출력 토큰 백만 개당 $50에 가격이 책정됩니다. 이는 Opus 4.8의 두 배 비용이지만, 이전 Claude Mythos Preview보다 절반 이하의 가격입니다.

구독 변경 사항

Fable 5에 대한 접근은 Pro 및 Max 계정에 6월 22일까지 포함됩니다. 6월 23일부터는 이 플랜에서 Fable 5가 제거되어 사용자는 API 토큰 가격으로 결제해야 합니다. Anthropic은 가능한 한 빨리 Fable 5를 구독 플랜에 복구하려고 하지만, Pro 티어가 아닌 Max 티어 이상에서만 독점적으로 제공될 것으로 예상됩니다.

안전 제한 및 모델 전환

Anthropic은 대화 중에 모델 전환을 트리거할 수 있는 강력한 안전 분류기를 구현했습니다. 프롬프트가 플래그되면 시스템이 자동으로 사용자를 Fable 5에서 다른 모델(예: Opus 4.8)로 전환하여 채팅을 계속합니다.

트리거 카테고리

  • 사이버 보안: 악성코드 또는 공격과 관련된 콘텐츠를 차단합니다.
  • 생명 과학/생물학: 매우 민감한 트리거입니다. 현재 에볼라 발생 상황과 월드컵에 대한 위험을 묻는 등 무해한 질문도 안전 플래그를 일으켜 모델 전환을 강제할 수 있습니다.
  • 사고 흐름(Chain of Thought, CoT): 모델은 내부 "요약된 사고"나 긴 사고 흐름을 유도하려는 요청을 차단하도록 설계되었습니다.

데이터 보존 정책 변경

Anthropic은 Mythos 클래스 모델에 대해 첫 번째 파티와 서드 파티 모두에서 모든 트래픽에 대해 30일 데이터 보존 정책을 의무화합니다. Anthropic은 이 데이터가 새로운 모델 학습이나 비안전 목적에 사용되지 않을 것이라고 주장하지만, 이 정책은 회사가 탈옥 시도를 포착·분석하여 취약점을 신속히 패치할 수 있도록 하기 위한 것입니다.

요약: Anthropic은 코딩 및 법률 벤치마크에서 GPT-5.5와 Opus 4.8을 능가하는 안전 조정된 Mythos 클래스 모델인 Claude Fable 5를 출시했지만, 엄격한 안전 트리거와 의무적인 30일 데이터 보존 정책을 도입했습니다.

제목: Anthropic Claude Fable 5 및 Mythos 5 출시

Sources