GPT-5.6 Sol, Terra, and Luna 출시 노트

OpenAI는 Sol (플래그십), Terra (균형), Luna (빠르고 저렴함)로 구성된 계층화된 기능 구조를 도입하여 GPT-5.6 모델 시리즈의 제한적 프리뷰를 출시했습니다. 이번 출시는 코딩, 생물학, 사이버 보안 분야의 에이전트 기능을 발전시키는 동시에, 고위험 공격적 사용을 완화하기 위한 더욱 엄격하고 계층화된 안전 스택을 구현하는 데 중점을 둡니다.

새로운 모델 계층 및 가격 정책

OpenAI는 버전 번호가 세대를 나타내고 이름이 기능 계층을 나타내는 명명 규칙으로 전환하고 있습니다. 이를 통해 서로 다른 계층이 각자의 일정에 따라 발전할 수 있습니다.

모델	포지셔닝	입력 가격 (1M 토큰당)	출력 가격 (1M 토큰당)
GPT-5.6 Sol	플래그십 / 최고 지능	$5.00	$30.00
GPT-5.6 Terra	균형 / 일상적 작업	$2.50	$15.00
GPT-5.6 Luna	빠름 / 최저 비용	$1.00	$6.00

프롬프트 캐싱 업데이트

GPT-5.6은 명시적인 캐시 중단점(cache breakpoints) 지원과 최소 30분의 캐시 수명을 통해 더욱 예측 가능한 프롬프트 캐싱을 도입합니다. 캐시 쓰기는 캐싱되지 않은 입력 속도의 1.25배로 청구되며, 캐시 읽기는 90% 할인을 유지합니다.

고급 기능 및 에이전트 워크플로우

GPT-5.6 Sol은 복잡하고 다단계 추론 작업을 처리하기 위한 두 가지 새로운 운영 모드를 도입합니다:

max reasoning effort: 모델이 응답하기 전에 심층적으로 추론할 수 있는 추가 시간을 부여합니다.
ultra mode: 서브에이전트(subagents)를 활용하여 복잡한 작업을 가속화하며, 단일 에이전트의 능력을 넘어섭니다.

도메인별 성능

코딩: Sol은 Terminal-Bench 2.1에서 새로운 SOTA(state of the art)를 달성했으며, 특히 도구 조정 및 반복이 필요한 명령줄 워크플로우를 개선했습니다.
생물학: GeneBench v1에서 Sol은 더 적은 토큰을 사용하면서도 장기적인 게놈 분석 및 정량적 생물학 분석에서 GPT-5.5를 능가합니다.
사이버 보안: Sol은 취약점 연구를에 대한 성능-효율성 경계를 개선했습니다. ExploitBench에서, Sol은 Mythos Preview와 경쟁할 수 있는 수준이며 약 1/3의 출력 토큰을 사용합니다. ExploitGym에서, 세 가지 5.6 모델 모두 추론 능력이 증가함에 따라 사이버 보안 능력이 강력하게 향상됨을 보여줍니다.

계층화된 안전 가드레일 스택 및 안전 프레임워크

모델의 향상된 성능과 오용의 위험 사이의 균형을 맞추기 위해, OpenAI는 계층화된 안전 가드레일 스택을 구현했습니다. 목표는 허가된 방어적 작업(예: 패치 개발, 보안 교육)을 가능하게 하는 동시에 금지된 공격적 활동을 제한하는 것입니다.

안전 계층

모델 수준의 학습: 모델은 탈옥(jailbreak) 시도나 위장된 의도가 감지되면 금지된 사이버 보안 지원을 거부하도록 학습되었습니다.
실시간 분류기: 오용 분류기가 생성 중 출력 내용을 모니터링합니다. 고위험 탐지 시, 더 큰 추론 모델에 의한 검토를 위해 생성을 중단할 수 있습니다.
리스트 수준의 신호: 시스템은 여러 대화 패턴을 분석하여 지속적인 악의적 행동과 정당한 이중 용도 보안 연구를 distinguish(구분)합니다.
차별화된 액세스: 프리뷰 단계에서는 민감한 기능이 기본적으로 광범위하게 제공되지 않습니다.

자동화된 레드팀 테스트

OpenAI는

GPT-5.6 Sol, Terra, and Luna 출시 노트

GPT-5.6 Sol, Terra, and Luna 출시 노트

새로운 모델 계층 및 가격 정책

프롬프트 캐싱 업데이트

고급 기능 및 에이전트 워크플로우

도메인별 성능

계층화된 안전 가드레일 스택 및 안전 프레임워크

안전 계층

자동화된 레드팀 테스트

Sources