GPT-5.6 Sol, Terra, and Luna 출시 노트
GPT-5.6 Sol, Terra, and Luna 출시 노트
OpenAI는 Sol (플래그십), Terra (균형), Luna (빠르고 저렴함)로 구성된 계층화된 기능 구조를 도입하여 GPT-5.6 모델 시리즈의 제한적 프리뷰를 출시했습니다. 이번 출시는 코딩, 생물학, 사이버 보안 분야의 에이전트 기능을 발전시키는 동시에, 고위험 공격적 사용을 완화하기 위한 더욱 엄격하고 계층화된 안전 스택을 구현하는 데 중점을 둡니다.
새로운 모델 계층 및 가격 정책
OpenAI는 버전 번호가 세대를 나타내고 이름이 기능 계층을 나타내는 명명 규칙으로 전환하고 있습니다. 이를 통해 서로 다른 계층이 각자의 일정에 따라 발전할 수 있습니다.
| 모델 | 포지셔닝 | 입력 가격 (1M 토큰당) | 출력 가격 (1M 토큰당) |
|---|---|---|---|
| GPT-5.6 Sol | 플래그십 / 최고 지능 | $5.00 | $30.00 |
| GPT-5.6 Terra | 균형 / 일상적 작업 | $2.50 | $15.00 |
| GPT-5.6 Luna | 빠름 / 최저 비용 | $1.00 | $6.00 |
프롬프트 캐싱 업데이트
GPT-5.6은 명시적인 캐시 중단점(cache breakpoints) 지원과 최소 30분의 캐시 수명을 통해 더욱 예측 가능한 프롬프트 캐싱을 도입합니다. 캐시 쓰기는 캐싱되지 않은 입력 속도의 1.25배로 청구되며, 캐시 읽기는 90% 할인을 유지합니다.
고급 기능 및 에이전트 워크플로우
GPT-5.6 Sol은 복잡하고 다단계 추론 작업을 처리하기 위한 두 가지 새로운 운영 모드를 도입합니다:
maxreasoning effort: 모델이 응답하기 전에 심층적으로 추론할 수 있는 추가 시간을 부여합니다.ultramode: 서브에이전트(subagents)를 활용하여 복잡한 작업을 가속화하며, 단일 에이전트의 능력을 넘어섭니다.
도메인별 성능
- 코딩: Sol은 Terminal-Bench 2.1에서 새로운 SOTA(state of the art)를 달성했으며, 특히 도구 조정 및 반복이 필요한 명령줄 워크플로우를 개선했습니다.
- 생물학: GeneBench v1에서 Sol은 더 적은 토큰을 사용하면서도 장기적인 게놈 분석 및 정량적 생물학 분석에서 GPT-5.5를 능가합니다.
- 사이버 보안: Sol은 취약점 연구를에 대한 성능-효율성 경계를 개선했습니다. ExploitBench에서, Sol은 Mythos Preview와 경쟁할 수 있는 수준이며 약 1/3의 출력 토큰을 사용합니다. ExploitGym에서, 세 가지 5.6 모델 모두 추론 능력이 증가함에 따라 사이버 보안 능력이 강력하게 향상됨을 보여줍니다.
계층화된 안전 가드레일 스택 및 안전 프레임워크
모델의 향상된 성능과 오용의 위험 사이의 균형을 맞추기 위해, OpenAI는 계층화된 안전 가드레일 스택을 구현했습니다. 목표는 허가된 방어적 작업(예: 패치 개발, 보안 교육)을 가능하게 하는 동시에 금지된 공격적 활동을 제한하는 것입니다.
안전 계층
- 모델 수준의 학습: 모델은 탈옥(jailbreak) 시도나 위장된 의도가 감지되면 금지된 사이버 보안 지원을 거부하도록 학습되었습니다.
- 실시간 분류기: 오용 분류기가 생성 중 출력 내용을 모니터링합니다. 고위험 탐지 시, 더 큰 추론 모델에 의한 검토를 위해 생성을 중단할 수 있습니다.
- 리스트 수준의 신호: 시스템은 여러 대화 패턴을 분석하여 지속적인 악의적 행동과 정당한 이중 용도 보안 연구를 distinguish(구분)합니다.
- 차별화된 액세스: 프리뷰 단계에서는 민감한 기능이 기본적으로 광범위하게 제공되지 않습니다.
자동화된 레드팀 테스트
OpenAI는