Apertus: 주권적 AI를 위한 오픈 파운데이션 모델

Apertus 개요

Apertus는 주권적 AI 개발을 가능하게 하도록 설계된 완전한 오픈 파운데이션 모델입니다. EPFL, ETH Zurich, 그리고 Swiss National Supercomputing Centre (CSCS) 간의 협력인 Swiss AI Initiative에 의해 개발된 Apertus는 투명성과 재현성을 보장하기 위해 오픈 웨이트(open weights), 오픈 데이터, 오픈 사이언스를 제공합니다.

개방성 및 재현성

Apertus는 훈련 과정에 대한 완전한 투명성을 제공함으로써 많은 "오픈 웨이트" 모델과 차별화됩니다. 이 프로젝트는 훈련 데이터, 코드, 웨이트, 방법론 및 정렬 원칙에 대한 오픈 액세스를 제공합니다. 이러한 구성 요소들을 문서화하고 재현 가능하게 만듦으로써, Apertus는 AI 분야의 오픈 소스 소프트웨어와 같은 역할을 하는 것을 목표로 합니다.

규제 준수 및 데이터 프라이버시

Apertus는 EU AI Act의 요구 사항을 충족하도록 설계되었습니다. 대규모 환경에서 준수 및 안전을 보장하기 위해, 이 모델은 다음과 같은 데이터 처리 관행을 포함합니다:

PII 제거: 모델은 훈련 세트에서 개인 식별 정보(PII)를 제거합니다.
Memorization 방지: 모델은 훈련 데이터의 암기(memorization)를 방지하도록 구축되어 데이터 유출 위험을 줄입니다.
Opt-out 존중: 모델은 데이터 opt-out을 존중하여, 데이터 소유자가 자신의 훈련 세트에 대해 더 많은 제어권을 가질 수 있도록 보장합니다.

성능 및 다국어 능력

Apertus는 8B 및 70B 파라미터 규모로 제공되며, 이는 동일한 크기의 다른 상위 오픈 모델들과 경쟁할 수 있는 수준입니다. 이 모델은 처음부터 다국어 능력을 위해 설계되었으며, 1,000개 이상의 언어로 훈련되어 AI 애플리케이션을 위한 광범위한 글로벌 기반을 제공할 수 있습니다.

전략적 파트너십

nSwiss AI Initiative의 개발은 Swisscom이 전략적 파트너로서 참여하여, 유럽 지역을 위한 주권적 AI 기반을 구축하는 데 필요한 인프라와 지원을 제공합니다.

Apertus: 주권적 AI를 위한 오픈 파운데이션 모델

Apertus: 주권적 AI를 위한 오픈 파운데이션 모델

Apertus 개요

개방성 및 재현성

규제 준수 및 데이터 프라이버시

성능 및 다국어 능력

전략적 파트너십

Sources