Apertus: 面向主权 AI 的开放基础模型

Apertus 概述

Apertus 是一个完全开放的基础模型，旨在实现主权 AI 开发。Apertus 由 Swiss AI Initiative 开发——这是 EPFL、ETH Zurich 和 Swiss National Supercomputing Centre (CSCS) 之间的合作项目——它提供开放权重、开放数据和开放科学，以确保 AI 训练的透明度和可复现性。

开放性与可复现性

Apertus 与许多“开放权重”模型不同，它通过提供训练过程的全透明度来脱颖而出。该项目提供对训练数据、代码、权重、方法和对齐原则的开放访问。通过记录并使这些组件具有可复现性，Apertus 旨在成为 AI 领域的开源软件。

合规性与数据隐私

Apertus 旨在满足 EU AI Act 的要求。为了确保大规模应用下的合规性与安全性，该模型采用了以下数据处理实践：

PII Removal: 模型从其训练集中移除个人身份信息 (PII)。
Memorization Prevention: 模型旨在防止对训练数据的记忆，从而降低数据泄露的风险。
Opt-out Respect: 模型尊重数据退出机制，确保数据所有者对其训练集拥有更多控制权。

性能与多语言能力

Apertus 提供 8B 和 70B 参数规模的版本，其竞争力可与其它同等规模的顶级开放模型相媲美。该模型从设计之初就考虑到了多语言能力，经过了 1,000 多种语言的训练，使其能够为 AI 应用提供广泛的全球基础。

战略合作伙伴

Swiss AI Initiative 的开发过程中，Swisscom 作为战略合作伙伴，提供了为欧洲地区构建主权 AI 基础所需的必要基础设施和支持。

Apertus: 面向主权 AI 的开放基础模型

Apertus: 面向主权 AI 的开放基础模型

Apertus 概述

开放性与可复现性

合规性与数据隐私

性能与多语言能力

战略合作伙伴

Sources