Apertus: 面向主权 AI 的开放基础模型
Apertus: 面向主权 AI 的开放基础模型
Apertus 概述
Apertus 是一个完全开放的基础模型,旨在实现主权 AI 开发。Apertus 由 Swiss AI Initiative 开发——这是 EPFL、ETH Zurich 和 Swiss National Supercomputing Centre (CSCS) 之间的合作项目——它提供开放权重、开放数据和开放科学,以确保 AI 训练的透明度和可复现性。
开放性与可复现性
Apertus 与许多“开放权重”模型不同,它通过提供训练过程的全透明度来脱颖而出。该项目提供对训练数据、代码、权重、方法和对齐原则的开放访问。通过记录并使这些组件具有可复现性,Apertus 旨在成为 AI 领域的开源软件。
合规性与数据隐私
Apertus 旨在满足 EU AI Act 的要求。为了确保大规模应用下的合规性与安全性,该模型采用了以下数据处理实践:
PII Removal: 模型从其训练集中移除个人身份信息 (PII)。
Memorization Prevention: 模型旨在防止对训练数据的记忆,从而降低数据泄露的风险。
Opt-out Respect: 模型尊重数据退出机制,确保数据所有者对其训练集拥有更多控制权。
性能与多语言能力
Apertus 提供 8B 和 70B 参数规模的版本,其竞争力可与其它同等规模的顶级开放模型相媲美。该模型从设计之初就考虑到了多语言能力,经过了 1,000 多种语言的训练,使其能够为 AI 应用提供广泛的全球基础。
战略合作伙伴
Swiss AI Initiative 的开发过程中,Swisscom 作为战略合作伙伴,提供了为欧洲地区构建主权 AI 基础所需的必要基础设施和支持。