Apertus: 實現主權 AI 的開放基礎模型

Apertus: 實現主權 AI 的開放基礎模型

Apertus 概覽

Apertus 是一個完全開放的基礎模型,旨在實現主權 AI 的開發。Apertus 由 Swiss AI Initiative 開發——這是 EPFL、ETH Zurich 與 Swiss National Supercomputing Centre (CSCS) 的合作成果——Apertus 提供開放權重、開放數據與開放科學,以確保 AI 訓練的透明度與可重現性。

開放性與可重現性

Apertus 與許多「開放權重」模型不同之處在於,它為訓練過程提供了完全的透明度。該專案提供訓練數據、程式碼、權重、方法與對齊原則的開放存取。透過記錄並使這些組件具備可重現性,Apertus 旨在成為 AI 領域中開源軟體的等同物。

法規遵循與數據隱私

Apertus 的設計旨在符合 EU AI Act 的要求。為了確保大規模應用下的合規性與安全性,該模型納入了以下數據處理實務:

  • PII Removal: 模型從其訓練集中移除個人識別資訊 (PII)。

  • Memorization Prevention: 模型旨在防止訓練數據的記憶化,從而降低數據洩漏的風險。

  • Opt-out Respect: 模型尊重數據退出機制 (opt-outs),確保數據所有者對其訓練集擁有更多控制權。

性能與多語言能力

Apertus 提供 8B 與 70B 參數規模的版本,其競爭力可與其他同等規模的頂尖開放模型相媲美。該模型從設計之初就考慮到了多語言能力,經過超過 1,000 種語言的訓練,使其能夠為 AI 應用提供廣泛的全球基礎。

戰略合作夥伴

Swiss AI Initiative 的開發過程中,Swisscom 同為戰略合作夥伴,提供建構歐洲地區主權 AI 基礎所需的基礎設施與支援。

Sources