Anthropic Claude Fable 5 與 Mythos 5 發布
Anthropic Claude Fable 5 與 Mythos 5 發布
概覽
Anthropic 已發布 Claude Fable 5,這是一款被歸類為「Mythos 類」的模型。完整的 Mythos 5 模型僅限於 Project Glasswing 中的特定使用者(主要是具有特定使用案例的高消費企業客戶),而 Fable 5 則是為一般可用性而安全化的版本。Anthropic 宣稱 Fable 5 的能力超越任何先前可供一般使用的模型。
效能與基準測試
Claude Fable 5 在先前模型上展現出顯著的提升,尤其在專業技術領域表現突出,儘管在不同基準測試間的提升程度不盡相同。
程式碼與代理任務
Fable 5 在代理式程式碼方面顯示出大幅度的效能提升。在 SWE-bench Pro 與 Frontier Code(Cognition 的基準測試)上,Fable 5 的分數是先前以 13.4 分領先的 Opus 4.8 的兩倍以上。
法律與一般基準測試
- 法律基準測試: Fable 5 的表現約比 Opus 4.8 好 30%,且優於 GPT-5.5。
- 一般效能: 該模型優於 Opus 4.8 與 GPT-5.5,雖然在工具使用與電腦使用的基準測試中,差距不如在程式碼領域的巨大躍進那麼明顯。
定價與存取層級
API 定價
Fable 5 與 Mythos 5 的價格為 每百萬輸入代幣 10 美元 與 每百萬輸出代幣 50 美元。這是 Opus 4.8 成本的兩倍,但仍低於早期 Claude Mythos 預覽版的一半價格。
訂閱變更
Fable 5 的存取權限已包含在 Pro 與 Max 帳戶中,直至 6 月 22 日。自 6 月 23 日 起,Fable 5 將從這些方案中移除,使用者需改以 API 代幣價格付費。Anthropic 計畫盡快將 Fable 5 恢復至訂閱方案,但預計仍將僅限於 Max 級別及更高層級,而不會回到 Pro 級別。
安全限制與模型切換
Anthropic 實施了積極的安全分類器,能在對話過程中觸發模型切換。若提示被標記,系統會自動將使用者從 Fable 5 切換至其他模型(例如 Opus 4.8)以繼續聊天。
觸發類別
- 網路安全: 阻止與惡意軟體或攻擊相關的內容。
- 生命科學/生物學: 極度敏感的觸發類別。即使是善意的查詢——例如詢問當前埃博拉疫情的概況及其對世界杯的風險——也可能觸發安全標記,迫使模型切換。
- 思考鏈(CoT): 模型被設計為阻止試圖引出其內部「思考摘要」或長思考鏈的請求。
資料保留政策變更
Anthropic 正在為所有 Mythos 類模型的第一方與第三方介面引入強制 30 天資料保留政策。雖然 Anthropic 宣稱這些資料不會用於訓練新模型或非安全相關的用途,但此政策旨在讓公司捕捉並分析 jailbreak 嘗試,以便快速修補漏洞。
Sources
- undefinedMythos 5 & Fable 5 Launched