Anthropic Claude Fable 5 and Mythos 5 发布

概述

Anthropic 发布了 Claude Fable 5，这是一个被归类为“Mythos class”的模型。虽然完整的 Mythos 5 模型仅限于 Project Glasswing 中的特定用户（主要是具有特定用例的高消费企业客户），但 Fable 5 是为通用可用性而进行安全处理的版本。Anthropic 声称 Fable 5 的能力超过了以往任何可用的通用模型。

性能与基准测试

Claude Fable 5 与之前的模型相比表现出显著的改进，特别是在专门的技术和专业领域，尽管在不同基准测试中的增益并不均衡。

编程与智能体任务

Fable 5 在智能体编程（agentic coding）方面表现出大幅度的性能提升。在 SWE-bench Pro 和 Frontier Code（来自 Cognition 的基准测试）上，Fable 5 的得分比之前的 Opus 4.8 高出一倍多，而 Opus 4.8 此前的得分为 13.4。

法律与通用基准测试

法律基准测试： Fable 5 比 Opus 4.8 强约 30%，并且优于 GPT-5.5。
通用性能： 该模型优于 Opus 4.8 和 GPT-5.5，但值得注意的是，与编程领域的巨大飞跃相比，在工具使用（tool-use）和计算机使用（computer-use）基准测试中的差距并不那么显著。

价格与访问层级

API 价格

Fable 5 和 Mythos 5 的价格为 每百万输入 token 10 美元 和 每百万输出 token 50 美元。这比 Opus 4.8 的成本翻了一倍，但不到先前 Claude Mythos Preview 的价格的一半。

订阅变更

在 6 月 22 日 之前，Pro 和 Max 账户可以访问 Fable 5。从 6 月 23 日 开始，Fable 5 将从这些计划中移除，用户需要通过 API token 价格进行支付。Anthropic 意图尽快将 Fable 5 重新加入订阅计划，但预计它将仅限于 Max 层级及以上，而不会回到 Pro 层级。

安全限制与模型切换

Anthropic 实施了激进的安全分类器，可以在对话中途触发模型切换。如果提示词（prompt）被标记，系统会自动将用户从 Fable 5 切换到另一个不同的模型（例如 Opus 4.8）以继续聊天。

触发类别

网络安全： 拦截与恶意软件或攻击相关的内容。
生命科学/生物学： 极其敏感的触发器。即使是良性的查询——例如询问当前埃博拉疫情的细分情况以及与世界杯相关的风险——也可能触发安全标记并强制进行模型切换。
思维链 (CoT)： 该模型旨在拦截试图诱导其内部“总结性思维”或长思维链的请求。

数据保留政策转变

Anthropic 正在针对 Mythos class 模型在第一方和第三方平台上的所有流量引入强制性的 30 天数据保留政策。虽然 Anthropic 声称这些数据不会用于训练新模型或用于非安全目的，但该政策旨在允许公司捕获并分析越狱（jailbreak）尝试，以便快速修补漏洞。

Anthropic Claude Fable 5 and Mythos 5 发布

Anthropic Claude Fable 5 and Mythos 5 发布

概述

性能与基准测试

编程与智能体任务

法律与通用基准测试

价格与访问层级

API 价格

订阅变更

安全限制与模型切换

触发类别

数据保留政策转变

Sources