Anthropic Claude Fable 5 and Mythos 5 发布
Anthropic Claude Fable 5 and Mythos 5 发布
概述
Anthropic 发布了 Claude Fable 5,这是一个被归类为“Mythos class”的模型。虽然完整的 Mythos 5 模型仅限于 Project Glasswing 中的特定用户(主要是具有特定用例的高消费企业客户),但 Fable 5 是为通用可用性而进行安全处理的版本。Anthropic 声称 Fable 5 的能力超过了以往任何可用的通用模型。
性能与基准测试
Claude Fable 5 与之前的模型相比表现出显著的改进,特别是在专门的技术和专业领域,尽管在不同基准测试中的增益并不均衡。
编程与智能体任务
Fable 5 在智能体编程(agentic coding)方面表现出大幅度的性能提升。在 SWE-bench Pro 和 Frontier Code(来自 Cognition 的基准测试)上,Fable 5 的得分比之前的 Opus 4.8 高出一倍多,而 Opus 4.8 此前的得分为 13.4。
法律与通用基准测试
- 法律基准测试: Fable 5 比 Opus 4.8 强约 30%,并且优于 GPT-5.5。
- 通用性能: 该模型优于 Opus 4.8 和 GPT-5.5,但值得注意的是,与编程领域的巨大飞跃相比,在工具使用(tool-use)和计算机使用(computer-use)基准测试中的差距并不那么显著。
价格与访问层级
API 价格
Fable 5 和 Mythos 5 的价格为 每百万输入 token 10 美元 和 每百万输出 token 50 美元。这比 Opus 4.8 的成本翻了一倍,但不到先前 Claude Mythos Preview 的价格的一半。
订阅变更
在 6 月 22 日 之前,Pro 和 Max 账户可以访问 Fable 5。从 6 月 23 日 开始,Fable 5 将从这些计划中移除,用户需要通过 API token 价格进行支付。Anthropic 意图尽快将 Fable 5 重新加入订阅计划,但预计它将仅限于 Max 层级及以上,而不会回到 Pro 层级。
安全限制与模型切换
Anthropic 实施了激进的安全分类器,可以在对话中途触发模型切换。如果提示词(prompt)被标记,系统会自动将用户从 Fable 5 切换到另一个不同的模型(例如 Opus 4.8)以继续聊天。
触发类别
- 网络安全: 拦截与恶意软件或攻击相关的内容。
- 生命科学/生物学: 极其敏感的触发器。即使是良性的查询——例如询问当前埃博拉疫情的细分情况以及与世界杯相关的风险——也可能触发安全标记并强制进行模型切换。
- 思维链 (CoT): 该模型旨在拦截试图诱导其内部“总结性思维”或长思维链的请求。
数据保留政策转变
Anthropic 正在针对 Mythos class 模型在第一方和第三方平台上的所有流量引入强制性的 30 天数据保留政策。虽然 Anthropic 声称这些数据不会用于训练新模型或用于非安全目的,但该政策旨在允许公司捕获并分析越狱(jailbreak)尝试,以便快速修补漏洞。
Sources
- undefinedMythos 5 & Fable 5 Launched