Claude 设计代理架构:垂直 AI 代理的 6 种模式
Claude 设计代理架构:垂直 AI 代理的 6 种模式
Claude 设计并非仅仅是大型语言模型的包装器;它是一个复杂的垂直代理应用,使用特定的架构模式栈来实现高质量、专业的结果。虽然针对 Claude 3.7 Opus 进行了优化,但系统的核心优势在于六种代理模式的组合,这些模式可以应用于任何垂直代理,例如法律、销售或医疗领域的应用。
1. 代理上下文落地
代理绝不能盲目生成内容;它们必须首先在用户的特定数据中落地。
Claude 设计通过在生成开始前要求创建详细的设计系统来实现这一点。该系统包括通用的品牌上下文、具体的颜色、字体以及可复用组件(如按钮和卡片)的 HTML 代码。
不同于传统的 RAG(检索增强生成),后者仅将上下文注入系统提示,Claude 设计使用“渐进式披露”。代理会根据手头的具体任务动态决定读取设计系统的哪些部分并将其带入上下文窗口。
2. 结构化记忆
垂直代理的首个输出应是结构化记忆工件,而非面向用户的交付物。
在上下文落地的基础上,Claude 设计创建了品牌和项目目标的持久记忆。该记忆以 Markdown、HTML 或 CSS 等简单、可移植的格式存储,而非专有模式。
通过先将原始用户数据重构为记忆工件,后续生成会更快、更准确,因为代理拥有一个稳定、可移植的参考点,可在多个项目之间复用。
3. 迭代细化循环(多模态)
避免将所有交互都强制通过聊天机器人;让模型根据输出自行生成输入控件。
Claude 设计超越聊天界面,采用五种不同的输入模式:
- 聊天和语音: 标准的对话输入。
- DOM 选择: 悬停并选择特定元素以描述更改。
- 视觉涂鸦: 在屏幕上直接绘制以提供编辑指令。
- 自我截图: 代理对自己的输出进行截图以进行分析。
此外,模型会将自己的 UI 组件(如滑块或按钮)生成成 token,包装层再进行渲染。这实现了更自然的用户体验——例如,销售代理可以生成一个“激进度滑块”,让用户在不手动输入指令的情况下调节邮件语气。
4. 自我 QA 与反思循环
代理应在向人类用户展示之前,使用视觉模型对自己的作品进行渲染和批评。
在交付最终结果之前,Claude 设计会渲染输出,截图并将该图像反馈给视觉模型进行批评。代理会迭代设计,直至视觉输出符合预期目标。该模式依赖于 Opus 4.7 等模型提升的视觉能力,虽然消耗 token 较多,但显著提升了最终输出的质量。
5. 多变体生成
主动生成多个解决方案版本,以显现高层决策并降低不确定性。
Claude 设计不会只提供单一答案,而是生成多个布局、结构或配色的变体。这迫使代理对“决策层级”(例如先决定布局再决定排版)进行优先排序。
在其他垂直领域,这意味着识别主要的变体轴——如销售中的“温和 vs. 直接”语调——并提前提供选项。这通常比提出澄清性问题更有效,因为它为用户提供了具体的起点进行反馈。
6. 交接模式
确保代理输出以开放格式存储,以实现向其他代理或专业工具的无缝交接。
Claude 设计避免使用专有格式,主要以 HTML 和 CSS 存储数据。这使系统能够将结果导出到各种外部工具,包括:
- Claude Code(代理间交接)
- Figma、Canva、PowerPoint 和 PDF(工具交接)
使用 JSON、Markdown 和 HTML 等开放格式,可确保输出在不同模型和生态系统之间保持可移植性。
结论:模式组合的力量
Claude 设计的质的差异来源于这六种模式的协同作用。最关键的突破是 上下文落地 与 结构化记忆 的组合,它用动态、由代理管理的上下文系统取代了庞大、静态的系统提示。通过先构建自己的记忆再基于该基础生成,代理实现了大多数当前企业 AI 部署所缺乏的精确性和可靠性。
Sources
- undefinedHow Claude's Design Agents Work