Valmis: 一个采用安全优先代理架构的开源 AI Agent 框架

Valmis: 一个采用安全优先代理架构的开源 AI Agent 框架

Valmis 是一个开源的基于云的应用,旨在为生产工作流部署 AI agents。它通过实现一种安全优先的架构,防止 AI agents 访问原始 API 凭据或主机文件,从而在众多个人助手工具中脱颖而出,使其适用于企业和专业环境。

用于凭据隔离的安全代理架构

Valmis 通过使用代理系统,解决了 AI agents 在内存中存储明文凭据或将其发送给 LLM 提供商所带来的安全风险。

在这种架构中,容器化的 agent runtime 是与主机完全隔离的。当一个 agent 需要执行操作时,它不会直接使用凭据;相反,它通过提供特定的凭据 ID 来请求主机执行 API 请求。主机执行实际请求并仅将 JSON 数据返回给 agent。这种设计允许管理员完全禁用 agent 容器的互联网访问权限,同时通过主机代理保持 agent 的功能性。

关键安全规范包括:

  • 加密:凭据使用 AES-256-GCM 进行加密并存储在数据库中。
  • 隔离:每个 agent 都拥有自己的文件系统,与其他 agent 和主机完全隔离。
  • 严格边界:对特定凭据的访问在代码层面进行控制,确保 agents 仅访问授权的工具。

多 Agent 编排与自动化工作流

Valmis 支持创建一组独立或协作的 agents,每个 agent 都有独特的配置: \n- 可定制的 Agents:每个 agent 可以分配不同的 LLM 提供商(支持来自 OpenAI、Anthropic 和 Google 等 20 个提供商的近 200 个模型),特定的技能,以及专用的知识库。

  • 层级化管理:Agents 可以被配置为“团队负责人”,拥有管理其他 agents 工作流的权限,从而创建一个由人类用户监督的决策树。
  • 工作流自动化:可视化工作流构建器画布允许用户通过 cron jobs、webhooks 或应用事件(例如新邮件或表单提交)触发多步流程。这些工作流支持循环,以及“智能”条件(由 AI 决定)和“严格”条件(编程逻辑)。

认知记忆与知识集成

Valmis 实现了一种受认知研究启发的记忆系统,将 agent 记忆分为四个不同的类别,以确保跨会话的持久性:

  1. 情节记忆 (Episodic):发生的事件记录。
  2. 语义记忆 (Semantic):持久的事实。
  3. 程序记忆 (Procedural):规则和约束。
  4. 工作记忆 (Working):短期的上下文。

Agents 会在会话结束时自动提炼所学信息,以改进未来的交互。该系统利用 pgvector 进行语义搜索和文本嵌入,以获取相关的记忆。

工具与集成能力

Valmis 为业务和生产力工具提供了广泛的连接性:

  • 应用集成:平台支持超过 100 种集成,包括 Google Workspace、Slack、Notion、HubSpot、Salesforce 和 Figma。每种集成都通过 YAML 文件定义,使得目录易于扩展。
  • 浏览器自动化:Agents 可以操作无头浏览器来浏览页面、转到特定页面、填写表单并截屏。与 API 调用一样,浏览器会话由主机通过代理进行管理。
  • 知识库:企业数据可以通过 Google Drive、Dropbox 和 Notion 进行集成,或者通过直接文件上传。
  • 人机协作 (Human-in-the-Loop):系统包含一种机制,让 agents 在做出关键决策前暂停并请求人类输入。
  • 专业化工具:平台包含一个 chess-engine 工具,允许 agents 通过依赖计算引擎而非容易产生幻觉的基于文本的 LLM 生成来执行合法的国际象棋移动。

部署与许可

Valmis 以 Apache License 2.0 发布。它可以使用 Docker Compose 进行部署,该工具编排了前端、后端、一个启用了 pgvector 的 PostgreSQL 数据库,以及用于 agent runtime 的 Docker socket proxy。

Sources