Valmis: 一款具備安全優先代理架構的開源 AI Agent 框架

Valmis: 一款具備安全優先代理架構的開源 AI Agent 框架

Valmis 是一款專為生產工作流部署 AI agent 設計的開源雲端應用程式。它與其他個人助理工具的不同之處在於實作了安全優先的架構,防止 AI agent 存取原始 API 憑證或主機檔案,使其非常適合企業與專業環境。

用於憑證隔離的安全代理架構

Valmis 透過使用代理系統 (proxy system),解決了 AI agent 在記憶體中儲存明文憑證或將其傳送給 LLM 提供商所帶來的安全風險。

在此架構中,容器化的 agent runtime 完全與主機隔離。當 agent 需要執行動作時,它不會直接使用憑證;相反地,它會透過提供特定的憑證 ID,請求主機執行 API 請求。主機執行實際的請求並僅將 JSON 資料回傳給 agent。這種設計允許管理員完全禁用 agent 容器的網路存取,同時仍能透過主機代理維持 agent 的功能。

關鍵安全規範包括:

  • 加密:憑證使用 AES-256-GCM 加密並儲存在資料庫中。
  • 隔離:每個 agent 都擁有自己的檔案系統,與其他 agent 及主機完全隔離。
  • 嚴格邊界:對特定憑證的存取權限在程式碼層級進行控制,確保 agent 僅能存取經授權的工具。

多 Agent 編排與自動化工作流

Valmis 支援建立一群獨立或協作的 agent,每個 agent 都有其獨特的配置:

  • 可自定義的 Agents:每個 agent 可以分配不同的 LLM 提供商(支援來自 OpenAI、Anthropic 與 Google 等 20 個提供商的近 200 個模型),特定的技能,以及專屬的知識庫。
  • 階層式管理:Agent 可以被配置為「團隊領導者」,擁有管理其他 agent 工作流的權限,從而建立一個由人類使用者進行監督的決策樹。
  • 工作流自動化:視覺化工作流建立器畫布允許使用者建立由 cron jobs、webhooks 或應用程式事件(例如:新郵件或表單提交)觸發的多步驟流程。這些工作流支援迴圈,以及「智慧型」條件(由 AI 決定)與「嚴格」條件(程式邏輯)。

認知記憶與知識整合

Valmis 實作了受認知研究啟發的記憶系統,將 agent 記憶分為四個不同的類別,以確保跨會話的持久性:

  1. 情節記憶 (Episodic):發生過的事情的紀錄。
  2. 語義記憶 (Semantic):持久的事實。
  3. 程序記憶 (Procedural):規則與限制。
  4. 工作記憶 (Working):短暫的上下文內容。

Agent 會在會話結束時自動提煉學到的資訊,以改善未來的互動。此系統利用 pgvector 進行語義搜尋與文本嵌入,以獲取相關記憶。

工具與整合能力

Valmis 提供與商業與生產力工具的廣泛連接性:

  • 應用程式整合:平台支援超過 100 種整合,包括 Google Workspace、Slack、Notion、HubSpot、Salesforce 與 Figma。每種整合都是透過 YAML 檔案定義的,使得目錄非常容易擴充。
  • 瀏覽器自動化:Agent 可以操作 headless browser 來瀏覽頁面、填寫表單並截圖。與 API 呼叫一樣,瀏覽器會話是由主機透過代理進行管理。
  • 知識庫:企業資料可以透過 Google Drive、Dropbox 與 Notion 進行整合,或透過直接檔案上傳。
  • 人機協作 (Human-in-the-Loop):系統包含一種機制,讓 agent 在做出關鍵決策前會先暫停並請求人類輸入。
  • 專門工具:平台包含一個 chess-engine 工具,允許 agent 透過依賴計算引擎而非容易產生幻覺的文本型 LLM 生成來進行合法的西洋棋步法。

部署與授權

Valmis 是以 Apache License 2.0 發佈的。它可以透過 Docker Compose 部署,該工具會編排 frontend、backend、一個啟用了 pgvector 的 PostgreSQL 資料庫,以及一個用於 agent runtime 的 Docker socket proxy。

Sources