honcho: 它是什麼、解決什麼問題以及為什麼它正受到關注

honcho: 它是什麼、解決什麼問題以及為什麼它正受到關注

解決什麼問題

Honcho 為有狀態的 AI agent 提供記憶基礎設施,讓它們能夠隨著時間推移,對人、其他 agent、群組和專案保持持久的理解。它超越了簡單的區塊匹配 (RAG),透過提取結論並對實體隨著時間演變的過程進行推理。

如何運作

Honcho 以 FastAPI server (可選擇託管或自行託管) 的形式運作,圍繞著「peers」(人類或 AI) 來組織數據。系統遵循特定的循環:

  1. Store: 對話、事件和文件會作為訊息儲存在 session 中。
  2. Reason: 背景程序 (the deriver) 會非同步地分析這些訊息,以更新 peer 的表示形式。
  3. Query: 使用者可以透過 chat endpoint 查詢這些表示形式,使用混合搜尋 (BM25 + vector) 搜尋特定資訊,或提取準備好用於 prompt 的 context。
  4. Inject: 產生的 context 或洞察會被注入到任何 LLM call 或 agent framework 中。

對象是誰

  • 需要長期記憶和高保留率的 AI agent 開發者。
  • 正在建立多 agent 系統的團隊,其中 agent 需要理解不同 peers 之間的關係和觀點。
  • MCP-compatible clients (例如 Claude Code, Cursor, 或 Windsurf) 的使用者,希望為其 coding agent 提供持久記憶。

重點摘要

  • Reasoning-first memory: 提取演繹和歸納結論,而不僅僅是檢索文本區塊。
  • Peer-centric model: 追蹤實體 (使用者、agent、想法) 以及它們如何隨著時間改變。
  • Multi-peer perspective: 可以模擬一個特定 peer 對另一個 peer 的了解程度。
  • Broad Integration: 支援 MCP, Claude Code, OpenCode, OpenClaw, 和 Hermes。
  • Flexible Deployment: 可作為託管服務或透過 Docker 自行託管。

Sources