honcho: 它是什麼、解決什麼問題以及為什麼它正受到關注
honcho: 它是什麼、解決什麼問題以及為什麼它正受到關注
解決什麼問題
Honcho 為有狀態的 AI agent 提供記憶基礎設施,讓它們能夠隨著時間推移,對人、其他 agent、群組和專案保持持久的理解。它超越了簡單的區塊匹配 (RAG),透過提取結論並對實體隨著時間演變的過程進行推理。
如何運作
Honcho 以 FastAPI server (可選擇託管或自行託管) 的形式運作,圍繞著「peers」(人類或 AI) 來組織數據。系統遵循特定的循環:
- Store: 對話、事件和文件會作為訊息儲存在 session 中。
- Reason: 背景程序 (the deriver) 會非同步地分析這些訊息,以更新 peer 的表示形式。
- Query: 使用者可以透過 chat endpoint 查詢這些表示形式,使用混合搜尋 (BM25 + vector) 搜尋特定資訊,或提取準備好用於 prompt 的 context。
- Inject: 產生的 context 或洞察會被注入到任何 LLM call 或 agent framework 中。
對象是誰
- 需要長期記憶和高保留率的 AI agent 開發者。
- 正在建立多 agent 系統的團隊,其中 agent 需要理解不同 peers 之間的關係和觀點。
- MCP-compatible clients (例如 Claude Code, Cursor, 或 Windsurf) 的使用者,希望為其 coding agent 提供持久記憶。
重點摘要
- Reasoning-first memory: 提取演繹和歸納結論,而不僅僅是檢索文本區塊。
- Peer-centric model: 追蹤實體 (使用者、agent、想法) 以及它們如何隨著時間改變。
- Multi-peer perspective: 可以模擬一個特定 peer 對另一個 peer 的了解程度。
- Broad Integration: 支援 MCP, Claude Code, OpenCode, OpenClaw, 和 Hermes。
- Flexible Deployment: 可作為託管服務或透過 Docker 自行託管。
Sources
- undefinedplastic-labs/honcho