honcho: 它是什麼、解決什麼問題以及為什麼它正受到關注

honcho: 它是什麼、解決什麼問題以及為什麼它正受到關注

解決什麼問題

Honcho 為有狀態的 AI agent 提供記憶基礎設施，讓它們能夠隨著時間推移，對人、其他 agent、群組和專案保持持久的理解。它超越了簡單的區塊匹配 (RAG)，透過提取結論並對實體隨著時間演變的過程進行推理。

如何運作

Honcho 以 FastAPI server (可選擇託管或自行託管) 的形式運作，圍繞著「peers」(人類或 AI) 來組織數據。系統遵循特定的循環：

Store: 對話、事件和文件會作為訊息儲存在 session 中。
Reason: 背景程序 (the deriver) 會非同步地分析這些訊息，以更新 peer 的表示形式。
Query: 使用者可以透過 chat endpoint 查詢這些表示形式，使用混合搜尋 (BM25 + vector) 搜尋特定資訊，或提取準備好用於 prompt 的 context。
Inject: 產生的 context 或洞察會被注入到任何 LLM call 或 agent framework 中。

對象是誰

需要長期記憶和高保留率的 AI agent 開發者。
正在建立多 agent 系統的團隊，其中 agent 需要理解不同 peers 之間的關係和觀點。
MCP-compatible clients (例如 Claude Code, Cursor, 或 Windsurf) 的使用者，希望為其 coding agent 提供持久記憶。

重點摘要

Reasoning-first memory: 提取演繹和歸納結論，而不僅僅是檢索文本區塊。
Peer-centric model: 追蹤實體 (使用者、agent、想法) 以及它們如何隨著時間改變。
Multi-peer perspective: 可以模擬一個特定 peer 對另一個 peer 的了解程度。
Broad Integration: 支援 MCP, Claude Code, OpenCode, OpenClaw, 和 Hermes。
Flexible Deployment: 可作為託管服務或透過 Docker 自行託管。

Sources

undefinedplastic-labs/honcho