honcho: 它是什么,解决了什么问题以及为什么它正受到关注
honcho: 它是什么,解决了什么问题以及为什么它正受到关注
它解决了什么问题
Honcho 为有状态的 AI agent 提供内存基础设施,允许它们随着时间的推移对人员、其他 agent、群体和项目保持持久的理解。它超越了简单的块匹配 (RAG),通过在实体演变过程中提取结论和进行推理来发挥作用。
工作原理
Honcho 以 FastAPI server (托管或自托管) 的形式运行,围绕“peers” (人类或 AI) 来组织数据。该系统遵循一个特定的循环:
- Store: 对话、事件和文档作为消息保存在 session 中。
- Reason: 后台进程 (the deriver) 异步分析这些消息以更新 peer 表示。
- Query: 用户可以通过 chat endpoint 查询这些表示,使用混合搜索 (BM25 + vector) 搜索特定信息,或提取准备好用于 prompt 的上下文。
- Inject: 生成的上下文或见解被注入到任何 LLM call 或 agent framework 中。
适用对象
- 需要长期记忆和高保留率的 AI agent 开发人员。
- 创建多 agent 系统、且 agent 需要理解不同 peer 之间的关系和观点的团队。
- MCP-compatible clients (如 Claude Code, Cursor, 或 Windsurf) 的用户,希望为其 coding agent 提供持久记忆。
亮点
- Reasoning-first memory: 提取演绎和归纳结论,而不仅仅是检索文本块。
- Peer-centric model: 跟踪实体 (用户、agent、想法) 及其随时间的变化。
- Multi-peer perspective: 可以建模一个特定 peer 对另一个 peer 的了解程度。
- Broad Integration: 支持 MCP, Claude Code, OpenCode, OpenClaw, 和 Hermes。
- Flexible Deployment: 可作为托管服务或通过 Docker 自托管。
Sources
- undefinedplastic-labs/honcho