honcho: 무엇인지, 어떤 문제를 해결하는지 & 왜 인기를 얻고 있는지

honcho: 무엇인지, 어떤 문제를 해결하는지 & 왜 인기를 얻고 있는지

해결하는 문제

Honcho는 상태 유지형(stateful) AI 에이전트를 위한 메모리 인프라를 제공하여, 사람, 다른 에이전트, 그룹 및 프로젝트에 대해 시간이 지나도 지속적인 이해를 유지할 수 있도록 합니다. 단순히 청크 매칭(RAG)을 넘어 엔티티가 진화함에 따라 결론을 도출하고 추론합니다.

작동 방식

Honcho는 "peers"(사람 또는 AI)를 중심으로 데이터를 구성하는 FastAPI 서버(관리형 또는 셀프 호스팅)로 작동합니다. 시스템은 다음과 같은 특정 루프를 따릅니다:

  1. Store: 대화, 이벤트 및 문서는 세션 내의 메시지로 저장됩니다.
  2. Reason: 백그라운드 프로세스(the deriver)가 이러한 메시지를 비동기적으로 분석하여 peer 표현을 업데이트합니다.
  3. Query: 사용자는 채팅 엔드포인트를 통해 이러한 표현을 쿼리하거나, 하이브리드 검색(BM25 + vector)을 사용하여 특정 정보를 검색하거나, 프롬프트 준비가 된 컨텍스트를 가져올 수 있습니다.
  4. Inject: 결과로 나온 컨텍스트나 통찰력은 모든 LLM 호출 또는 에이전트 프레임워크에 주입됩니다.

대상 사용자

  • 장기 메모리와 높은 유지력을 필요로 하는 AI 에이전트를 구축하는 개발자.

  • 에이전트가 서로 다른 peer 간의 관계와 관점을 이해해야 하는 멀티 에이전트 시스템을 구축하는 팀.

  • MCP-호환 클라이언트(Claude Code, Cursor 또는 Windsurf와 같은)를 사용하며 코딩 에이전트를 위한 지속적인 메모리를 원하는 사용자.

주요 특징

  • Reasoning-first memory: 단순히 텍스트 청크를 검색하는 대신 연역적 및 귀납적 결론을 추출합니다.
  • Peer-centric model: 엔티티(사용자, 에이전트, 아이디어)와 그것이 시간이 지남에 따라 어떻게 변하는지 추적합니다.
  • Multi-peer perspective: 특정 peer가 다른 peer에 대해 무엇을 알고 있는지 모델링할 수 있습니다.
  • Broad Integration: MCP, Claude Code, OpenCode, OpenClaw, 그리고 Hermes를 지원합니다.
  • Flexible Deployment: 관리형 서비스 또는 Docker를 통한 셀프 호스팅이 가능합니다.

Sources