honcho: とは何なのか、どのような問題を解決し、なぜ注目を集めているのか

honcho: とは何なのか、どのような問題を解決し、なぜ注目を集めているのか

解決する問題

Honchoは、ステートフルなAIエージェントのためのメモリインフラストラクチャを提供し、人間、他のエージェント、グループ、プロジェクトについての永続的な理解を時間の経過とともに維持することを可能にします。単なるチャンクマッチング（RAG）を超え、エンティティが進化するにつれて、結論や推論を抽出します。

仕組み

Honchoは、FastAPIサーバー（マネージドまたはセルフホスト）として動作し、「peers」（人間またはAI）を中心にデータを整理します。システムは特定のループに従います：

Store: 会話、イベント、ドキュメントは、セッション内のメッセージとして保存されます。
Reason: バックグラウンドプロセス（the deriver）が、これらのメッセージを非同期的に分析して、peerの表現を更新します。
Query: ユーザーは、チャットエンドポイントを介してこれらの表現をクエリしたり、ハイブリッド検索（BM25 + vector）を使用して特定の情報を検索したり、プロンプトに即したコンテキストを抽出したりできます。
Inject: 得られたコンテキストや洞察は、あらゆるLLMコールやエージェントフレームワークに注入されます。

対象ユーザー

長期的なメモリと高い保持能力を必要とするAIエージェントを構築している開発者。
エージェントが異なるpeers間の関係や視点を理解する必要があるマルチエージェントシステムを作成しているチーム。
コーディングエージェントに永続的なメモリを持たせたい、MCP互換クライアント（Claude Code, Cursor, または Windsurf）のユーザー。

ハイライト

Reasoning-first memory: テキストチャンクを単に取得するのではなく、演繹的および帰納的な結論を抽出します。
Peer-centric model: エンティティ（ユーザー、エージェント、アイデア）と、それらが時間の経過とともにどのように変化するかを追跡します。
Multi-peer perspective: 特定のpeerが他のpeerについて何を知っているかをモデル化できます。
Broad Integration: MCP, Claude Code, OpenCode, OpenClaw, および Hermesをサポートしています。
Flexible Deployment: マネージドサービス、またはDockerを介したセルフホストが可能です。

Sources

undefinedplastic-labs/honcho