OpenKB

OpenKB:それが何か、解決する問題、そして注目を集めている理由

解決する課題

OpenKB は、断片的で生のドキュメントを構造化された相互リンクされたウィキ形式のナレッジベースに変換します。従来の RAG がクエリごとにゼロから情報を取得するのとは異なり、OpenKB は知識を永続的で進化し続けるウィキに蓄積し、時間とともに情報が蓄積されるため、生データから洞察を何度も再抽出する必要が減ります。

仕組み

OpenKB は ウィキ基盤ジェネレータ の二層アーキテクチャを採用しています。

  1. ウィキ基盤:PDF、Word、PowerPoint など様々なファイル形式を Markdown に変換します。20 ページ以上の長文ドキュメントについては、全文を読み込む代わりに PageIndex を用いて階層的なツリーインデックスを作成します。その後、LLM がこれらのドキュメントを要約、概念ページ、エンティティページ(人物、組織、場所、製品)にまとめ、相互リンクを付与します。
  2. ジェネレータ:作成されたウィキを基盤として、クエリへの根拠付き回答、インタラクティブチャット、3D ナレッジグラフ、HTML スライドデッキなどの出力を生成します。

対象ユーザー

大量かつ複雑なドキュメントを管理し、Obsidian などのツールと統合できる永続的で構造化されたナレッジベースを必要とするユーザー向けに設計されています。また、特化型 AI エージェントの動力源としても利用できます。

ハイライト

  • ベクトルレス検索:長文ドキュメントに対してはベクトルデータベースではなく、PageIndex による推論ベースのツリーインデックスを使用します。
  • 引用と統合:複数ドキュメント間の要約と相互参照を自動生成します。
  • スキルファクトリー:ウィキから知識を抽出し、Claude Code、Codex、Gemini CLI で利用できるポータブルエージェントスキルに変換します。
  • Obsidian 互換性:ウィキはプレーンな Markdown ファイルと wikilink で保存され、Obsidian のグラフビューとネイティブに連携します。
  • マルチモーダリティ:図表や画像の取得・理解が可能です。

要約

OpenKB は、LLM を活用して生のドキュメントを構造化された相互リンクウィキ形式のナレッジベースにコンパイルするオープンソース CLI システムです。永続的な知識蓄積と推論ベースの検索を実現します。

タイトル

OpenKB:それが何か、解決する問題、そして注目を集めている理由

Sources