llm-wiki-agent: それが何か、解決する問題、そして注目を集めている理由

llm-wiki-agent: それが何か、解決する問題、そして注目を集めている理由

解決する課題

LLM Wiki Agent は、未加工の文書コレクションを構造化された相互リンク wiki に変換するコーディングエージェントスキルです。従来の RAG(Retrieval‑Augmented Generation)システムがクエリごとに知識を再取得するのとは異なり、このツールは知識を永続的な markdown ページにコンパイルし、時間とともに蓄積・統合され、クロスリファレンスの自動処理や情報源間の矛盾のフラグ付けを行います。

仕組み

このシステムは、CLAUDE.mdAGENTS.md のようなスキーマファイルとして提供される一連の指示として機能し、コーディングエージェント(Claude Code、Codex、Gemini CLI など)にローカルの markdown ディレクトリを管理させます。

  • 取り込み: ソース文書を読み込み(PDF、DOCX、PPTX などの非 markdown ファイルは markitdown で変換)、知識を抽出してエンティティページ(人物、企業)、コンセプトページ(アイデア、フレームワーク)、そしてライブな概要ページを作成します。
  • 合成: wiki 全体の情報を統合してクエリに回答し、必要に応じてその回答を新しい合成ページとして保存できます。
  • ナレッジグラフ: NetworkX と vis.js を用いて graph.html ビジュアライゼーションを生成し、明示的な [[wikilinks]] と推論されたセマンティック関係の両方をマッピングします。
  • メンテナンス: "lint" コマンドで孤立ページ、壊れたリンク、データの欠損を検出します。

対象ユーザー

  • 研究者: 数週間にわたって論文やレポートの構造化されたリファレンスを構築したい方。
  • 読者: 本の登場人物、テーマ、議論を追跡したい方。
  • ナレッジワーカー: 会議の文字起こしやプロジェクト文書から個人のナレッジベースやビジネスインテリジェンスを維持したい方。
  • アナリスト: 企業や技術を時間軸で追跡し、競合分析を行いたい方。

ハイライト

  • 永続的な知識: 知識はプレーンな markdown に保存され、Obsidian などのツールと互換性があります。
  • 自動構造化: 手動で書くことなくエンティティやコンセプトページを自動生成します。
  • キャップストーン合成: 取り込み時に情報源間の矛盾をフラグ付けします。
  • マルチフォーマット対応: PDF、DOCX、XLSX、EPUB など多様な形式を取り込みます。
  • ビジュアルナレッジグラフ: コミュニティ検出によるトピッククラスタリングを備えたインタラクティブな HTML ビジュアライゼーションを提供します。

Sources