agentic-rag-for-dummies

agentic-rag-for-dummies: それが何か、解決する問題、そして注目を集めている理由

解決する課題

このプロジェクトは、Agentic RAG(Retrieval‑Augmented Generation) システムを構築するためのモジュラーなフレームワークを提供します。基本的な RAG チュートリアルの限界を克服し、複雑なクエリに対応し、会話履歴を保持し、ユーザー入力が曖昧な場合に人間が介入して明確化できる、実運用レベルのアーキテクチャを実現します。

仕組み

システムは LangGraph によってオーケストレーションされた 4 段階のインテリジェントワークフローを使用します。

  1. 会話理解: ローリングサマリーと履歴を維持し、コンテキストを保持しつつ LLM のメモリ負荷を抑えます。
  2. クエリ明確化: 曖昧なクエリを書き換え、複数部分からなる質問をサブクエリに分割し、必要に応じてユーザーに詳細を尋ねて一時停止します。
  3. インテリジェント検索: "Map‑Reduce" アプローチを採用し、各サブクエリごとに並列エージェントを生成します。エージェントは精度のために小さな "child chunks" を検索し、全体のコンテキストのために大きな "parent chunks" を取得します。初回結果が不十分な場合は自己修正機能が組み込まれています。
  4. 応答生成: すべての並列エージェントの結果を集約し、最終的な一貫した回答を生成します。

対象者

  • 開発者: 基本的な RAG から、より高度なエージェント駆動型検索システムへステップアップしたい方。
  • AI エンジニア: 複数の LLM プロバイダー(Ollama、OpenAI、Anthropic、Google)に対応したモジュラーテンプレートが欲しい方。
  • 学習者: インタラクティブなノートブックと体系的な実装手順を通じて Agentic RAG を学びたい方。

ハイライト

  • 階層型インデックス: 小さなチャンクで検索精度を高め、大きなチャンクで生成コンテキストを提供。
  • マルチエージェント Map‑Reduce: 複雑で多部構成のクエリを並列処理。
  • 自己修正: 初回検索で十分な情報が得られなかった場合に自動で再検索。
  • プロバイダー非依存: Ollama を使ったローカルモデルや主要クラウドプロバイダーの API と連携可能。
  • 可観測性と評価: Langfuse と連携してトラッキング、RAGAS で品質指標を測定。

要約: LangGraph を用いたモジュラー Agentic RAG フレームワークで、階層型インデックス、マルチエージェント並列検索、人間が介在するクエリ明確化を実装しています。

タイトル: agentic-rag-for-dummies: それが何か、解決する問題、そして注目を集めている理由

Sources