agentic-rag-for-dummies: それが何か、解決する問題、そして注目を集めている理由

解決する課題

このプロジェクトは、Agentic RAG（Retrieval‑Augmented Generation） システムを構築するためのモジュラーなフレームワークを提供します。基本的な RAG チュートリアルの限界を克服し、複雑なクエリに対応し、会話履歴を保持し、ユーザー入力が曖昧な場合に人間が介入して明確化できる、実運用レベルのアーキテクチャを実現します。

仕組み

システムは LangGraph によってオーケストレーションされた 4 段階のインテリジェントワークフローを使用します。

会話理解: ローリングサマリーと履歴を維持し、コンテキストを保持しつつ LLM のメモリ負荷を抑えます。
クエリ明確化: 曖昧なクエリを書き換え、複数部分からなる質問をサブクエリに分割し、必要に応じてユーザーに詳細を尋ねて一時停止します。
インテリジェント検索: "Map‑Reduce" アプローチを採用し、各サブクエリごとに並列エージェントを生成します。エージェントは精度のために小さな "child chunks" を検索し、全体のコンテキストのために大きな "parent chunks" を取得します。初回結果が不十分な場合は自己修正機能が組み込まれています。
応答生成: すべての並列エージェントの結果を集約し、最終的な一貫した回答を生成します。

対象者

開発者: 基本的な RAG から、より高度なエージェント駆動型検索システムへステップアップしたい方。
AI エンジニア: 複数の LLM プロバイダー（Ollama、OpenAI、Anthropic、Google）に対応したモジュラーテンプレートが欲しい方。
学習者: インタラクティブなノートブックと体系的な実装手順を通じて Agentic RAG を学びたい方。

ハイライト

階層型インデックス: 小さなチャンクで検索精度を高め、大きなチャンクで生成コンテキストを提供。
マルチエージェント Map‑Reduce: 複雑で多部構成のクエリを並列処理。
自己修正: 初回検索で十分な情報が得られなかった場合に自動で再検索。
プロバイダー非依存: Ollama を使ったローカルモデルや主要クラウドプロバイダーの API と連携可能。
可観測性と評価: Langfuse と連携してトラッキング、RAGAS で品質指標を測定。

要約: LangGraph を用いたモジュラー Agentic RAG フレームワークで、階層型インデックス、マルチエージェント並列検索、人間が介在するクエリ明確化を実装しています。

タイトル: agentic-rag-for-dummies: それが何か、解決する問題、そして注目を集めている理由

agentic-rag-for-dummies

agentic-rag-for-dummies: それが何か、解決する問題、そして注目を集めている理由

解決する課題

仕組み

対象者

ハイライト

Sources