agentic-rag-for-dummies

agentic-rag-for-dummies: 它是什么、解决了什么问题以及为何受到关注

它解决了什么

该项目提供了一个用于构建 Agentic RAG(检索增强生成) 系统的模块化框架。它通过提供生产就绪的架构来克服基础 RAG 教程的局限,能够处理复杂查询、维护对话历史,并在用户输入模糊时允许人工介入进行澄清。

工作原理

系统使用由 LangGraph 编排的四阶段智能工作流:

  1. 对话理解:维护滚动摘要和历史,以在不超出 LLM 记忆限制的情况下保留上下文。
  2. 查询澄清:改写模糊查询,将多部分问题拆分为子查询,并在必要时暂停向用户请求更多细节。
  3. 智能检索:采用 “Map‑Reduce” 方法,为每个子查询生成并行代理。这些代理在小的 “子块” 中搜索以获得精确度,在大的 “父块” 中检索以获取完整上下文,并在初始结果不足时内置自我纠正。
  4. 响应生成:将所有并行代理的发现汇总,生成最终连贯的答案。

适用人群

  • 开发者:希望超越基础 RAG,构建更复杂、基于代理的检索系统。
  • AI 工程师:需要支持多种 LLM 提供商(Ollama、OpenAI、Anthropic、Google)的模块化模板。
  • 学习者:想通过交互式笔记本和结构化实现路径了解 Agentic RAG。

亮点

  • 层次化索引:结合小块用于检索精度和大块用于生成上下文。
  • 多代理 Map‑Reduce:通过并行处理来应对复杂的多部分查询。
  • 自我纠正:如果首次检索未找到足够信息,会自动重新查询。
  • 提供商无关:可使用 Ollama 本地模型或主要云提供商的 API。
  • 可观测性与评估:集成 Langfuse 进行追踪,使用 RAGAS 进行质量度量。

Sources