agentic-rag-for-dummies

agentic-rag-for-dummies: 它是什么、解决了什么问题以及为何受到关注

它解决了什么

该项目提供了一个用于构建 Agentic RAG（检索增强生成） 系统的模块化框架。它通过提供生产就绪的架构来克服基础 RAG 教程的局限，能够处理复杂查询、维护对话历史，并在用户输入模糊时允许人工介入进行澄清。

工作原理

系统使用由 LangGraph 编排的四阶段智能工作流：

对话理解：维护滚动摘要和历史，以在不超出 LLM 记忆限制的情况下保留上下文。
查询澄清：改写模糊查询，将多部分问题拆分为子查询，并在必要时暂停向用户请求更多细节。
智能检索：采用 “Map‑Reduce” 方法，为每个子查询生成并行代理。这些代理在小的 “子块” 中搜索以获得精确度，在大的 “父块” 中检索以获取完整上下文，并在初始结果不足时内置自我纠正。
响应生成：将所有并行代理的发现汇总，生成最终连贯的答案。

适用人群

开发者：希望超越基础 RAG，构建更复杂、基于代理的检索系统。
AI 工程师：需要支持多种 LLM 提供商（Ollama、OpenAI、Anthropic、Google）的模块化模板。
学习者：想通过交互式笔记本和结构化实现路径了解 Agentic RAG。

亮点

层次化索引：结合小块用于检索精度和大块用于生成上下文。
多代理 Map‑Reduce：通过并行处理来应对复杂的多部分查询。
自我纠正：如果首次检索未找到足够信息，会自动重新查询。
提供商无关：可使用 Ollama 本地模型或主要云提供商的 API。
可观测性与评估：集成 Langfuse 进行追踪，使用 RAGAS 进行质量度量。

Sources

undefinedGiovanniPasq/agentic-rag-for-dummies