agentic-rag-for-dummies
agentic-rag-for-dummies:它是什麼、解決了什麼問題以及為何受到關注
它解決了什麼
此專案提供一個模組化框架,用於構建 Agentic RAG(檢索增強生成) 系統。它針對基本 RAG 教學的限制,提供可投入生產環境的架構,能處理複雜查詢、保留對話歷史,並在使用者輸入含糊時允許人機互動以釐清需求。
它如何運作
系統使用由 LangGraph 協調的四階段智慧工作流程:
- 對話理解:維持滾動摘要與歷史,以保留上下文而不會超出 LLM 的記憶限制。
- 查詢釐清:改寫含糊的查詢,將多部份問題拆分為子查詢,必要時暫停並請使用者提供更多細節。
- 智慧檢索:採用「Map‑Reduce」方式,為每個子查詢產生平行代理。這些代理在小的「子區塊」中搜尋以提升精確度,並在較大的「父區塊」中取得完整上下文,若初始結果不足,會自動進行自我校正。
- 回應生成:將所有平行代理的發現彙總,產生最終一致的答案。
目標對象
- 開發者:想要超越基礎 RAG,構建更複雜、以代理為核心的檢索系統。
- AI 工程師:需要支援多種 LLM 供應商(Ollama、OpenAI、Anthropic、Google)的模組化範本。
- 學習者:希望透過互動筆記本與結構化實作路徑,了解 Agentic RAG 的概念。
重點特色
- 階層式索引:結合小區塊以提升搜尋精度,並使用大區塊提供生成所需的完整上下文。
- 多代理 Map‑Reduce:透過平行處理,應對複雜且多部份的查詢。
- 自我校正:若首次檢索未取得足夠資訊,系統會自動重新查詢。
- 供應商無關:可使用 Ollama 本地模型或主要雲端供應商的 API。
- 可觀測性與評估:整合 Langfuse 以追蹤流程,並使用 RAGAS 進行品質指標評估。
摘要: 使用 LangGraph 的模組化 Agentic RAG 框架,實作階層式索引、多代理平行檢索與人機互動查詢釐清。
標題: agentic-rag-for-dummies:它是什麼、解決了什麼問題以及為何受到關注
Sources
- undefinedGiovanniPasq/agentic-rag-for-dummies