rag-web-ui：它是什麼、解決了什麼問題以及為何受到關注

它解決了什麼

RAG Web UI 提供了一套完整的系統，讓使用者能夠基於私有知識庫建構智慧問答服務。它解決了讓大型語言模型（LLM）在回答時能夠依據使用者提供的特定文件，而非僅僅依賴模型的通用訓練資料，從而提供準確且可靠的答案的問題。

系統使用檢索增強生成（Retrieval‑Augmented Generation，RAG）流程：

文件匯入：使用者上傳文件（PDF、DOCX、Markdown、Text），這些文件會被存放在 MinIO 中。系統隨後會非同步抽取文字、切分成區塊，並透過嵌入服務將這些區塊轉換為向量。
儲存：這些向量會存入向量資料庫（ChromaDB 或 Qdrant）。
查詢流程：當使用者提出問題時，系統會先將問題嵌入，從向量資料庫中檢索出最相關的文件區塊，使用 Cross‑Encoder 重新排序，然後將組合好的上下文傳給 LLM 產生最終回應。
整合：支援多種 LLM 供應商（OpenAI、DeepSeek、MiniMax，以及透過 Ollama 的本地模型），並提供 OpenAPI 介面供外部存取。

此專案適合想要部署私有、以文件為基礎的 AI 聊天系統且具備友善網頁介面的使用者，也適合尋找 RAG 架構參考實作的開發者。

一個智慧對話系統，讓使用者透過檢索增強生成（RAG）將自有文件知識庫與 LLM 結合，打造客製化的問答服務。

rag-web-ui：它是什麼、解決了什麼問題以及為何受到關注