semantic-router: 一個使用語義向量空間進行路由,為 LLMs 和 agents 提供超快速決策層的工具
semantic-router: 一個使用語義向量空間進行路由,為 LLMs 和 agents 提供超快速決策層的工具
它解決了什麼問題
Semantic Router 為 LLMs 和 AI agents 提供了一個高速決策層。它消除了等待緩慢的 LLM 生成來決定使用哪個工具或如何路由請求的需求,從而降低延遲並縮短回應時間。
運作原理
該專案不使用 LLM 來分類查詢,而是使用語義向量空間。它允許開發者定義包含一組範例語句的 Route 物件。當使用者查詢到達時,該專案會將查詢編碼為向量,並將其與路由的語句進行比較,以根據語義意義來確定最合適的路徑。
對象是誰
正在構建 LLM 驅動的應用程式和 AI agents 的開發者,他們需要一種快速、高效的方式來處理意圖分類和請求路由,而無需依賴昂貴或緩慢的 LLM 調用。
重點特性
- 快速決策:使用向量嵌入(vector embeddings)而非 LLM 生成來進行路由決策。
- 靈活的編碼器:支援多種嵌入提供者,包括 Cohere、OpenAI、Hugging Face 和 FastEmbed。
- 本地執行:能夠使用
HuggingFaceEncoder和LlamaCppLLM執行完全本地的版本。 - 向量資料庫整合:與 Pinecone 和 Qdrant 整合,用於管理語句向量空間。
- 多模態支援:能夠根據多模態輸入(例如識別圖像)進行路由。
- Agent 框架整合:可與 LangChain Agents 協作工作。
Sources
- undefinedaurelio-labs/semantic-router