comfyui_LLM_party: 用于构建复杂 LLM 和智能体工作流的 ComfyUI 节点综合套件
comfyui_LLM_party: 用于构建复杂 LLM 和智能体工作流的 ComfyUI 节点综合套件
它解决了什么问题
ComfyUI LLM Party 为在 ComfyUI 生态系统中构建 LLM 工作流提供了一套全面的节点。它弥补了大语言模型与图像生成工作流之间的鸿沟,允许用户直接在其基于节点的视觉环境中集成 AI 助手、RAG 系统和复杂的智能体行为。
工作原理
该项目为 ComfyUI 实现了一系列自定义节点,支持多种模型加载方式:
- 基于 API: 支持通过
oneapi或aisuite使用 OpenAI 兼容的 API、Azure OpenAI、Grok 以及其他各种 API。 - 本地加载: 支持直接从 transformer 库加载模型,通过
llama-cpp-python加载 GGUF 格式模型,以及通过 Ollama 进行本地托管。 - VLM 集成: 包括对 Llama-3.2-Vision 和 Qwen2.5-VL 等视觉语言模型 (VLMs) 的支持,用于图像转文本任务。
它能够构建从简单的 Stable Diffusion 提示词生成到复杂的智能体-智能体交互模式(径向和环形)以及与 Discord 和 Feishu 等社交应用的集成。
适用人群
- ComfyUI 用户,希望将 LLM 集成到其图像生成流水线中。
- AI 研究人员和学生,需要一个用于参数调试和模型适配的视觉界面。
- 流媒体从业者,需要一站式的 LLM + TTS + ComfyUI 工作流。
- 开发者,使用 RAG 和 GraphRAG 构建本地化行业知识库。
亮点
- 广泛的模型支持: 兼容大量 API 和本地模型,包括 GGUF 和基于 transformer 的 LLMs/VLMs。
- 智能体工作流: 支持多工具调用、角色设置和复杂的智能体交互模式。
- 高级 RAG: 实现针对特定行业的词向量 RAG 和 GraphRAG,用于知识库管理。
- MCP 工具化: 与 Model Context Protocol (MCP) 集成,以连接到外部 MCP 服务器以扩展工具能力。
- 流式输出: API 调用时在控制台中进行实时文本显示。
Sources
- undefinedheshengtao/comfyui_LLM_party