comfyui_LLM_party: 複雑なLLMおよびエージェント的ワークフローを構築するためのComfyUIノードの包括的なスイート
comfyui_LLM_party: 複雑なLLMおよびエージェント的ワークフローを構築するためのComfyUIノードの包括的なスイート
何を解決するか
ComfyUI LLM Partyは、ComfyUIエコシステム内でLLMワークフローを構築するための包括的なノードセットを提供します。これにより、大規模言語モデルと画像生成ワークフローの間のギャップを埋め、ユーザーがAIアシスタント、RAGシステム、および複雑なエージェント的挙動を視覚的なノードベースの環境に直接統合できるようにします。
仕組み
このプロジェクトは、複数のモデル読み込み方法をサポートするさまざまなComfyUIカスタムノードを実装しています:
- APIベース:
oneapiまたはaisuiteを介して、OpenAI互換API、Azure OpenAI、Grok、およびその他多数をサポートします。 - ローカル読み込み:
transformerライブラリから直接モデルを読み込むこと、llama-cpp-pythonを介したGGUF形式、およびOllamaを通じたローカルホスティングをサポートします。 - VLM統合: 画像からテキストへのタスクのために、Llama-3.2-Vision や Qwen2.5-VL のようなVision-Language Models (VLMs) のサポートを含みます。
Stable Diffusion用の単純なプロンプト生成から、複雑なエージェント間相互作用モード(radialおよびring)や、DiscordおよびFeishuのようなソーシャルアプリとの統合まで、あらゆるものの構築を可能にします。
対象ユーザー
- ComfyUIユーザー who want to integrate LLMs into their image generation pipelines.
- AI研究者および学生 who need a visual interface for parameter debugging and model adaptation.
- ストリーミングメディアワーカー who require a one-stop LLM + TTS + ComfyUI workflow.
- 開発者 who are building localized industry knowledge bases using RAG and GraphRAG.
ハイライト
- 幅広いモデルサポート: GGUFやtransformerベースのLLM/VLMsを含む、膨大な数のAPIおよびローカルモデルと互換性があります。
- エージェント的ワークフロー: マルチツール呼び出し、ロール設定、および複雑なエージェント相互作用パターンをサポートします。
- 高度なRAG: 知識ベース管理のために、業界特化型の単語ベクトルRAGおよびGraphRAGを実装しています。
- MCPツール: 拡張されたツール機能のために、外部MCPサーバーに接続するためのModel Context Protocol (MCP) との統合。
- ストリーミング出力: API呼び出し時のコンソールでのリアルタイムテキスト表示。
Sources
- undefinedheshengtao/comfyui_LLM_party