ComfyUI-LTXVideo:用於進階 LTX-2 影片生成與音訊合成的自訂 ComfyUI 節點
ComfyUI-LTXVideo:用於進階 LTX-2 影片生成與音訊合成的自訂 ComfyUI 節點
解決的問題
此專案提供一套自訂節點與工作流程,讓 ComfyUI 能夠發揮 LTX-2 影片生成模型的全部潛能。它在核心的 ComfyUI LTX-2 整合基礎上,加入了針對高動態範圍(HDR)影片、精確的動作與結構控制,以及音訊生成的專業工具。
工作原理
它以插件形式整合至 ComfyUI,提供與 LTX-2 以及各種專用 LoRA(低秩適應)互動的節點。這些 LoRA 使模型能執行特定任務,例如口型同步、空間升級,或依據深度與邊緣圖進行控制。專案亦包含一個專屬的純音訊模式,利用 LTX-2 的音訊/影片聯合 Transformer 架構,從文字產生聲音。
目標使用者
內容創作者、AI 影片藝術家,以及使用 ComfyUI 且希望對 LTX-2 影片生成擁有進階控制的開發者,尤其是需要專業級 HDR 輸出與生成式升級的使用者。
重點特色
- Union IC-LoRA:單一統一的 LoRA,可同時處理深度與邊緣(canny)控制條件。
- HDR 影片:支援以 ARRI LogC3 編碼的線性 HDR 輸出,並具備 EXR 匯出功能。
- Lipdub:專為多語言配音與重述語音而設計的 LoRA,能在保留說話者身份的同時進行口型同步。
- 生成式升級:像素空間升級 LoRA,能在 2 倍或 4 倍解析度下合成全新細節,而非僅僅插值。
- 文字轉音訊:可在純音訊模式下使用模型,根據文字提示產生音訊。
摘要
一套自訂的 ComfyUI 節點與工作流程,為 LTX-2 影片生成模型加入 HDR 輸出、口型同步與生成式升級等功能。
標題
ComfyUI-LTXVideo:用於進階 LTX-2 影片生成與音訊合成的自訂 ComfyUI 節點
Sources
- undefinedLightricks/ComfyUI-LTXVideo