Open-Generative-AI: 一个具有本地推理和多模型支持的、不受限制的 AI 视频平台开源替代方案

Open-Generative-AI: 一个具有本地推理和多模型支持的、不受限制的 AI 视频平台开源替代方案

它解决了什么问题

Open Generative AI 是一个开源、不受限制的、用于替代专有 AI 视频和图像平台的方案。它提供了一个统一的界面来访问超过 200 种最先进的生成式模型，且没有内容过滤器、订阅费用或供应商锁定，从而实现了完全的创作自由。

它是如何工作的

该项目提供了一个桌面应用程序（适用于 macOS、Windows 和 Linux）以及一个托管的 Web 版本。它主要通过 MuAPI 集成来访问大量的云端模型，但桌面应用也通过两个引擎支持本地推理：

sd.cpp: 一个捆绑的 C++ 引擎，用于在 Metal GPU (Apple Silicon)、CUDA、Vulkan 或 ROCm 上本地运行 SD 1.5、SDXL 和 Z-Image 等图像模型。
Wan2GP: 一个远程 Gradio 服务器客户端，允许用户将沉重的视频和图像模型（如 Flux 和 Wan 2.2）卸载到另一台配备 GPU 的机器上。

它是为谁设计的

它专为数字艺术家、电影制作人和 AI 创作者设计，这些创作者希望拥有一个不受限制的环境，通过使用多种模型和专业的摄像机控制功能来生成图像、视频和对口型内容。

亮点

多工作室界面: 为图像、视频、对口型 (Lip Sync)、电影 (Cinema，带有专业摄像机控制) 和工作流 (Workflows) 提供专用工作室。
不受限制的生成: 没有内容过滤器或提示词拒绝。
海量模型支持: 访问包括 Flux、Midjourney、Kling、Sora 和 Veo 在内的 200 多种模型。
本地推理: 能够本地运行特定模型以维护数据隐私并避免 API 成本。
高级图像控制: 对于兼容的图生图 (image-to-image) 模型，支持多达 14 张参考图像。
可视化工作流构建器: 一个基于节点的编辑器，用于将图像、视频和音频模型链接成自动化流水线。

Sources

undefinedAnil-matcha/Open-Generative-AI