Open-Generative-AI: 一个具有本地推理和多模型支持的、不受限制的 AI 视频平台开源替代方案
Open-Generative-AI: 一个具有本地推理和多模型支持的、不受限制的 AI 视频平台开源替代方案
它解决了什么问题
Open Generative AI 是一个开源、不受限制的、用于替代专有 AI 视频和图像平台的方案。它提供了一个统一的界面来访问超过 200 种最先进的生成式模型,且没有内容过滤器、订阅费用或供应商锁定,从而实现了完全的创作自由。
它是如何工作的
该项目提供了一个桌面应用程序(适用于 macOS、Windows 和 Linux)以及一个托管的 Web 版本。它主要通过 MuAPI 集成来访问大量的云端模型,但桌面应用也通过两个引擎支持本地推理:
- sd.cpp: 一个捆绑的 C++ 引擎,用于在 Metal GPU (Apple Silicon)、CUDA、Vulkan 或 ROCm 上本地运行 SD 1.5、SDXL 和 Z-Image 等图像模型。
- Wan2GP: 一个远程 Gradio 服务器客户端,允许用户将沉重的视频和图像模型(如 Flux 和 Wan 2.2)卸载到另一台配备 GPU 的机器上。
它是为谁设计的
它专为数字艺术家、电影制作人和 AI 创作者设计,这些创作者希望拥有一个不受限制的环境,通过使用多种模型和专业的摄像机控制功能来生成图像、视频和对口型内容。
亮点
- 多工作室界面: 为图像、视频、对口型 (Lip Sync)、电影 (Cinema,带有专业摄像机控制) 和工作流 (Workflows) 提供专用工作室。
- 不受限制的生成: 没有内容过滤器或提示词拒绝。
- 海量模型支持: 访问包括 Flux、Midjourney、Kling、Sora 和 Veo 在内的 200 多种模型。
- 本地推理: 能够本地运行特定模型以维护数据隐私并避免 API 成本。
- 高级图像控制: 对于兼容的图生图 (image-to-image) 模型,支持多达 14 张参考图像。
- 可视化工作流构建器: 一个基于节点的编辑器,用于将图像、视频和音频模型链接成自动化流水线。
Sources
- undefinedAnil-matcha/Open-Generative-AI