OneTrainer: 训练和微调多种扩散模型的全方位解决方案

OneTrainer: 训练和微调多种扩散模型的全方位解决方案

它解决了什么问题

OneTrainer 为训练和微调扩散模型提供了一个全面的、全方位的一站式解决方案。它简化了准备数据集、管理训练运行和转换模型格式的过程,消除了在多个不同的工具之间切换的需求。

工作原理

该软件提供图形用户界面 (GUI) 和命令行界面 (CLI) 来管理训练流程。它支持广泛的扩散模型(包括 FLUX.1、Stable Diffusion 1.5 到 3.5,以及 Hunyuan Video)和多种训练方法,如全量微调、LoRA 和 embeddings。它包含内置工具用于自动打标 (通过 BLIP、BLIP2 和 WD-1.4) 以及掩码创建 (通过 ClipSeg 或 Rembg) 以简化数据集准备工作。

适用人群

它专为 AI 艺术家和开发者设计,旨在让用户在无需大量编程知识的情况下,能够以高度的控制力来微调图像和视频生成模型。

亮点

  • 广泛的模型支持:兼容包括 SDXL、Stable Cascade 和 PixArt 在内的广泛模型。
  • 灵活的训练:支持全量微调、LoRA 和 embeddings,并提供掩码训练和多分辨率训练选项。
  • 数据集工具:集成了自动打标和掩码生成工具。
  • 集成采样:能够在训练期间直接在 UI 中对模型进行采样,以监控进度。
  • 训练优化:具备长宽比分桶 (aspect ratio bucketing)、EMA (Exponential Moving Average) 支持以及噪声调度器重缩放 (noise scheduler rescaling)。

Sources