OneTrainer: 幅広い拡散モデルのトレーニングとファインチューニングのためのワンストップソリューション
OneTrainer: 幅広い拡散モデルのトレーニングとファインチューニングのためのワンストップソリューション
何を解決するか
OneTrainerは、拡散モデルのトレーニングとファインチューニングのための包括的なオールインワンソリューションを提供します。データセットの準備、トレーニングランの管理、モデル形式の変換プロセスを簡素化し、複数の異なるツールを切り替える必要性を排除します。
仕組み
このソフトウェアは、トレーニングパイプラインを管理するために、グラフィカルユーザーインターフェース (GUI) とコマンドラインインターフェース (CLI) の両方を提供します。FLUX.1、Stable Diffusion 1.5から3.5、およびHunyuan Videoを含む幅広い拡散モデルと、フルファインチューニング、LoRA、およびembeddingsといった複数のトレーニング方法をサポートしています。データセットの準備を効率化するために、自動キャプション作成 (BLIP、BLIP2、およびWD-1.4経由) とマスク作成 (ClipSegまたはRembg経由) の組み込みツールが含まれています。
対象ユーザー
高度なコーディング知識を必要とせずに、トレーニングプロセスを高い精度で制御しながら、画像およびビデオ生成モデルをファインチューニングしたいAIアーティストや開発者向けに設計されています。
ハイライト
- 幅広いモデルサポート: SDXL、Stable Cascade、およびPixArtを含む広範なモデルと互換性があります。
- 柔軟なトレーニング: フルファインチューニング、LoRA、およびembeddingsをサポートし、マスク付きトレーニングやマルチレゾリューション・トレーニングのオプションを提供します。
- データセット・ツール: 統合された自動キャプション作成およびマスク生成ツール。
- 統合されたサンプリング: トレーニング中にUI内で直接モデルをサンプリングして、進捗を監視する機能。
- トレーニングの最適化: アスペクト比バケツ化 (aspect ratio bucketing)、EMA (Exponential Moving Average) サポート、およびノイズスケジューラーのリスケーリング機能を備えています。
Sources
- undefinedNerogar/OneTrainer