OneTrainer: 다양한 확산 모델(diffusion models)을 학습시키고 미세 조정하기 위한 원스톱 솔루션

OneTrainer: 다양한 확산 모델(diffusion models)을 학습시키고 미세 조정하기 위한 원스톱 솔루션

해결하는 문제

OneTrainer는 확산 모델을 학습시키고 미세 조정하기 위한 포괄적이고 올인원 솔루션입니다. 데이터셋 준비, 학습 실행 관리 및 모델 형식 변환 프로세스를 단순화하여 여러 이질적인 도구 사이를 전환할 필요가 없도록 합니다.

작동 방식

이 소프트웨어는 학습 파이프라인을 관리하기 위해 그래픽 사용자 인터페이스(GUI)와 명령줄 인터페이스(CLI)를 모두 제공합니다. FLUX.1, Stable Diffusion 1.5부터 3.5, 그리고 Hunyuan Video를 포함한 광범위한 확산 모델을 지원하며, full fine-tuning, LoRA, 그리고 embeddings와 같은 다양한 학습 방법론을 지원합니다. 또한 데이터셋 준비를 간소화하기 위해 자동 캡셔닝(BLIP, BLIP2, WD-1.4를 통해) 및 마스크 생성(ClipSeg 또는 Rembg를 통해)을 위한 내장 도구를 포함하고 있습니다.

대상 사용자

광범위한 코딩 지식 없이도 학습 프로세스에 대해 높은 수준의 제어력을 가지며 이미지 및 비디오 생성 모델을 미세 조정하고자 하는 AI 아티스트와 개발자를 위해 설계되었습니다.

주요 특징

  • 광범위한 모델 지원: SDXL, Stable Cascade, PixArt를 포함한 방대한 범위의 모델과 호환됩니다.
  • 유연한 학습: masked training 및 multi-resolution training 옵션을 제공하며 full fine-tuning, LoRA, 그리고 embeddings를 지원합니다.
  • 데이터셋 도구: 통합된 자동 캡셔닝 및 마스크 생성 도구.
  • 통합 샘플링: 학습 중 진행 상황을 모니터링하기 위해 UI 내에서 모델을 직접 샘플링할 수 있는 기능.
  • 학습 최적화: aspect ratio bucketing, EMA (Exponential Moving Average) 지원, 그리고 noise scheduler rescaling 기능을 제공합니다.

Sources