transformerlab-app: AI 연구 도구와 클러스터 오케스트레이션을 통합하는 오픈 소스 머신러닝 플랫폼

transformerlab-app: AI 연구 도구와 클러스터 오케스트레이션을 통합하는 오픈 소스 머신러닝 플랫폼

해결하는 문제

Transformer Lab은 파편화된 AI 도구 환경을 통합하도록 설계되었습니다. ML 연구자가 로컬 머신, 온프레미스 클러스터, 클라우드 환경 전반에서 모델 학습, 미세 조정(fine-tuning), 추론 및 평가를 포함한 AI 모델의 전체 수명 주기를 관리할 수 있는 단일 인터페이스를 제공합니다.

작동 방식

이 플랫폼은 다양한 추론 엔진(vLLM, Ollama, MLX 등) 및 컴퓨팅 스케줄러(Slurm, SkyPilot 등)와 통합되는 컨트롤 플레인 역할을 합니다. Apple Silicon, NVIDIA, AMD GPU를 포함한 다양한 하드웨어 백엔드를 지원합니다. 개인 사용자의 경우 프라이버시를 위해 로컬에서 실행되며, 팀 단위의 경우 원격 노드에서 중앙 집중식 오케스트레이션, 실험 추적 및 대화형 컴퓨팅 세션(Jupyter, VSCode)을 제공합니다.

대상 사용자

다양한 하드웨어에서 학습 작업을 조정하고, 모델 레지스트리를 관리하며, 평가를 실행할 수 있는 간소화된 방법이 필요한 ML 연구자, 취미 활동가 및 AI 연구실을 위해 구축되었습니다.

주요 특징

  • 통합 AI 툴킷: 하나의 UI에서 LLM, Diffusion 모델, Text-to-Speech 모델 지원.
  • 협업 오케스트레이션: 체크포인트로부터의 자동 복구를 지원하며 Slurm 또는 SkyPilot 클러스터에 작업을 제출.
  • 포괄적인 학습: 전체 미세 조정(full fine-tuning), LoRA/QLoRA, RLHF (DPO, ORPO, SIMPO) 및 하이퍼파라미터 스윕(hyperparameter sweeps) 지원.
  • 내장된 평가: LLM-as-a-Judge, 안전성을 위한 레드팀(red teaming) 및 EleutherAI LM Evaluation Harness와의 통합 포함.
  • 확장 가능한 아키텍처: Python 플러그인 시스템과 Lab SDK를 통해 사용자가 기존 학습 스크립트를 자동 로깅과 함께 통합할 수 있음.

Sources