oumi: ボイラープレートなしで基盤モデルをトレーニング、評価、デプロイするためのエンドツーエンドプラットフォーム

oumi: ボイラープレートなしで基盤モデルをトレーニング、評価、デプロイするためのエンドツーエンドプラットフォーム

何を解決するか

oumiは、基盤モデル構築の複雑なエンドツーエンドのライフサイクルを簡素化するために設計されたオープンソースプラットフォームです。トレーニングループ、データパイプライン、およびデプロイメントワークフローのための繰り返しの多いボイラープレートコードを書く必要性を排除し、開発者がデータの準備から本番環境への移行をより迅速に行えるようにします。

仕組み

oumiは、統一されたAPIとコマンドラインインターフェース(CLI)を提供し、ユーザーが定義済みの「レシピ」(設定ファイル)を使用してトレーニング、評価、および推論タスクを実行できるようにします。vLLMやSGLangのような人気の推論エンジンと統合されており、FSDP、DeepSpeed、およびDDPなどの分散トレーニング技術をサポートしています。このプラットフォームは、ノートパソコン上でローカルに実行したり、AWS、Azure、GCP、およびLambdaのようなクラウドプロバイダー上でリモートで起動したりすることができます。

対象ユーザー

様々なモダリティ(テキストおよびマルチモーダル)と環境にわたって、基盤モデル(10Mから405Bパラメータ)を開発、微調整、およびデプロイする必要があるML研究者やエンタープライズチーム向けに構築されています。

ハイライト

  • エンドツーエンドのライフサイクル: データ合成、キュレーション、トレーニング、評価、およびデプロイをカバーします。
  • 幅広いモデルサポート: Llama、DeepSeek、Qwen、およびPhiを含む幅広いアーキテクチャと互換性があります。
  • 高度なトレーニング技術: SFT、LoRA、QLoRA、およびGRPOをネイティブにサポートしています。
  • クラウド統合: 複数の主要なクラウドプラットフォームにわたってリモートでジョブを起動し、監視する能力があります。
  • LLM-as-a-Judge: LLMジャッジを使用してトレーニングデータをフィルタリングおよびキュレーションするための組み込みツールを備えています。

Sources