oumi: ボイラープレートなしで基盤モデルをトレーニング、評価、デプロイするためのエンドツーエンドプラットフォーム

何を解決するか

oumiは、基盤モデル構築の複雑なエンドツーエンドのライフサイクルを簡素化するために設計されたオープンソースプラットフォームです。トレーニングループ、データパイプライン、およびデプロイメントワークフローのための繰り返しの多いボイラープレートコードを書く必要性を排除し、開発者がデータの準備から本番環境への移行をより迅速に行えるようにします。

仕組み

oumiは、統一されたAPIとコマンドラインインターフェース（CLI）を提供し、ユーザーが定義済みの「レシピ」（設定ファイル）を使用してトレーニング、評価、および推論タスクを実行できるようにします。vLLMやSGLangのような人気の推論エンジンと統合されており、FSDP、DeepSpeed、およびDDPなどの分散トレーニング技術をサポートしています。このプラットフォームは、ノートパソコン上でローカルに実行したり、AWS、Azure、GCP、およびLambdaのようなクラウドプロバイダー上でリモートで起動したりすることができます。

対象ユーザー

様々なモダリティ（テキストおよびマルチモーダル）と環境にわたって、基盤モデル（10Mから405Bパラメータ）を開発、微調整、およびデプロイする必要があるML研究者やエンタープライズチーム向けに構築されています。

ハイライト

エンドツーエンドのライフサイクル: データ合成、キュレーション、トレーニング、評価、およびデプロイをカバーします。
幅広いモデルサポート: Llama、DeepSeek、Qwen、およびPhiを含む幅広いアーキテクチャと互換性があります。
高度なトレーニング技術: SFT、LoRA、QLoRA、およびGRPOをネイティブにサポートしています。
クラウド統合: 複数の主要なクラウドプラットフォームにわたってリモートでジョブを起動し、監視する能力があります。
LLM-as-a-Judge: LLMジャッジを使用してトレーニングデータをフィルタリングおよびキュレーションするための組み込みツールを備えています。

oumi: ボイラープレートなしで基盤モデルをトレーニング、評価、デプロイするためのエンドツーエンドプラットフォーム

oumi: ボイラープレートなしで基盤モデルをトレーニング、評価、デプロイするためのエンドツーエンドプラットフォーム

何を解決するか

仕組み

対象ユーザー

ハイライト

Sources