oumi: ボイラープレートなしで基盤モデルをトレーニング、評価、デプロイするためのエンドツーエンドプラットフォーム
oumi: ボイラープレートなしで基盤モデルをトレーニング、評価、デプロイするためのエンドツーエンドプラットフォーム
何を解決するか
oumiは、基盤モデル構築の複雑なエンドツーエンドのライフサイクルを簡素化するために設計されたオープンソースプラットフォームです。トレーニングループ、データパイプライン、およびデプロイメントワークフローのための繰り返しの多いボイラープレートコードを書く必要性を排除し、開発者がデータの準備から本番環境への移行をより迅速に行えるようにします。
仕組み
oumiは、統一されたAPIとコマンドラインインターフェース(CLI)を提供し、ユーザーが定義済みの「レシピ」(設定ファイル)を使用してトレーニング、評価、および推論タスクを実行できるようにします。vLLMやSGLangのような人気の推論エンジンと統合されており、FSDP、DeepSpeed、およびDDPなどの分散トレーニング技術をサポートしています。このプラットフォームは、ノートパソコン上でローカルに実行したり、AWS、Azure、GCP、およびLambdaのようなクラウドプロバイダー上でリモートで起動したりすることができます。
対象ユーザー
様々なモダリティ(テキストおよびマルチモーダル)と環境にわたって、基盤モデル(10Mから405Bパラメータ)を開発、微調整、およびデプロイする必要があるML研究者やエンタープライズチーム向けに構築されています。
ハイライト
- エンドツーエンドのライフサイクル: データ合成、キュレーション、トレーニング、評価、およびデプロイをカバーします。
- 幅広いモデルサポート: Llama、DeepSeek、Qwen、およびPhiを含む幅広いアーキテクチャと互換性があります。
- 高度なトレーニング技術: SFT、LoRA、QLoRA、およびGRPOをネイティブにサポートしています。
- クラウド統合: 複数の主要なクラウドプラットフォームにわたってリモートでジョブを起動し、監視する能力があります。
- LLM-as-a-Judge: LLMジャッジを使用してトレーニングデータをフィルタリングおよびキュレーションするための組み込みツールを備えています。
Sources
- undefinedoumi-ai/oumi