oumi: 一个用于训练、评估和部署基础模型的零样板代码端到端平台

oumi: 一个用于训练、评估和部署基础模型的零样板代码端到端平台

它解决了什么问题

Oumi 是一个开源平台,旨在简化构建基础模型复杂的端到端生命周期。它消除了开发者为训练循环、数据流水线和部署工作流编写重复性样板代码的需求,使他们能够更快地从数据准备过渡到生产。

它是如何工作的

Oumi 提供统一的 API 和命令行界面 (CLI),允许用户使用预定义的“配方”(配置文件)来执行训练、评估和推理任务。它集成了 vLLM 和 SGLang 等流行的推理引擎,并支持 FSDP、DeepSpeed 和 DDP 等分布式训练技术。该平台可以在笔记本电脑上本地运行,也可以在 AWS、Azure、GCP 和 Lambda 等云提供商上远程启动。

它是为谁设计的

它是为机器学习研究人员和企业团队构建的,这些团队需要在各种模态(文本和多模态)和环境中开发、微调和部署基础模型(参数量从 10M 到 405B)。

亮点

  • 端到端生命周期:涵盖数据合成、策展、训练、评估和部署。
  • 广泛的模型支持:兼容包括 Llama、DeepSeek、Qwen 和 Phi 在内的广泛架构。
  • 高级训练技术:原生支持 SFT、LoRA、QLoRA 和 GRPO。
  • 云集成:能够在多个主要云平台跨远程启动和监控任务。
  • LLM-as-a-Judge:内置使用 LLM 裁判进行训练数据过滤和策展的工具。

Sources