oumi: 一个用于训练、评估和部署基础模型的零样板代码端到端平台
oumi: 一个用于训练、评估和部署基础模型的零样板代码端到端平台
它解决了什么问题
Oumi 是一个开源平台,旨在简化构建基础模型复杂的端到端生命周期。它消除了开发者为训练循环、数据流水线和部署工作流编写重复性样板代码的需求,使他们能够更快地从数据准备过渡到生产。
它是如何工作的
Oumi 提供统一的 API 和命令行界面 (CLI),允许用户使用预定义的“配方”(配置文件)来执行训练、评估和推理任务。它集成了 vLLM 和 SGLang 等流行的推理引擎,并支持 FSDP、DeepSpeed 和 DDP 等分布式训练技术。该平台可以在笔记本电脑上本地运行,也可以在 AWS、Azure、GCP 和 Lambda 等云提供商上远程启动。
它是为谁设计的
它是为机器学习研究人员和企业团队构建的,这些团队需要在各种模态(文本和多模态)和环境中开发、微调和部署基础模型(参数量从 10M 到 405B)。
亮点
- 端到端生命周期:涵盖数据合成、策展、训练、评估和部署。
- 广泛的模型支持:兼容包括 Llama、DeepSeek、Qwen 和 Phi 在内的广泛架构。
- 高级训练技术:原生支持 SFT、LoRA、QLoRA 和 GRPO。
- 云集成:能够在多个主要云平台跨远程启动和监控任务。
- LLM-as-a-Judge:内置使用 LLM 裁判进行训练数据过滤和策展的工具。
Sources
- undefinedoumi-ai/oumi