leptonai: 一个用于在 NVIDIA DGX Cloud Lepton 上管理和操作 AI 工作负载的 Python 库和 CLI
leptonai: 一个用于在 NVIDIA DGX Cloud Lepton 上管理和操作 AI 工作负载的 Python 库和 CLI
它解决了什么问题
它为管理和与 NVIDIA DGX Cloud Lepton 平台进行交互提供了一个统一的接口。它简化了直接从 Python 或命令行界面 (CLI) 部署、管理和调用 AI 工作负载(例如 endpoints、batch jobs 和 clusters)的过程。
它是如何工作的
该项目由一个 Python 库和一个 lep CLI 工具组成。用户可以使用 CLI 来创建和管理资源,例如 endpoints、dev pods 和 Ray/Slurm clusters。Python Client 允许用户通过读取 endpoint 的 OpenAPI schema,像调用原生 Python 函数一样调用已部署的 endpoints。此外,它还包括“skills”功能,使 AI agents(如 Claude Code 或 Codex)能够通过自然语言命令来操作平台。
目标用户
使用 NVIDIA DGX Cloud Lepton 平台来部署和扩展 AI 模型及工作负载的开发者和 AI 工程师。
亮点
- Unified CLI: 一个用于管理 endpoints、batch jobs、dev pods 和 fine-tuning jobs 的单一
lep命令。 - Dynamic Client: 一个 Python client,能够根据 OpenAPI schemas 自动将 endpoint paths 映射到 methods。
- Agentic Integration: 为 AI agents 内置了用于通过自然语言管理工作负载的 skills。
- Cloud-Native Configuration: 可以直接发送到云端的 Pythonic 配置规范。
Sources
- undefinedleptonai/leptonai