leptonai: NVIDIA DGX Cloud Lepton에서 AI 워크로드를 관리하고 운영하기 위한 Python 라이브러리 및 CLI
leptonai: NVIDIA DGX Cloud Lepton에서 AI 워크로드를 관리하고 운영하기 위한 Python 라이브러리 및 CLI
해결하는 문제
NVIDIA DGX Cloud Lepton 플랫폼을 관리하고 상호작용하기 위한 통합 인터페이스를 제공합니다. 엔드포인트, 배치 작업, 클러스터와 같은 AI 워크로드를 Python 또는 명령줄 인터페이스(CLI)에서 직접 배포, 관리 및 호출하는 프로세스를 단순화합니다.
작동 방식
이 프로젝트는 Python 라이브러리와 lep CLI 도구로 구성됩니다. 사용자는 CLI를 사용하여 엔드포인트, dev pods, Ray/Slurm 클러스터와 같은 리소스를 생성하고 관리할 수 있습니다. Python Client는 엔드포인트의 OpenAPI 스키마를 읽어 배포된 엔드포인트를 마치 네이티브 Python 함수처럼 호출할 수 있게 합니다. 또한, AI 에이전트(Claude Code 또는 Codex와 같은)가 자연어 명령을 통해 플랫폼을 운영할 수 있도록 하는 "skills"가 포함되어 있습니다.
대상 사용자
NVIDIA DGX Cloud Lepton 플랫폼을 사용하여 AI 모델과 워크로드를 배포하고 확장하는 개발자 및 AI 엔지니어.
주요 특징
- 통합 CLI: 엔드포인트, 배치 작업, dev pods, 파인튜닝 작업을 관리하기 위한 단일
lep명령. - 동적 클라이언트: OpenAPI 스키마를 기반으로 엔드포인트 경로를 메서드로 자동 매핑하는 Python 클라이언트.
- 에이전트 통합: AI 에이전트가 자연어를 통해 워크로드를 관리할 수 있도록 하는 내장된 skills.
- 클라우드 네이티브 설정: 클라우드로 직접 전송할 수 있는 Pythonic한 설정 사양.
Sources
- undefinedleptonai/leptonai