dstack: マルチクラウドおよびオンプレミス・クラスターにわたるGPUプロビジョニングとオーケストレーションのための統合コントロールプレーン

dstack: マルチクラウドおよびオンプレミス・クラスターにわたるGPUプロビジョニングとオーケストレーションのための統合コントロールプレーン

何を解決するか

dstack は、GPUプロビジョニングとオーケストレーションのための統合コントロールプレーンです。異なるGPUクラウド、Kubernetes クラスター、およびオンプレミス・サーバーにわたる計算リソースの管理の複雑さを排除し、開発、トレーニング、および推論を扱う一貫した方法を提供します。

仕組み

ユーザーは、インフラストラクチャを管理するために dstack サーバーと CLI をセットアップします。システムは、さまざまな GPU クラウドやクラスターに接続するために「バックエンド」を構成することで動作します。ユーザーは、フリート、開発環境、およびタスク用の YAML 設定ファイルを通じて、インフラストラクチャのニーズを定義します。dstack apply を実行することで、システムは接続された環境にわたるプロビジョニング、ジョブキューイング、オートスケーリング、ネットワーキング、およびボリューム管理を自動的に処理します。

対象ユーザー

ローカル開発から、分散トレーニングおよび複数のハードウェア・アクセラレータ(NVIDIA, AMD, Google TPU, および Tenstorrent)にわたるモデル展開まで、ワークロードをスケールさせる必要がある AI 開発者および ML エンジニア。

ハイライト

  • マルチクラウドおよびハイブリッド・サポート: あらゆる GPU クラウド、Kubernetes、およびオンプレミス・クラスターで動作します。
  • 詳細なリソース管理: ML ライフサイクルの異なる段階に合わせて、フリート、開発環境、タスク、およびサービスをサポートします。
  • uma 独自の AI エージェント統合: AI エージェント(Claude や Cursor など)が CLI を介してフリートを管理し、ワークロードを提出できるようにする「スキル」を提供します。
  • 幅広いハードウェア互換性: NVIDIA, AMD, Google TPU, および Tenstorrent アクセラレータを標準でサポートしています。

Sources