Daytona AI エージェント コンピュートとサンドボックス

Daytona AI エージェント コンピュートとサンドボックス

AI エージェントはコード実行だけでなく、構成可能なコンピュータが必要

AI エージェントは、使い捨ての短命なコード実行ボックスではなく、ステートフルで構成可能なコンピュータ、すなわち本番レベルのサンドボックスを必要とします。単純なアイソレートはコードのスニペットを実行して出力を返すことはできますが、洗練されたエージェントは人間のラップトップに似た環境、すなわち状態を保持し、作業を一時停止・再開でき、レガシーソフトウェアとやり取りできる多様な OS(Linux、Windows、macOS)へのアクセスが必要です。

AI サンドボックスへの転換

Daytona は 2025 年初頭に、人間エンジニア向けの開発環境自動化から AI サンドボックスの提供へとピボットしました。この転換は、市場の重要な洞察、すなわちエージェントのインフラ要件は人間のそれとは根本的に異なるという認識に基づいています。

MVP の開発中、Daytona はエージェント開発者が高並列・ステートフルなワークロードを処理できるランタイムを切望していることを発見しました。これが急速な成長につながり、同社は月間 74% の成長率を報告し、顧客の中には 1 日あたり約 850,000 のサンドボックスを実行するケースもあります。

高性能インフラストラクチャアーキテクチャ

AI エージェントが求める速度とステートフル性を実現するため、Daytona は以下のアーキテクチャスタックを採用しています。

  • ベアメタルデプロイ: 仮想マシン(VM)ではなくベアメタル上で実行することで、コンピュートとストレージ間のネットワーク遅延(例: EBS の回避)を排除し、IOPS を大幅に高速化します。
  • カスタムスケジューラ: Kubernetes のオーバーヘッドと複雑さを回避するため、独自のスケジューラでリソースを管理します。
  • 高速起動時間: アーキテクチャにより、単一サンドボックスの起動に約 60ms しかかかりません。大規模なスケールでは、50,000 のサンドボックスを同時に約 75 秒で起動できます。
  • ステートフルスナップショット: テンプレートとスナップショットはベアメタルマシンに事前ロードされており、エージェントはセッションを「蓋を閉じる」だけで、同じ状態に瞬時に戻れます。

スパイクが激しい RL と Eval ワークロードの処理

Daytona の利用の大部分(約 50%)は、強化学習(RL)と評価(eval)ワークロードへとシフトしています。これらのワークロードは極端な「スパイク性」を伴う独自のインフラ課題を生み出します。

「太陽に従う」ような背景エージェント(正午にピーク、深夜に低下)とは異なり、RL と eval のワークロードは予測不可能で二元的です。研究者が 100,000 CPU を瞬時に要求し、バッチを実行した後にゼロに戻すことがあります。その結果、平均利用率は低く(約 15%)ても、90% のピークに対応できる容量が必要です。

Daytona のオンザフライでサンドボックスを動的にリサイズする能力は、競合他社が使用するマネージド Kubernetes 環境(EKS/GKS)で頻発するメモリ不足(OOM)エラーを防ぎます。

知識労働における Windows と macOS の必要性

Linux はほとんどの AI エージェントの標準ですが、世界中の膨大な知識労働は Windows や macOS 上で動作するレガシーアプリケーションにロックされています。

  • RPA の機会: 医療、政府、金融などの高付加価値業務の多くは API を持たないアプリで行われています。エージェントがこの作業を自動化するには、人間と同様にコンピュータを操作できる(Computer Use)必要があります。
  • Windows サンドボックス: Daytona は Linux より遅い(ミリ秒ではなく秒単位)ものの、レガシーアプリ自動化に必要な環境を提供する Windows サンドボックスを開発しました。
  • macOS の課題: macOS サンドボックスの提供は、Apple のライセンス制約により複雑です。これにより、マシンあたりの並列 VM 数が制限され、メモリスナップショットは同一ハードウェアに限定されるため、クラスター間でワークロードを移動して負荷を分散することが困難になります。

AI クラウドの未来

Ivan Burazin は、AI コンピュートの未来は従来のクラウドプロバイダー(AWS)のような形ではなく、消費ベースの API(Stripe)のようになると予測しています。

開発者は複雑なインフラを管理する代わりに、サンドボックス、ウェブ検索、エージェント固有データベースといったプリミティブ群にシームレスにアクセスできる API を利用します。エージェントがコンピュートの主要ユーザーになるにつれ、ボトルネックは GPU から CPU とネットワークへと移行し、同時実行エージェントタスクの膨大な量が汎用コンピュートへの前例のない需要を生み出します。

Sources