Daytona AI 에이전트 컴퓨팅 및 샌드박스
Daytona AI 에이전트 컴퓨팅 및 샌드박스
AI 에이전트는 단순 코드 실행이 아닌 조합 가능한 컴퓨터가 필요합니다
AI 에이전트는 일회성, 단명한 코드 실행 상자가 아니라 상태를 유지하고 조합 가능한 컴퓨터—즉, 프로덕션 급 샌드박스—가 필요합니다. 간단한 격리 환경은 코드 조각을 실행하고 출력을 반환할 수 있지만, 정교한 에이전트는 인간의 노트북을 닮은 환경이 필요합니다: 상태를 유지하고, 작업을 일시 중지·재개하며, 레거시 소프트웨어와 상호 작용하기 위해 다양한 운영 체제(Linux, Windows, macOS)에 접근할 수 있어야 합니다.
AI 샌드박스로의 전환
Daytona는 인간 엔지니어를 위한 개발 환경 자동화에서 2025년 초 AI 샌드박스 제공으로 방향을 전환했습니다. 이 전환은 중요한 시장 통찰에 의해 촉발되었습니다: 에이전트의 인프라 요구 사항은 인간과 근본적으로 다릅니다.
MVP 개발 과정에서 Daytona는 에이전트 개발자들이 고동시성, 상태 유지 워크로드를 처리할 수 있는 런타임을 절실히 원한다는 것을 발견했습니다. 이는 급격한 성장으로 이어졌으며, 회사는 월간 74% 성장률을 기록했고 일부 고객은 하루에 거의 850,000개의 샌드박스를 운영하고 있습니다.
고성능 인프라스트럭처 아키텍처
AI 에이전트가 요구하는 속도와 상태 유지를 달성하기 위해 Daytona는 다음과 같은 특정 아키텍처 스택을 사용합니다:
- 베어 메탈 배포: 가상 머신(VM) 대신 베어 메탈에서 실행함으로써 컴퓨트와 스토리지 간 네트워크 지연(EBS 회피)을 없애 IOPS를 크게 향상시킵니다.
- 맞춤 스케줄러: Kubernetes의 오버헤드와 복잡성을 피하기 위해 자체 스케줄러로 자원을 관리합니다. 이는 해당 워크로드에 부적합하다고 판단되었습니다.
- 빠른 시작 시간: 아키텍처 덕분에 단일 샌드박스가 약 60ms 안에 기동됩니다. 대규모에서는 75초 내에 50,000개의 샌드박스를 동시에 시작할 수 있습니다.
- 상태 스냅샷: 템플릿과 스냅샷이 베어 메탈 머신에 미리 로드되어 에이전트가 세션을 "덮어" 동일한 상태로 즉시 복구할 수 있습니다.
급증하는 RL 및 평가 워크로드 처리
Daytona 사용량의 상당 부분(약 50%)이 강화 학습(RL) 및 평가(eval) 워크로드로 전환되었습니다. 이러한 워크로드는 극심한 "스파이크" 특성을 가진 독특한 인프라 문제를 야기합니다.
"태양을 따라" 사용하는 패턴(정오에 피크, 자정에 저점)과 달리 RL 및 eval 워크로드는 예측 불가능하고 이진적입니다. 연구자는 순간적으로 100,000개의 CPU를 요청하고 배치를 실행한 뒤 바로 0으로 감소시킬 수 있습니다. 이는 평균 활용률이 낮고(약 15%) 피크 시 90%까지 처리해야 함을 의미합니다.
Daytona는 샌드박스를 실시간으로 동적으로 크기 조정함으로써 경쟁사들이 사용하는 관리형 Kubernetes 환경(EKS/GKS)에서 흔히 발생하는 메모리 부족(OOM) 오류를 방지합니다.
지식 작업을 위한 Windows와 macOS의 필요성
Linux가 대부분 AI 에이전트의 표준이지만, 전 세계 지식 작업의 상당 부분은 Windows와 macOS에서 실행되는 레거시 애플리케이션에 묶여 있습니다.
- RPA 기회: 의료, 정부, 금융 분야의 고부가가치 작업 대부분은 API가 없는 앱에서 이루어집니다. 에이전트가 이 작업을 자동화하려면 인간처럼 컴퓨터를 사용할 수 있어야 합니다(Computer Use).
- Windows 샌드박스: Daytona는 Linux보다 느리지만(밀리초가 아닌 초 단위) 레거시 앱 자동화에 필요한 환경을 제공하는 Windows 샌드박스를 개발했습니다.
- macOS 도전 과제: Apple의 라이선스 제한으로 인해 머신당 병렬 VM 수가 제한되고, 메모리 스냅샷이 동일 물리 하드웨어에만 적용될 수 있어 클러스터 간 워크로드 이동 및 부하 관리가 어려워집니다.
AI 클라우드의 미래
Ivan Burazin은 AI 컴퓨팅의 미래가 전통적인 클라우드 제공업체(AWS)와는 달리 소비 기반 API(Stripe)와 비슷할 것이라고 전망합니다.
복잡한 인프라를 관리하는 대신, 개발자는 샌드박스, 웹 검색, 에이전트 전용 데이터베이스와 같은 기본 요소들을 원활한 API를 통해 사용할 것입니다. 에이전트가 컴퓨팅의 주요 사용자가 되면서 병목 현상은 GPU에서 CPU와 네트워킹으로 이동하게 됩니다. 동시 에이전트 작업의 방대한 양이 일반 목적 컴퓨팅에 전례 없는 수요를 만들기 때문입니다.
요약: Ivan Burazin, Daytona CEO는 AI 에이전트가 RL 및 평가와 같은 복잡하고 급증하는 워크로드를 처리하기 위해 일회성 코드 실행 상자가 아니라 상태를 유지하고 조합 가능한 컴퓨터가 필요하다고 설명합니다.
제목: Daytona AI 에이전트 컴퓨팅 및 샌드박스