Stanford MS&E435 Economics of the AI Supercycle: Building AI Factories
Stanford MS&E435 Economics of the AI Supercycle: Building AI Factories
AI 인프라스트럭처를 디지털 노동으로
현재 AI 도입이 급증하면서 물리적으로는 데이터 센터에 대한 대규모 투자가 이루어지고 있습니다. Crusoe의 CEO인 Chase Lochmiller는 이를 "지능의 인프라스트럭처"라고 표현합니다. 이 투자는 역사상 가장 큰 규모 중 하나로, 맨해튼 프로젝트나 미국 고속도로 시스템과 비슷한 규모이며, 미국 국방 예산에 이어 두 번째로 큰 규모입니다.
경제학적 관점에서 AI 토큰의 가치는 "디지털 노동"을 제공할 수 있다는 점에 있습니다. 과거 노동 성장률은 출산율과 긴 배양 기간(교육 및 양육)으로 제한되었습니다. AI는 노동의 디지털 가속화(코브‑더글라스 생산 모델의 ΔL)를 가능하게 하여, 에이전트와 봇을 통한 전례 없는 인력 증가를 제공함으로써 경제를 근본적으로 변화시키고 GDP 성장을 가속화할 수 있습니다.
AI 공장의 해부학
기가와트 규모의 AI 데이터 센터를 구축하는 것은 화학, 기계, 전기, 컴퓨터 과학 엔지니어링을 아우르는 다학제적 과제입니다. Lochmiller는 데이터 센터를 가장 기본적인 수준에서는 전원과 냉각이 갖춰진 건물이며, 컴퓨터를 연결할 수 있는 공간이라고 정의하지만, 규모가 커지면 복잡한 "AI 공장"이 됩니다.
에너지 우선 접근법
Crusoe는 수직 통합 전략을 사용하여 인프라 성장의 병목을 해소하기 위해 에너지 개발을 최우선으로 합니다. 이는 전통적인 데이터 센터 허브인 버지니아 북부와 같은 곳이 아니라, 풍부하고 저비용인 에너지 자원이 있는 지역에 데이터 센터를 배치하는 것을 의미합니다.
- Abilene, Texas 사이트: Crusoe는 서부 텍사스의 재생 에너지 과잉 투자을 활용합니다. 생산 세액 공제와 제한된 전송 인프라 때문에 Abilene의 전력 가격은 때때로 마이너스가 되었습니다. Crusoe는 여기서 200 MW 변전소와 1 GW 변전소(미국에서 가장 큰 민간 소유 변전소)를 포함한 캠퍼스를 건설했으며, 신뢰성을 확보하기 위해 350 MW 천연 가스 발전소도 함께 운영합니다.
- Claude, Texas 사이트: 이 사이트는 풍력 에너지에 초점을 맞추며 "계량기 횡단" 전략을 사용합니다. Crusoe는 현장에서 풍력(향후 태양광, 배터리, 가스 계획 포함)으로 전력을 생산하고 초과 전력을 그리드에 판매하며, 유지보수나 재생 에너지 생산이 낮을 때는 그리드에서 전력을 끌어옵니다.
냉각 및 물 사용량
AI가 과도한 물을 소비한다는 이야기에 반해, Lochmiller는 Crusoe의 시스템이 순환 냉각수 루프를 사용한다고 말합니다. 한 번 채워진 후 연간 물 소비량은 단독 주택 수준에 불과해, 서부 텍사스와 같은 물이 부족한 지역에서도 지속 가능합니다.
AI 인프라스트럭처의 경제학
기가와트 규모의 컴퓨팅 클러스터를 구축하려면 약 600억 달러의 총 자본 지출(CapEx)이 필요합니다.
인프라 CapEx (메가와트당 약 2천만 달러)
- 노동: 큰 병목이자 비용 요소로, 메가와트당 약 470만 달러가 소요됩니다. 여기에는 전기공, 용접공, 배관공 등 대규모 블루칼라 인력이 포함됩니다.
- 발전: 가스 발전소는 메가와트당 약 200~300만 달러가 들며, 터빈 제조업체(예: GE Vernova, Siemens)의 생산 능력 제한으로 가격이 상승하고 있습니다.
- 전기 설비: 고전압 전력(예: 345 kV)을 사용 가능한 수준으로 낮추는 전력 배전 센터, 변압기, 스위치기어 등을 포함합니다.
- 기계 설비: 공기 냉각식 냉각기와 순환 물을 위한 배관 설비를 포함합니다.
IT CapEx (메가와트당 약 4천만 달러)
- GPU: 가장 큰 비용으로 메가와트당 약 3000만 달러가 소요됩니다.
- 네트워킹: 고성능 백엔드 네트워크(NVLink, InfiniBand, RoCE 등)를 구축해 GPU를 하나의 클러스터로 연결하는 데 메가와트당 약 400만 달러가 필요합니다.
- CPU 및 스토리지: 메가와트당 약 300만 달러. Lochmiller는 에이전트 기반 워크플로우 증가로 인한 최근 CPU 부족 현상을 언급합니다.
- 기타: 배포 및 배송을 위한 노동 비용이 메가와트당 약 100만 달러를 차지합니다.
수익, 회수 기간 및 감가상각
600억 달러 규모의 기가와트 클러스터에 대해 수익 모델은 제공되는 서비스 레이어에 따라 달라집니다:
- 칩 임대 (Infrastructure as a Service): 메가와트당 연간 약 1500만 달러의 수익을 창출합니다. 이는 약 4년의 수익 기반 회수 기간을 의미합니다.
- 관리형 서비스 (Model as a Service): 모델을 호스팅하고 토큰용 API 엔드포인트를 제공함으로써 메가와트당 추가 500~1500만 달러의 마진이 상승하여 회수 기간을 2년으로 단축할 수 있습니다.
감가상각 논쟁
많은 상장 기업이 컴퓨팅 장비를 5~6년 동안 감가상각하지만, Lochmiller는 H100과 같은 구형 칩의 가치는 수요 급증(예: 에이전트 AI 붐) 시기에 실제로 상승할 수 있다고 주장합니다. 따라서 컴퓨팅의 유효 수명은 고정된 캘린더 날짜가 아니라 사용자에게 제공되는 가치에 따라 결정된다고 봅니다.
미래 전망 및 병목 현상
전기 스택 기회
Lochmiller는 전기 스택 분야에서 큰 혁신 기회를 확인했습니다. 전통적인 기업(예: Eaton, Schneider)은 고체 상태 전자·고체 상태 변압기·900 V DC 아키텍처와 같은 기술을 도입하지 않으면 위험에 처할 수 있다고 경고합니다. 이러한 기술은 고전압 변전소에서 랙으로 전력을 보다 효율적으로 전달하는 데 필요합니다.
우주 기반 데이터 센터
Crusoe는 Starcloud와 협력해 H100을 우주로 발사했습니다. 우주 데이터 센터는 콘크리트 기초, 허가, 광섬유 케이블(광학 사용) 등의 필요성을 없애지만, 열 관리와 하드웨어 유지보수에서 극한의 도전에 직면합니다. GPU는 쉽게 교체하거나 재장착할 수 없기 때문입니다. Lochmiller는 이는 페이로드 비용이 SpaceX의 Starship과 같은 차량으로 감소할 경우 10년 이상 걸릴 장기적인 전략이라고 봅니다.
요약: Chase Lochmiller, Crusoe의 CEO는 기가와트 규모 AI 데이터 센터 구축에 필요한 막대한 자본 지출을 논의하며, AI를 GDP 성장을 견인하는 디지털 노동 형태로 정의합니다.
제목: Stanford MS&E435 Economics of the AI Supercycle: Building AI Factories