NVIDIA Rubin 液体冷却:データセンターの水使用量をほぼゼロに削減
NVIDIA Rubin 液体冷却:データセンターの水使用量をほぼゼロに削減
NVIDIA Rubin が 100% 液体冷却を実現し、水消費を排除
NVIDIA の Rubin 世代 AI インフラは、システムからすべてのファンを取り除き、クローズドループ液体冷却方式を採用した初の 100% 液体冷却を実装しています。冷却液を最大 45°C(113°F)で運転できるようにすることで、NVIDIA はデータセンターが蒸発冷却塔からドライクーラー方式の設計へ移行できるようにし、施設の水消費量をメガワットあたり年間 260 万ガロンからほぼゼロに削減できます。
45°C 液体冷却の効率性
冷却液の運転温度を上げることで、エネルギー集約的な機械式チラーを使用せずに、熱を屋外空気へより効率的に放散できます。このアプローチは、いくつかの重要な運用上の利点を提供します。
- エネルギーコスト削減: 業界の推定によると、チラープラントの温度を 1 度上げるだけで冷却エネルギーコストが約 4% 削減されます。50 メガワット規模のハイパースケール施設は、液体冷却インフラへ移行することで年間 400 万ドル以上の節約が可能です。
- チラー不要運転: 気候が適している地域では、45°C アーキテクチャにより屋外ドライクーラー(大型ラジエータコイル)を使用した「チラーなし」運転が可能です。これらの環境では、機械式冷却は年間のごく一部(ある気候では約 1%)しか必要とされません。
- 性能安定性: 冷却液温度が高くても、プロセッサはフルパフォーマンスで動作し続けます。45°C でチップに入る冷却液は、熱負荷を吸収した後に通常 55°C で排出され、コールドプレートはシリコンを検証済みの動作範囲内に保ちます。
アーキテクチャの変化:ハイブリッドからフル液体冷却へ
従来の液体冷却サーバは、GPU と CPU のみがコールドプレートを持ち、他のコンポーネントは空冷フィンヒートシンクに依存するハイブリッドシステムでした。Rubin アーキテクチャはサーバ全体をフル液体冷却に再設計し、以下のような物理的・運用的変化をもたらします。
- ラック密度の向上: 空気流用のスペースが不要になるため、フル液体冷却サーバは計算密度を大幅に向上させます。従来は 6U を占めていたシステムが、現在は 2U に収まります。
- 騒音の排除: すべての冷却ファンを除去することで、従来のデータセンターで一般的に 85 デシベル以上に達する騒音レベルがなくなります。
- インフラの簡素化: サーバは空気取り入れ用の穿孔ベゼルではなく、密閉されたフロントパネルを備え、冷却ループは単一の入口と出口で複数の高出力チップへ液体を供給するよう再設計されています。
技術仕様と実装
冷却システムは 75% の水と 25% のプロピレングリコールの混合液を使用します。液体はクーラント配布ユニット(CDU)からサーバへクローズドループで循環します。このクローズドループ設計により、システムが一度満たされれば、冷却プロセスに新たな水は消費されません。
コミュニティの洞察と考慮点
この発表に関する技術的議論は、アーキテクチャの潜在的な応用と残された課題の両方を浮き彫りにしています。
廃熱回収と地域暖房
一部の専門家は、45°C の出力温度によりデータセンターが地域暖房システムの有力な候補になると指摘しています。余剰熱を近隣の商業施設や住宅に供給することで、データセンターは廃棄物を地域資産に変えることが可能です。
環境・地理的制約
システムは非常に効率的ですが、その有効性は地理条件に依存します。機械式チラーなしで運転できるかは、外気温に左右されます。極端な気候(例:アリゾナ州フェニックス)では、涼しい地域(例:スコットランド高地)に比べてチラーが頻繁に必要になる可能性があります。
「ゼロ水消費」の明確化
クローズドループシステムを満たすために使用される水と、蒸発によって消費される水は区別されます。従来の冷却塔は熱放散のために大量の水を蒸発させますが、NVIDIA のドライクーラー方式はこの蒸発損失を排除し、これが「ほぼゼロ」の水消費を意味します。