AI スーパサイクルの経済学:Baseten とカスタム推論へのシフト

AIスーパサイクルの経済学:Baseten とカスタム推論へのシフト

コアテーゼ:推論がAI価値のエンジン

AI 推論需要は、エージェント型アプリケーションの台頭とモデルの大型化により、10億倍に増加すると予測されています。現在の推論支出の 95% はフロンティアモデル(OpenAI や Anthropic など)に費やされていますが、収益性があり、実行可能で、防御可能な AI 企業を構築する道は、カスタムの事後学習オープンソースモデルへの移行にあります。

カスタムモデルの経済的根拠

企業は、実行可能性と防御可能性という 2 つの主な理由から、フロンティアモデルからオープンソース代替へとシフトしています。

財務的実行可能性と粗利益率

オープンソースモデルは、能力面でフロンティアモデルに対して約 90 日遅れですが、実行コストは 70%〜90% 削減できます。スケールしたビジネスにとって、このコスト削減は粗利益率をゼロまたはマイナスから持続可能なレベル(40%〜70%)へと引き上げるために不可欠です。

戦略的防御性

フロンティアラボだけに依存すると、企業は実質的に自社のプロプライエタリなワークフローとユーザーシグナルをモデル提供者に手渡すという戦略リスクが生じます。Tuhin Srivastava はフロンティアラボを「東インド会社」に例え、API を利用することで企業はラボが最終的に事後学習モデルを作成し、同じ企業の専門的ワークフローと直接競合するために必要なデータを提供していると指摘しています。

事後学習ワークフロー

「自分たちのインテリジェンスを所有する」ために、企業は事後学習ワークフローを採用し、専門化されたモデルを作成しています。プロセスは次のとおりです:

  1. ユーティリティ関数の定義:企業は最適化したい目標を正確に決定します(例:医療音声認識モデルにおける文字起こしエラーの最小化)。
  2. データ提供:企業は自社の専有データセットを提供します。
  3. ベースモデルの選択:オープンソースモデルを出発点として選択します。
  4. スキャフォールディング:Baseten などのインフラが、ベースモデルとデータを専門化された事後学習モデルに変換する技術的枠組みを提供します。
  5. デプロイ:生成されたモデルは推論スタックに統合され、実運用で使用されます。

コンピュート危機と垂直統合

コンピュートの不足は、需要が累積的に増大するために正常化しにくいシステム的課題です。この不足が、AI インフラ企業の運営方法に変化をもたらしています。

GPU の「ドラッグマーケット」

GPU 調達は現在、スリッページが大きく価格変動が激しい非成熟市場として描写されています。例として、Baseten は B200 Blackwell チップの更新見積もりで、時間単価が $263 から $510 にほぼ倍増したことを観測しています。

レンタルから所有への移行

当初、Baseten はソフトウェア層(約 20 の異なるクラウドからコンピュートをレンタルし、87 のクラスターをつなげて GPU を代替可能にする)に注力していましたが、現在は自社ハードウェアの所有へとシフトしています。この転換は次の要因によります:

  • アクセス:クラウドプロバイダーの提供タイムライン(12〜15 ヶ月先)に依存せず、需要を確実に満たす能力を保証。
  • 経済性:スケールでハードウェアを所有する方がレンタルより約 30% コスト削減。
  • スケール:Baseten は、予測成長を支えるために 2 年で 150,000 台相当の B200 が必要と見積もっており、約 70 億ドルのコンピュート支出に相当します。

ハードウェアとエコシステムのトレンド

NVIDIA の支配力

TPU やその他の「ネオチップ」の台頭にもかかわらず、NVIDIA は充実したサプライチェーン、TSMC との関係、CUDA エコシステムにより依然として支配的です。現在の高速開発は、TRT-LLM、vLLM、XG Lang といった NVIDIA ネイティブランタイムに依存しています。

ヘテロジニアスアーキテクチャ

将来のハードウェアは、"prefill"(計算バウンド)と "decode"(メモリバウンド)を別々のチップに分割するヘテロジニアスアーキテクチャへと移行し、すべてを単一 GPU で実行する従来の方式から脱却すると予想されます。

AI インフラの将来の機会

モデルのトレーニングと推論を超えて、AI の物理的構築には大きな経済的機会があります:

  • エネルギーと電力:大規模コンピュートクラスターに必要な基盤電力インフラへの投資。
  • モジュラー型データセンター:コンピュートユニットをモジュラーコンテナ化し、構築プロセスを産業化。実質的に物理層で「コンピュートの API」を創出します。

要約: Tuhin Srivastava(Baseten CEO)は、AI 経済がフロンティアモデルからカスタムの事後学習オープンソースモデルへとシフトしており、これにより収益性、防御性、低レイテンシが実現できると主張しています。

タイトル: AI スーパサイクルの経済学:Baseten とカスタム推論へのシフト

Sources