Flower SuperGrid Agents: 協調ネットワークを通じたAIのスケーリング
Flower SuperGrid Agents: 協調ネットワークを通じたAIのスケーリング
協調型AIの最前線
協調型AIは、データを中央の計算クラスターに移動させる中央集権的なAIから、計算をデータへと移動させる分散型のアプローチへの転換を表しています。このパラダイムシフトは、世界の高品質なデータの大部分がプライベートなサイロ内に存在しているため、必要不可欠です。公開されている英語のウェブデータは約15兆トークンですが、推定2,000兆トークンがプライベートなサイロ内に未使用のまま残されており、現在利用可能なデータの1%未満しか基盤モデルのトレーニングには利用されていないことを意味します。
個々のサイロを大きくするのではなく、協調ネットワークを構築することで、組織は水平方向にスケールさせることができます。これにより、独自のデータを持つ非AIネイティブ企業が、単一のエンティティが単独では所有していないリソースを使用してモデルをトレーニングすることで、競争力を獲得できるようになります。
Flower SuperGrid: 分散型AIプラットフォーム
Flower SuperGridは、分散型AIシステムのデプロイを簡素化するために設計された基盤レイヤーです。従来、このようなシステムの構築には、オンボーディングや設定のために数百もの手動ステップが必要でした。SuperGridは、flower.aiにあるユーザーフレイリーなインターフェースを介して、この複雑さを数クリックにまで軽減します。
主要な技術的能力
- Supernodes: データサイロ上で動作し、分散ワークロードを実行する個々のノード。
- Superlink: 実際のデータは保持せず、ネットワークを管理するコーディネーター。
- Heterogeneous Confidential Compute: 単一のシステム内で異なるベンダーの機密コンピューティング(confidential compute)を使用することを可能にする初の統合。これはワークロードのスケーリングにおいて重要な要件です。
- Flower Hub: 信頼とレビューのシステムを備えた、分散型アプリのためのコミュニティ主導のリポジトリ。
- Isolation and Auditability: コンポーネント間の監査可能な通信と、LLMトレーニングのための大規模なモデルウェイトのストリーミングをサポートする強力な分離モデル。
Project Kaya: 協調型AIエージェント
現在のAIエージェントのほとんどは、公開ウェブデータまたは単一組織のプライベートデータに限定されています。Project Kayaは、SuperGrid上に構築された協調型AIエージェントであり、エージェントが異なる組織やデータサイロを越えて通信し、単一のエージェントでは解決できないタスクを解決できるようにします。
協調型エージェントの仕組み
- Task Decomposition: コーディネーターエージェントがユーザーのタスクを分解し、個々のsupernodesへメッセージを送信します。
- Autonomous Participation: Supernodesは完全に自律的です。独自のガバナンス原則に基づき、リクエストの受諾または拒否を決定できます。
- Local Processing: Supernodes上のエージェントは、データが敷地内から離れることなく、ローカルデータを使用してリクエストを処理します。
- Controlled Response: Supernodeオペレーターは、レスポンスがコーディネーターに返される前に、機密情報を確認し、拒否することができます。
- Aggregation: 中央のエージェントが、参加しているsupernodesからの結果を集約し、ユーザーに最終的な回答を提供します。
SuperGrid Frontier: 分散型トレーニングパイプライン
ローカルデータを使用してエージェントを改善するために、Flower LabsはSuperGrid Frontierという分散型トレーニングパイプラインを提供しています。これにより、「データは移動させず、学習内容のみを移動させる」という原則に基づき、基盤となるデータを移動させることなく大規模なモデルのトレーニングが可能になります。
トレーニングの節目と研究
- Communication Efficiency: SuperGrid Frontierは、分散トレーニングの実行中に通信コストを最大1,000倍削減できることを実証しました。
- Llama 7B (UK Edition): Flower Labsは、SuperGrid Frontierパイプラインを使用してトレーニングされた、特に英国向けに最適化されたオープンウェイトのLlama 7Bモデルをリリースしました。
- Large-Scale Collaboration: 米国エネルギー省およびSandia National Labsとの提携により、Flower Labsは現在、3つの異なるサイトに分散して700億パラメータのLLMを分散トレーニングしています。
- Academic Contributions: ICLR 2025で発表された研究には、言語モデルの事前学習のためのデカップリングされた埋め込み(decoupled embeddings)と、LLMの連邦事前学習のための"Photon"に関する研究が含まれます。
Flower Ecosystemの概要
Flower Labsは、3つの統合された構成要素を通じて「協調型超知能」を推進しています。
| Component | Purpose | | :--- | :--- | | | Flower SuperGrid | 分散データ上でワークロードを実行するための分散型AIプラットフォーム。 | | Project Kaya | ネットワークを越えて通信し、推論を行うことができる協調型エージェント。 | | SuperGrid Frontier | プライベートなデータ上でモデルを構築するための分散型トレーニングパイプライン。 |