spiceai: データに基づいたAIエージェントのための、クラスターサイドカーアーキテクチャを備えた高速化SQLおよびLLM推論エンジン

spiceai: データに基づいたAIエージェントのための、クラスターサイドカーアーキテクチャを備えた高速化SQLおよびLLM推論エンジン

解決する課題

Spiceは、データに基づいたAIアプリケーションやエージェントを構築する際に通常必要となる、複雑なデータパイプラインや「グルーコード(接着コード)」を排除するために設計されています。SQLクエリ、検索、およびLLM推論のための統合エンジンを提供し、スタンドアロンのバイナリ、Kubernetesサイドカー、または分散クラスターとして実行されるかに関わらず、開発者がlocalhost上でミリ秒単位のレイテンシでフェデレーテッドデータソースにアクセスできるようにします。

仕組み

Spiceは「クラスターサイドカー」アーキテクチャを使用して動作します。軽量なサイドカーがlocalhost上のアプリケーションの隣で動作し、スコープされたワーキングセットからデータを供給します。より大規模なクエリについては、分散実行のためのApache Ballistaを搭載した中央のSpiceクラスター、および高性能な列指向データアクセスを実現するSpice Cayenneアクセラレータへ透過的に委譲します。30以上のデータコネクタ(例:Postgres、Snowflake、S3)と統合し、リアルタイム更新のためのネイティブCDCをサポートしています。AI機能はSQLエンジンに直接統合されており、単一のクエリプラン内でベクトル検索、リランキング、およびtext-to-SQL (NSQL) を可能にします。

対象ユーザー

複雑なETLパイプラインを管理する運用オーバーヘッドなしに、多様でフェデレーテッドなデータソースへの高性能なアクセスを必要とする、AIエージェントやデータ集約型アプリケーションを作成する開発者向けに構築されています。

ハイライト

  • クラスターサイドカーアーキテクチャ: ローカルの結果キャッシュ、ローカルワーキングセット、および分散クラスターへの委譲を組み合わせ、階層化されたレイテンシを実現します。
  • AIネイティブなランタイム: OpenAI互換APIとMCPサポートを介して、LLM推論、ベクトル検索、およびtext-to-SQLをSQLエンジンに直接統合します。
  • 高性能なアクセラレーション: Spice CayenneアクセラレータとVortex列指向フォーマットを使用して、特定のワークロードにおいてDuckDBやParquetを凌駕するパフォーマンスを発揮します。
  • フェデレーテッドクエリ: 30以上のデータソースに接続し、標準SQLを使用してApache Icebergテーブルへの書き込みをサポートします。
  • リアルタイムCDC: 低レイテンシのデータ同期を実現するため、PostgreSQL WALおよびDynamoDB Streamsをネイティブにサポートしています。
  • エンタープライズ対応: mTLS、HashiCorp Vault/Azure Key Vault統合、およびOpenTelemetryによるオブザーバビリティを含みます。

Sources