vearch: それが何か、解決する問題、そして注目を集めている理由

vearch: それが何か、解決する問題、そして注目を集めている理由

解決する課題

Vearch は、AI アプリケーションに不可欠な埋め込みベクトルの効率的な類似検索を処理するために設計された、クラウドネイティブな分散ベクトルデータベースを提供します。数百万件のオブジェクトからの高速取得の必要性と、分散環境でのスケーラビリティと信頼性の維持という課題に対応します。

仕組み

Vearch は、以下の 3 つの主要コンポーネントからなる分散アーキテクチャを採用しています:

  • Master: スキーマ、クラスターレベルのメタデータ、リソース調整を管理します。
  • Router: RESTful API リクエスト(upsert、delete、search、query)を処理し、リクエストをルーティングし、結果をマージします。
  • PartitionServer (PS): Raft ベースのレプリケーションでドキュメントパーティションを保存します。Faiss をベースにしたコアベクトル検索エンジン「Gamma」を利用して、ベクトルとスカラーを保存、インデックス作成、検索します。

対象ユーザー

スケーラブルなメモリバックエンドを必要とする AI アプリケーションを開発する開発者向けです。たとえば Langchain、LlamaIndex を使用する場合や、大規模なビジュアル検索システムを構築する場合に適しています。

ハイライト

  • ハイブリッド検索: ベクトル類似検索とスカラーによるフィルタリングの両方をサポート。
  • 高性能: 数百万件のオブジェクトからミリ秒単位で結果を取得可能。
  • スケーラビリティ: レプリケーションと弾力的なスケールアウト機能を備える。
  • 幅広い統合: Python、Go、Java、Rust 用 SDK を提供し、Langchain や LlamaIndex などの人気フレームワークと統合可能。

Summary:

Vearch は、AI アプリケーション向けに埋め込みベクトルの効率的な類似検索を実現する、クラウドネイティブな分散ベクトルデータベースです。

Title:

vearch: それが何か、解決する問題、そして注目を集めている理由

Sources