seekdb
seekdb: それが何であるか、解決する問題、そして注目を集めている理由
解決する課題
seekdb は AI エージェント専用に設計されたステートストアです。連続的かつ高頻度のメモリ書き込みと直後の取得という課題に対処し、従来のベクトルデータベースでしばしば発生するパフォーマンススパイク(P99 レイテンシ)を防ぎます。また、データセット全体をコピーすることなく、分離されたサンドボックスでエージェントがデータを安全に試す方法も提供します。
仕組み
- Async Index Pipeline: 変更ストリームを使用してデータ書き込みとインデックス構築を分離します。これにより、データベースは書き込みを即座にコミットしながら、二層構造の HNSW(インクリメンタルとスナップショット)インデックスを非同期で更新し、同時実行時でもレイテンシをフラットに保ちます。
- Copy-on-Write (COW) Sandboxes:
FORK DATABASEコマンドはデータをコピーせずにデータベースの即時スナップショットを作成します。エージェントはこれらのサンドボックスを変更し、後でMERGEによって変更をメインデータベースに統合するか、破棄することができます。 - Hybrid Search: ベクトル類似度検索、全文検索、スカラー条件フィルタを単一の SQL 実行計画に統合し、クライアント側で結果をマージする必要をなくします。
- MySQL 互換性: OceanBase SQL エンジン上に構築されており、MySQL プロトコルと ACID トランザクションをサポートします。これにより、LangChain や LlamaIndex といった既存ツールと連携可能です。
対象ユーザー
- AI エージェント開発者: パーソナルアシスタント、エンタープライズオートメーション、または高速なストリーミングメモリとステート管理が必要なエージェントプラットフォームを構築する方。
- RAG 開発者: 知識ベース向けにハイブリッド検索システム(ベクトル + 全文検索)が必要なユーザー。
- エッジ AI 開発者: 組み込みまたはマイクロサーバーモードでリソース制約のあるデバイスを対象とする開発者。
ハイライト
- 高性能: Milvus や Elasticsearch と比較して、ストリーミング書き込み+検索ワークロードで大幅に高い QPS を実現。
- 即時サンドボックス化: カーネルレベルの COW により、迅速な実験とロールバックが可能。
- 統合クエリ: ベクトル、全文、リレーショナルデータを 1 つの SQL 文で問い合わせ可能。
- 柔軟なデプロイ: 埋め込みライブラリ、単一ノードサーバー、または分散クラスタとして利用可能。
要約: AI エージェント向けの MySQL 互換ステートストアで、高性能なストリーミング書き込み、ハイブリッドベクトル/全文検索、そして安全な探索のためのコピーオンライトサンドボックスを提供します。
タイトル: seekdb: それが何であるか、解決する問題、そして注目を集めている理由
Sources
- undefinedoceanbase/seekdb