mirage: AI エージェントが bash コマンドで多様なデータソースとやり取りできる統合バーチャルファイルシステム
mirage: AI エージェントが bash コマンドで多様なデータソースとやり取りできる統合バーチャルファイルシステム
解決する課題
Mirage は、AI エージェントが多様なデータソースやサービスとやり取りするための統一された方法を提供します。エージェントが S3、Google Drive、Slack など各サービスごとに異なる SDK や API を学習する必要がある代わりに、Mirage はこれらのサービスを単一のバーチャルファイルシステム(VFS)としてマウントします。これにより、すでに bash コマンドに熟練している LLM が、標準的な POSIX ライクな操作で新しい語彙を覚えることなく、異なるバックエンド間でデータを読み取り、検索し、移動できるようになります。
仕組み
Mirage はリモートサービスやデータソースをディレクトリパスにマッピングする「Workspace」を作成します。ディスパッチャとキャッシュシステムを使用して、bash ライクなコマンド(例: grep、cp、find)をそれぞれのバックエンド向けの API 呼び出しに変換します。
主な技術コンポーネントは次のとおりです:
- 統一インターフェース: Redis、S3、Gmail、GitHub、MongoDB など 50 以上の組み込みバックエンドがファイルシステムとして提示されます。
- キャッシング: メタデータ用インデックスキャッシュとオブジェクトバイト用ファイルキャッシュの二層キャッシュにより、ネットワーク遅延と API 呼び出しを削減します。
- 拡張性: ユーザーはリソースタイプやファイル形式に基づいて新しいコマンドを登録したり、既存のコマンドをオーバーライドしたりできます(例:
catが Parquet ファイルを JSON に変換して表示)。 - 埋め込み可能 SDK: Python と TypeScript のライブラリとして提供され、アプリケーション内でプロセス内実行が可能です。
対象ユーザー
外部データソースへのアクセスが必要な AI エージェントを構築する開発者、そしてエージェントが標準シェルコマンドを使ってサービス間のデータを操作できるコーディングエージェント的環境を提供したい人向けです。
ハイライト
- 統一 VFS: S3、Slack、Gmail などを単一のファイルシステムとしてマウント。
- Bash ネイティブ: エージェントは
grep、pipe、wcなどをバックエンド間でそのまま使用可能。 - 広範な統合: 50 以上の組み込みバックエンドをサポートし、LangChain、Vercel AI SDK、OpenAI Agents SDK など主要エージェントフレームワークと統合。
- ポータブル Workspace: Workspace はクローン、スナップショット、バージョン管理が可能。
- 詳細なキャッシング: 組み込みのインデックスキャッシュとファイルキャッシュに加え、共有状態用のオプション Redis サポートを提供。
Sources
- undefinedstrukto-ai/mirage