mirage: AI 에이전트가 다양한 데이터 소스와 상호작용하기 위해 bash 명령을 사용할 수 있게 하는 통합 가상 파일 시스템

mirage: AI 에이전트가 다양한 데이터 소스와 상호작용하기 위해 bash 명령을 사용할 수 있게 하는 통합 가상 파일 시스템

해결하는 문제

Mirage는 AI 에이전트가 다양한 데이터 소스와 서비스와 상호작용할 수 있는 통합된 방법을 제공합니다. 에이전트가 각각의 서비스(S3, Google Drive, Slack 등)에 대해 별도의 SDK나 API를 학습해야 하는 대신, Mirage는 이러한 서비스를 하나의 가상 파일 시스템(VFS)으로 마운트합니다. 이를 통해 이미 bash 명령에 익숙한 LLM이 새로운 어휘를 배우지 않아도 표준 POSIX‑유사 연산을 사용해 서로 다른 백엔드의 데이터를 읽고, 검색하고, 이동할 수 있습니다.

작동 방식

Mirage는 원격 서비스와 데이터 소스를 디렉터리 경로에 매핑하는 "Workspace"를 생성합니다. 디스패처와 캐시 시스템을 활용해 grep, cp, find와 같은 bash‑유사 명령을 해당 백엔드의 API 호출로 변환합니다.

주요 기술 구성 요소는 다음과 같습니다:

  • 통합 인터페이스: Redis, S3, Gmail, GitHub, MongoDB 등을 포함한 50개 이상의 내장 백엔드가 파일 시스템 형태로 제공됩니다.
  • 캐싱: 메타데이터용 인덱스 캐시와 객체 바이트용 파일 캐시 두 층으로 구성된 캐시가 네트워크 지연과 API 호출을 감소시킵니다.
  • 확장성: 사용자는 리소스 유형이나 파일 형식에 따라 새로운 명령을 등록하거나 기존 명령을 재정의할 수 있습니다(예: cat이 Parquet 파일을 JSON으로 렌더링하도록 설정).
  • 임베디드 SDK: Python 및 TypeScript 라이브러리 형태로 제공되어 애플리케이션 내부에서 프로세스 내 실행이 가능합니다.

대상 사용자

다양한 외부 데이터 소스에 접근해야 하는 AI 에이전트를 구축하는 개발자와, 에이전트가 표준 쉘 명령을 사용해 서비스 간 데이터를 조작할 수 있는 코딩‑에이전트와 같은 환경을 제공하고자 하는 사람들을 위한 도구입니다.

주요 특징

  • 통합 VFS: S3, Slack, Gmail 등을 하나의 파일 시스템으로 마운트합니다.
  • Bash‑네이티브: 에이전트가 grep, pipe, wc 등을 별도 설정 없이 다양한 백엔드에서 바로 사용할 수 있습니다.
  • 광범위한 통합: 50개 이상의 내장 백엔드를 지원하며 LangChain, Vercel AI SDK, OpenAI Agents SDK 등 주요 에이전트 프레임워크와 연동됩니다.
  • 휴대 가능한 워크스페이스: 워크스페이스를 복제, 스냅샷, 버전 관리할 수 있습니다.
  • 세밀한 캐싱: 인덱스 및 파일 캐시가 기본 제공되며, 공유 상태를 위한 선택적 Redis 지원도 포함됩니다.

Sources