spiceai: 클러스터 사이드카 아키텍처를 갖춘 데이터 기반 AI 에이전트를 위한 가속 SQL 및 LLM 추론 엔진
spiceai: 클러스터 사이드카 아키텍처를 갖춘 데이터 기반 AI 에이전트를 위한 가속 SQL 및 LLM 추론 엔진
해결하고자 하는 문제
Spice는 데이터 기반 AI 애플리케이션 및 에이전트를 구축할 때 일반적으로 필요했던 복잡한 데이터 파이프라인과 "글루 코드"를 없애기 위해 설계되었습니다. SQL 쿼리, 검색, LLM 추론을 위한 통합 엔진을 제공하여 개발자가 단독 바이너리, Kubernetes 사이드카, 혹은 분산 클러스터 형태로 실행하든 로컬호스트에서 밀리초 수준의 지연 시간으로 연합 데이터 소스에 접근할 수 있게 합니다.
작동 방식
Spice는 "클러스터 사이드카" 아키텍처를 사용합니다. 가벼운 사이드카가 로컬호스트에서 애플리케이션과 함께 실행되어 범위가 지정된 작업 집합의 데이터를 제공합니다. 더 큰 쿼리의 경우 Apache Ballista 기반의 중앙 Spice 클러스터에 투명하게 위임되어 분산 실행을 수행하고, Spice Cayenne 가속기를 이용해 고성능 컬럼형 데이터 접근을 제공합니다. 30개 이상의 데이터 커넥터(예: Postgres, Snowflake, S3)와 통합되며 실시간 업데이트를 위한 네이티브 CDC를 지원합니다. AI 기능은 SQL 엔진에 직접 통합되어 벡터 검색, 재정렬, 텍스트‑투‑SQL(NSQL)을 단일 쿼리 플랜 내에서 수행할 수 있습니다.
대상 사용자
복잡한 ETL 파이프라인을 관리하는 운영 부담 없이 다양한 연합 데이터 소스에 고성능으로 접근해야 하는 AI 에이전트 및 데이터 집약형 애플리케이션을 개발하는 개발자를 위해 만들어졌습니다.
주요 특징
- 클러스터‑사이드카 아키텍처: 로컬 결과 캐싱, 로컬 작업 집합, 분산 클러스터 위임을 결합해 단계별 지연 시간을 제공합니다.
- AI‑네이티브 런타임: OpenAI 호환 API와 MCP 지원을 통해 LLM 추론, 벡터 검색, 텍스트‑투‑SQL을 SQL 엔진에 직접 통합합니다.
- 고성능 가속: Spice Cayenne 가속기와 Vortex 컬럼형 포맷을 사용해 특정 워크로드에서 DuckDB와 Parquet을 능가합니다.
- 연합 쿼리: 30개 이상의 데이터 소스에 연결하고 표준 SQL을 사용해 Apache Iceberg 테이블에 쓰기를 지원합니다.
- 실시간 CDC: PostgreSQL WAL 및 DynamoDB Streams에 대한 네이티브 지원으로 저지연 데이터 동기화를 제공합니다.
- 엔터프라이즈 준비: mTLS, HashiCorp Vault/Azure Key Vault 통합, OpenTelemetry 관측성을 포함합니다.
SUMMARY: Rust로 작성된 휴대 가능하고 가속된 SQL 쿼리, 검색, LLM 추론 엔진으로, 데이터 기반 AI 앱 및 에이전트가 연합 데이터에 밀리초 수준의 지연 시간으로 접근할 수 있게 합니다.
TITLE: spiceai: 클러스터 사이드카 아키텍처를 갖춘 데이터 기반 AI 에이전트를 위한 가속 SQL 및 LLM 추론 엔진
Sources
- undefinedspiceai/spiceai