chroma: 무엇이며, 어떤 문제를 해결하고 왜 주목받고 있는가

chroma: 무엇이며, 어떤 문제를 해결하고 왜 주목받고 있는가

해결하는 문제

Chroma는 AI를 위한 오픈소스 데이터 인프라스트럭처를 제공하며, 특히 임베딩의 저장 및 검색에 초점을 맞춥니다. AI 애플리케이션을 위한 벡터 데이터베이스를 만드는 과정을 단순화하여, 개발자가 문서와 해당 메타데이터를 저장하고, 유사도 검색을 통해 가장 관련성 높은 정보를 찾을 수 있게 합니다.

작동 방식

Chroma는 토큰화, 임베딩, 인덱싱을 자동으로 처리하는 벡터 데이터베이스 역할을 합니다. 사용자는 문서 컬렉션을 만들고, 고유 ID와 메타데이터와 함께 문서를 추가한 뒤, 쿼리 텍스트를 사용해 벡터 유사도 기반으로 가장 유사한 결과를 조회할 수 있습니다. 메모리 내 프로토타이핑과 영구 저장을 모두 지원하며, 클라이언트‑서버 모드도 제공합니다.

대상 사용자

Python이나 JavaScript로 프로토타이핑을 하든, AI 애플리케이션에 벡터 검색 및 데이터 영속성을 빠르고 쉽게 통합하고자 하는 AI 개발자를 위해 설계되었습니다.

주요 특징

  • 벡터, 하이브리드, 전체 텍스트 검색 기능.
  • 토큰화, 임베딩, 인덱싱을 자동으로 처리.
  • 컬렉션 생성, 문서 추가, 메타데이터 필터링을 위한 핵심 함수들을 제공하는 간단한 API.
  • Python 및 JavaScript 클라이언트 지원.
  • Chroma Cloud를 통한 호스팅 서버리스 버전 제공.

Sources