chroma: 是什麼、解決什麼問題以及為何受到關注

chroma: 是什麼、解決什麼問題以及為何受到關注

解決什麼問題

Chroma 為 AI 提供開源的數據基礎設施,特別專注於嵌入(embeddings)的儲存與檢索。它簡化了為 AI 應用程式建立向量資料庫的過程,讓開發者能夠儲存文件及其相關的元數據(metadata),然後執行相似度搜尋以找到最相關的資訊。

如何運作

Chroma 作為一個向量資料庫,會自動處理分詞(tokenization)、嵌入(embedding)和索引(indexing)。使用者可以建立文件的集合(collections),添加具有唯一 ID 和元數據的文件,並使用查詢文本來查詢這些集合,以根據向量相似度檢索出最相似的結果。它支援記憶體內原型設計(in-memory prototyping)和持久化儲存,也支援客戶端-伺服器模式。

對象是誰

它是為 AI 開發者設計的,這些開發者需要一種快速且簡單的方式,為其 AI 應用程式整合向量搜尋和數據持久化,無論他們是在使用 Python 或 JavaScript 進行原型設計。

重點

  • 向量、混合與全文搜尋功能。
  • 自動處理分詞、嵌入和索引。
  • 簡單的 API,包含建立集合、添加文件和元數據過濾的核心功能。
  • 支援 Python 和 JavaScript 客戶端。
  • 透過 Chroma Cloud 提供託管的無伺服器(serverless)版本。

Sources