cvat: 一個用於建立高品質電腦視覺資料集的專業資料標註平台

cvat: 一個用於建立高品質電腦視覺資料集的專業資料標註平台

它解決了什麼問題

CVAT 是一個資料標註平台,旨在幫助團隊為電腦視覺和視覺 AI 建立高品質的視覺資料集。它透過提供一個集中的資料集管理與協作環境,消除了標註圖像、影片和 3D 點雲的繁瑣手動工作。

運作方式

使用者將視覺資料上傳到自託管伺服器(透過 Docker 部署),並使用網頁介面來套用標籤,例如 bounding boxes、polygons 和 masks。該平台同時支援手動標註與 AI 驅動的自動標註,透過連接外部 ML 模型(經由 Nuclio)來執行偵測、分割和追蹤等任務。它還提供 Python SDK、CLI 和 REST API 以實現資料流程的自動化。

適用對象

它是為研究與生產環境下的 AI 團隊所打造的,這些團隊需要建立並管理大規模視覺資料集,同時對其資料基礎設施保有完全的控制權。

重點特色

  • 多模態標註:支援圖像、影片和 3D 點雲。
  • AI 輔助標註:整合了 SAM、YOLO 和 Mask RCNN 等模型,以加速標註流程。
  • 企業級協作:包含多使用者支援、基於角色的存取控制、任務分配以及審核工作流。
  • 廣泛的格式支援:可匯入與匯出超過 20 種業界標準格式,包括 COCO、YOLO 和 Pascal VOC。
  • 雲端整合:直接連接至 AWS S3、Azure 和 Google Cloud 等雲端儲存供應商。

Sources