cvat: 一個用於建立高品質電腦視覺資料集的專業資料標註平台
cvat: 一個用於建立高品質電腦視覺資料集的專業資料標註平台
它解決了什麼問題
CVAT 是一個資料標註平台,旨在幫助團隊為電腦視覺和視覺 AI 建立高品質的視覺資料集。它透過提供一個集中的資料集管理與協作環境,消除了標註圖像、影片和 3D 點雲的繁瑣手動工作。
運作方式
使用者將視覺資料上傳到自託管伺服器(透過 Docker 部署),並使用網頁介面來套用標籤,例如 bounding boxes、polygons 和 masks。該平台同時支援手動標註與 AI 驅動的自動標註,透過連接外部 ML 模型(經由 Nuclio)來執行偵測、分割和追蹤等任務。它還提供 Python SDK、CLI 和 REST API 以實現資料流程的自動化。
適用對象
它是為研究與生產環境下的 AI 團隊所打造的,這些團隊需要建立並管理大規模視覺資料集,同時對其資料基礎設施保有完全的控制權。
重點特色
- 多模態標註:支援圖像、影片和 3D 點雲。
- AI 輔助標註:整合了 SAM、YOLO 和 Mask RCNN 等模型,以加速標註流程。
- 企業級協作:包含多使用者支援、基於角色的存取控制、任務分配以及審核工作流。
- 廣泛的格式支援:可匯入與匯出超過 20 種業界標準格式,包括 COCO、YOLO 和 Pascal VOC。
- 雲端整合:直接連接至 AWS S3、Azure 和 Google Cloud 等雲端儲存供應商。
Sources
- undefinedcvat-ai/cvat