cvat: 一个用于构建高质量计算机视觉数据集的专业数据标注平台

cvat: 一个用于构建高质量计算机视觉数据集的专业数据标注平台

它解决了什么问题

CVAT 是一个数据标注平台,旨在帮助团队为计算机视觉和视觉 AI 构建高质量的视觉数据集。它通过提供一个集中的数据集管理和协作环境,消除了对图像、视频和 3D 点云进行手动标注的繁琐工作。

工作原理

用户将视觉数据上传到自托管服务器(通过 Docker 部署)并使用基于 Web 的界面来应用诸如 bounding boxes、polygons 和 masks 等标签。该平台支持手动标注,也支持通过连接外部 ML 模型(通过 Nuclio)来实现 AI 驱动的自动标注,用于检测、分割和跟踪等任务。它还提供 Python SDK、CLI 和 REST API,用于自动化数据流水线。

适用对象

它专为研究和生产 AI 团队打造,这些团队需要创建和管理大规模视觉数据集,同时保持对数据基础设施的完全控制。

亮点

  • 多模态标注:支持图像、视频和 3D 点云。
  • AI 辅助标注:集成 SAM、YOLO 和 Mask RCNN 等模型以加速标注过程。
  • 企业级协作:包括多用户支持、基于角色的访问控制、任务分配和审核工作流。
  • 广泛的格式支持:导入和导出超过 20 种行业标准格式的数据,包括 COCO、YOLO 和 Pascal VOC。
  • 云集成:直接连接到 AWS S3、Azure 和 Google Cloud 等云存储提供商。

Sources