cvat: 고품질 컴퓨터 비전 데이터셋 구축을 위한 전문 데이터 어노테이션 플랫폼

cvat: 고품질 컴퓨터 비전 데이터셋 구축을 위한 전문 데이터 어노테이션 플랫폼

해결하는 문제

CVAT는 컴퓨터 비전 및 시각 AI를 위한 고품질 시각 데이터셋을 팀이 구축하도록 돕기 위해 설계된 데이터 어노테이션 플랫폼입니다. 이미지, 비디오, 3D 포인트 클라우드에 대한 라벨링 작업을 중앙화된 데이터셋 관리 및 협업 환경을 제공함으로써 수작업 라벨링 부담을 없애줍니다.

작동 방식

사용자는 시각 데이터를 자체 호스팅 서버( Docker로 배포) 에 업로드하고, 웹 기반 인터페이스를 통해 바운딩 박스, 폴리곤, 마스크와 같은 라벨을 적용합니다. 이 플랫폼은 수동 라벨링과 외부 ML 모델(Nuclio를 통해 연결) 을 활용한 AI 기반 자동 라벨링을 모두 지원하며, 탐지, 세그멘테이션, 트래킹 등의 작업을 수행할 수 있습니다. 또한 데이터 파이프라인 자동화를 위한 Python SDK, CLI, REST API를 제공합니다.

대상 사용자

대규모 시각 데이터셋을 생성·관리하면서 데이터 인프라에 대한 완전한 통제권을 유지해야 하는 연구 및 프로덕션 AI 팀을 위해 만들어졌습니다.

주요 특징

  • 멀티모달 어노테이션: 이미지, 비디오, 3D 포인트 클라우드를 지원합니다.
  • AI 보조 라벨링: SAM, YOLO, Mask RCNN 등 모델과 통합해 어노테이션 속도를 높입니다.
  • 엔터프라이즈급 협업: 다중 사용자 지원, 역할 기반 접근 제어, 작업 할당, 검토 워크플로우를 포함합니다.
  • 광범위한 포맷 지원: COCO, YOLO, Pascal VOC 등 20여 개 이상의 산업 표준 포맷으로 데이터 수입·수출이 가능합니다.
  • 클라우드 연동: AWS S3, Azure, Google Cloud 등 클라우드 스토리지 제공자와 직접 연결됩니다.

SUMMARY: 고품질 컴퓨터 비전 시각 데이터셋 구축을 위한 오픈소스 데이터 어노테이션 플랫폼으로, 이미지·비디오·3D 어노테이션을 지원합니다.

TITLE: cvat: 고품질 컴퓨터 비전 데이터셋 구축을 위한 전문 데이터 어노테이션 플랫폼

Sources