labelme: AI 지원 마스킹 및 다중 형식 데이터셋 내보내기가 가능한 그래픽 이미지 어노테이션 도구
labelme: AI 지원 마스킹 및 다중 형식 데이터셋 내보내기가 가능한 그래픽 이미지 어노테이션 도구
해결하는 문제
Labelme는 컴퓨터 비전 작업을 위한 ground-truth 데이터를 생성하는 데 도움을 주는 그래픽 이미지 어노테이션 도구입니다. 객체 탐지 및 세그멘테이션에 사용되는 모델과 같은 다양한 AI 모델을 위한 이미지 레이블링 프로세스를 단순화합니다.
작동 방식
Python으로 작성되었으며 인터페이스를 위해 Qt 프레임워크를 사용하며, 사용자가 이미지 위에 도형(polygon, rectangle, circle, line, point)을 직접 그려 객체를 정의할 수 있습니다. 또한 SAM (Segment Anything Model), EfficientSAM, YOLO-world를 사용하여 더 빠른 point-to-polygon/mask 및 text-to-annotation 워크플로우를 위한 AI 지원 기능을 통합했습니다. 어노테이션은 JSON 파일로 저장되며, 이후 VOC 및 COCO와 같은 일반적인 데이터셋 형식으로 내보낼 수 있습니다.
대상 사용자
이미지 분류, bounding box 탐지, semantic segmentation, instance segmentation을 위한 고품질 레이블링된 데이터셋을 생성해야 하는 컴퓨터 비전 모델 구축 연구자 및 개발자를 대상으로 합니다.
주요 특징
- 다양한 어노테이션 기본 요소: polygon, rectangle, circle, line, point 도구를 지원합니다.
- AI 지원 레이블링: 자동화된 mask 및 텍스트 기반 어노테이션을 위해 SAM, EfficientSAM, YOLO-world를 통합했습니다.
- 다중 형식 내보내기: semantic 및 instance segmentation을 위한 VOC 및 COCO 형식으로 데이터를 내보냅니다.
- 비디오 어노테이션: 비디오 프레임 어노테이션 지원을 포함합니다.
- 글로벌 접근성: 20가지 다른 언어로 제공됩니다.
- 독립형 앱: Python 또는 Qt 의존성을 관리하고 싶지 않은 사용자를 위해 독립형 실행 파일을 제공합니다.
Sources
- undefinedwkentaro/labelme