labelme: 一个具有 AI 辅助掩码生成和多格式数据集导出功能的图形化图像标注工具

labelme: 一个具有 AI 辅助掩码生成和多格式数据集导出功能的图形化图像标注ing tool

What it solves

What it solves

What it solves

What it solves hought

Wait, I need to translate the content. Let me re-read the body carefully.

labelme: 一个具有 AI 辅助掩码生成和多格式数据集导出功能的图形化图像标注工具

它解决了什么问题

Labelme 是一个图形化图像标注工具,旨在帮助用户为计算机视觉任务创建 ground-truth 数据。它简化了为各种 AI 模型(例如用于目标检测和分割的模型)标注图像的过程。

工作原理

该工具使用 Python 编写,并使用 Qt 框架作为其界面,允许用户在图像上手动绘制形状(多边形、矩形、圆形、直线和点)来定义对象。它还集成了使用 SAM (Segment Anything Model)、EfficientSAM 和 YOLO-world 的 AI 辅助功能,以实现更快的点到多边形/掩码以及文本到标注的工作流程。标注被保存为 JSON 文件,然后可以导出为常见的数据集格式,如 VOC 和 COCO。

面向对象

它面向需要为图像分类、边界框检测、语义分割和实例分割创建高质量标注数据集的计算机视觉模型研究人员和开发人员。

亮点

  • 多样化的标注原语:支持多边形、矩形、圆形、直线和点工具。
  • AI 辅助标注:集成 SAM、EfficientSAM 和 YOLO-world,实现自动掩码和基于文本的标注。
  • 多格式导出:将数据导出为用于语义和实例分割的 VOC 和 COCO 格式。
  • 视频标注:包括对视频帧标注的支持。
  • 全球可用性:支持 20 种不同的语言。
  • 独立应用程序:为不想管理 Python 或 Qt 依赖项的用户提供独立的可执行文件。

Sources