labelme: 一款具備 AI 輔助遮罩與多格式數據集匯出的圖形化圖像標註工具

labelme: 一款具備 AI 輔助遮罩與多格式數據集匯出的圖形化圖像標註工具

它解決了什麼問題

Labelme 是一款圖形化圖像標註工具,旨在幫助用戶為電腦視覺任務建立真值(ground-truth)數據。它簡化了為各種 AI 模型(例如用於物件偵測與分割的模型)標註圖像的過程。

運作原理

該工具使用 Python 編寫並使用 Qt 框架作為介面,允許用戶手動在圖像上繪製形狀(多邊形、矩形、圓形、線條與點)來定義物件。它還整合了使用 SAM (Segment Anything Model)、EfficientSAM 與 YOLO-world 的 AI 輔助功能,以實現更快速的點對多邊形/遮罩(point-to-polygon/mask)以及文字對標註(text-to-annotation)的工作流程。標註結果會儲存為 JSON 檔案,隨後可以匯出為常見的數據集格式,如 VOC 與 COCO。

對象是誰

它適用於正在構建電腦視覺模型的研究人員與開發人員,這些用戶需要為圖像分類、邊界框偵測(bounding box detection)、語義分割(semantic segmentation)與實例分割(instance segmentation)建立高品質的標註數據集。

重點特色

  • 多樣化的標註原語:支援多邊形、矩形、圓形、線條與點工具。
  • AI 輔助標註:整合 SAM、EfficientSAM 與 YOLO-world 以進行自動化遮罩與基於文字的標註。
  • 多格式匯出:可將數據匯出為 VOC 與 COCO 格式,用於語義分割與實例分割。
  • 影片標註:包含對影片影格的標註支援。
  • 全球化存取:提供 20 種不同的語言。
  • 獨立應用程式:為不想管理 Python 或 Qt 依賴項的用戶提供獨立的可執行檔。

Sources