labelme: 一款具備 AI 輔助遮罩與多格式數據集匯出的圖形化圖像標註工具

它解決了什麼問題

Labelme 是一款圖形化圖像標註工具，旨在幫助用戶為電腦視覺任務建立真值（ground-truth）數據。它簡化了為各種 AI 模型（例如用於物件偵測與分割的模型）標註圖像的過程。

運作原理

該工具使用 Python 編寫並使用 Qt 框架作為介面，允許用戶手動在圖像上繪製形狀（多邊形、矩形、圓形、線條與點）來定義物件。它還整合了使用 SAM (Segment Anything Model)、EfficientSAM 與 YOLO-world 的 AI 輔助功能，以實現更快速的點對多邊形/遮罩（point-to-polygon/mask）以及文字對標註（text-to-annotation）的工作流程。標註結果會儲存為 JSON 檔案，隨後可以匯出為常見的數據集格式，如 VOC 與 COCO。

對象是誰

它適用於正在構建電腦視覺模型的研究人員與開發人員，這些用戶需要為圖像分類、邊界框偵測（bounding box detection）、語義分割（semantic segmentation）與實例分割（instance segmentation）建立高品質的標註數據集。

重點特色

多樣化的標註原語：支援多邊形、矩形、圓形、線條與點工具。
AI 輔助標註：整合 SAM、EfficientSAM 與 YOLO-world 以進行自動化遮罩與基於文字的標註。
多格式匯出：可將數據匯出為 VOC 與 COCO 格式，用於語義分割與實例分割。
影片標註：包含對影片影格的標註支援。
全球化存取：提供 20 種不同的語言。
獨立應用程式：為不想管理 Python 或 Qt 依賴項的用戶提供獨立的可執行檔。

labelme: 一款具備 AI 輔助遮罩與多格式數據集匯出的圖形化圖像標註工具

labelme: 一款具備 AI 輔助遮罩與多格式數據集匯出的圖形化圖像標註工具

它解決了什麼問題

運作原理

對象是誰

重點特色

Sources