cvat: 高品質なコンピュータビジョン用データセット構築のためのプロフェッショナルなデータアノテーションプラットフォーム

cvat: 高品質なコンピュータビジョン用データセット構築のためのプロフェッショナルなデータアノテーションプラットフォーム

何を解決するか

CVATは、コンピュータビジョンおよびビジュアルAI向けの高品質な視覚的データセットの構築を支援するために設計されたデータアノテーションプラットフォームです。データセット管理とコラボレーションのための集約された環境を提供することで、画像、ビデオ、および3Dポイントクラウドのラベル付けにかかる手動の労力を排除します。

仕組み

ユーザーは、視覚的データをセルフホストサーバー(Docker経由でデプロイ)にアップロードし、ウェブベースのインターフェースを使用して、バウンディングボックス、ポリゴン、マスクなどのラベルを適用します。このプラットフォームは、手動のラベル付けと、外部MLモデル(Nuclio経由)を接続して検出、セグメンテーション、トラッキングなどのタスクを行うAI駆動のオートラベル付けの両方をサポートしています。また、データパイプラインを自動化するためのPython SDK、CLI、およびREST APIも提供しています。

対象ユーザー

データインフラストラクチャを完全に制御しながら、大規模な視覚的データセットを作成・管理する必要がある、研究およびプロダクションAIチーム向けに構築されています。

ハイライト

  • マルチモーダル・アノテーション: 画像、ビデオ、および3Dポイントクラウドをサポート。
  • AI支援ラベル付け: SAM、YOLO、およびMask RCNNなどのモデルと統合し、アノテーションプロセスを高速化。
  • エンタープライズグレードのコラボレーション: マルチユーザーサポート、ロールベースのアクセス制御、タスク割り当て、およびレビューワークフローを含む。
  • 広範なフォーマットサポート: COCO、YOLO、およびPascal VOCを含む、20以上の業界標準フォーマットのインポートおよびエクスポートが可能。
  • クラウド統合: AWS S3、Azure、およびGoogle Cloudなどのクラウドストレージプロバイダーに直接接続。

Sources