cvat: 高品質なコンピュータビジョン用データセット構築のためのプロフェッショナルなデータアノテーションプラットフォーム
cvat: 高品質なコンピュータビジョン用データセット構築のためのプロフェッショナルなデータアノテーションプラットフォーム
何を解決するか
CVATは、コンピュータビジョンおよびビジュアルAI向けの高品質な視覚的データセットの構築を支援するために設計されたデータアノテーションプラットフォームです。データセット管理とコラボレーションのための集約された環境を提供することで、画像、ビデオ、および3Dポイントクラウドのラベル付けにかかる手動の労力を排除します。
仕組み
ユーザーは、視覚的データをセルフホストサーバー(Docker経由でデプロイ)にアップロードし、ウェブベースのインターフェースを使用して、バウンディングボックス、ポリゴン、マスクなどのラベルを適用します。このプラットフォームは、手動のラベル付けと、外部MLモデル(Nuclio経由)を接続して検出、セグメンテーション、トラッキングなどのタスクを行うAI駆動のオートラベル付けの両方をサポートしています。また、データパイプラインを自動化するためのPython SDK、CLI、およびREST APIも提供しています。
対象ユーザー
データインフラストラクチャを完全に制御しながら、大規模な視覚的データセットを作成・管理する必要がある、研究およびプロダクションAIチーム向けに構築されています。
ハイライト
- マルチモーダル・アノテーション: 画像、ビデオ、および3Dポイントクラウドをサポート。
- AI支援ラベル付け: SAM、YOLO、およびMask RCNNなどのモデルと統合し、アノテーションプロセスを高速化。
- エンタープライズグレードのコラボレーション: マルチユーザーサポート、ロールベースのアクセス制御、タスク割り当て、およびレビューワークフローを含む。
- 広範なフォーマットサポート: COCO、YOLO、およびPascal VOCを含む、20以上の業界標準フォーマットのインポートおよびエクスポートが可能。
- クラウド統合: AWS S3、Azure、およびGoogle Cloudなどのクラウドストレージプロバイダーに直接接続。
Sources
- undefinedcvat-ai/cvat