sahi: 大規模画像内の小さな物体を検出するためのスライス推論を実行するビジョンライブラリ

sahi: 大規模画像内の小さな物体を検出するためのスライス推論を実行するビジョンライブラリ

何を解決するか

SAHIは、非常に大きな画像内での小さな物体の検出の難しさに取り組んでいます。標準的な物体検出モデルは、高解像度画像を小さな入力サイズにリサイズするため、小さな物体が重要な詳細を失ってしまうことが多く、小さな物体の検出に苦戦します。SAHIは「スライス推論」を実装することで、これを克服します。

仕組み

大きな画像を単一のユニットとして処理する代わりに、SAHIは画像をより小さな、重なり合うパッチにスライスします。各パッチは、その後、独立して検出モデルに渡されます。最後に、SAHIはすべてのパッチからの結果を元の画像の座標にマージし、解像度を失うことなく、小さな物体を高精度に検出することを保証します。

対象ユーザー

衛星画像、医療画像、または大規模な産業検査など、高解像度の画像を使用し、既存の物体検出フレームワークを使用して小さな物体を検出する必要がある開発者や研究者向けに設計されています。

ハイライト

  • Framework Agnostic: Ultralytics (YOLO), MMDetection, HuggingFace, TorchVision, および Roboflow からの幅広い人気モデルをサポートしています。
  • Sliced Inference: 大規模画像における小さな物体の高精度な検出を可能にします。
  • COCO Utilities: COCOアノテーションのスライス、データセットのYOLO形式への変換、およびエラー分析を実行するためのツールが含まれています。
  • Integration: 予測結果のインタラクティブな可視化と検査のために FiftyOne と連携して動作します。

Sources