sahi: 대형 이미지에서 작은 객체를 탐지하기 위한 슬라이스 추론 수행용 비전 라이브러리

sahi: 대형 이미지에서 작은 객체를 탐지하기 위한 슬라이스 추론 수행용 비전 라이브러리

해결하는 문제

SAHI는 매우 큰 이미지 내에서 작은 객체를 탐지하는 데 따르는 어려움을 해결합니다. 표준 객체 탐지 모델은 고해상도 이미지를 더 작은 입력 크기로 조정하기 때문에 작은 객체가 중요한 세부 정보를 잃게 되어 작은 객체를 탐지하는 데 종종 어려움을 겪습니다. SAHI는 "슬라이스 추론"을 구현함으로써 이를 극복합니다.

작동 방식

대형 이미지를 단일 단위로 처리하는 대신, SAHI는 이미지를 작고 중첩되는 패치로 슬라이스합니다. 각 패치는 독립적으로 탐지 모델을 통과합니다. 마지막으로, SAHI는 모든 패치의 결과를 원래 이미지 좌표로 다시 병합하여 해상도를 잃지 않고 작은 객체를 더 높은 정밀도로 탐지할 수 있도록 보장합니다.

대상 사용자

위성 이미지, 의료 영상 또는 대규모 산업 검사 등 고해상도 이미지를 다루며 기존 객체 탐지 프레임워크를 사용하여 작은 객체를 탐지해야 하는 개발자와 연구자를 위해 설계되었습니다.

주요 특징

  • Framework Agnostic: Ultralytics (YOLO), MMDetection, HuggingFace, TorchVision, 및 Roboflow의 다양한 인기 모델을 지원합니다.
  • Sliced Inference: 대규모 이미지에서 작은 객체의 고정밀 탐지를 가능하게 합니다.
  • COCO Utilities: COCO 어노테이션 슬라이싱, 데이터셋을 YOLO 형식으로 변환, 및 오류 분석 수행을 위한 도구를 포함합니다.
  • Integration: 예측 결과의 대화형 시각화 및 검사를 위해 FiftyOne과 함께 작동합니다.

Sources