sahi: 一個用於在大圖中執行切片推理以偵測小物件的視覺函式庫

sahi: 一個用於在大圖中執行切片推理以偵測小物件的視覺函式庫

它解決了什麼問題

SAHI 解決了在非常大的圖像中偵測小物件的困難。標準的物件偵測模型通常難以處理小物件,因為它們會將高解析度圖像縮放為較小的輸入尺寸,導致小物件失去關鍵細節。SAHI 透過實作「切片推理」來克服這一點。

運作方式

SAHI 不將大圖作為單一單元進行處理,而是將圖像切片成較小且重疊的補丁 (patches)。接著,每個補丁會獨立通過偵測模型。最後,SAHI 將所有補丁的結果合併回原始圖像座標,確保在不損失解析度的情況下,以更高的精確度偵測小物件。

對象是誰

它是為處理高解析度影像(例如衛星影像、醫療影像或大規模工業檢測)且需要使用現有的物件偵測框架來偵測小物件的開發者和研究人員所設計的。

重點特性

  • Framework Agnostic: 支援來自 Ultralytics (YOLO), MMDetection, HuggingFace, TorchVision, 和 Roboflow 的各種熱門模型。
  • Sliced Inference: 能夠在大規模圖像中對小物件進行高精確度偵測。
  • COCO Utilities: 包含用於切片 COCO 標註、將資料集轉換為 YOLO 格式以及進行錯誤分析的工具。
  • Integration: 可與 FiftyOne 搭配使用,進行預測結果的互動式視覺化與檢視。

Sources