sahi: 一个用于在大图中执行切片推理以检测小目标的视觉库

sahi: 一个用于在大图中执行切片推理以检测小目标的视觉库

它解决了什么问题

SAHI 解决了在超大图像中检测小目标的困难。标准的物体检测模型通常难以处理小目标，因为它们会将高分辨率图像调整为较小的输入尺寸，从而导致小目标丢失关键细节。SAHI 通过实现“切片推理”来克服这一问题。

工作原理

SAHI 不再将大图作为一个整体进行处理，而是将图像切片成较小的、重叠的补丁（patches）。每个补丁随后被独立地通过检测模型。最后，SAHI 将所有补丁的结果合并回原始图像坐标，从而确保在不丢失分辨率的情况下，以更高的精度检测到小目标。

适用人群

它专为处理高分辨率图像（如卫星图像、医学影像或大规模工业检测）的开发人员和研究人员设计，这些用户需要使用现有的物体检测框架来检测小目标。

亮点

框架无关性：支持来自 Ultralytics (YOLO), MMDetection, HuggingFace, TorchVision, 和 Roboflow 的广泛流行模型。
切片推理：实现在大规模图像中对小目标进行高精度检测。
COCO Utilities：包含用于切片 COCO 注释、将数据集转换为 YOLO 格式以及进行错误分析的工具。
集成：可与 FiftyOne 配合使用，进行预测结果的交互式可视化和检查。

Sources

undefinedobss/sahi