sahi: 一个用于在大图中执行切片推理以检测小目标的视觉库
sahi: 一个用于在大图中执行切片推理以检测小目标的视觉库
它解决了什么问题
SAHI 解决了在超大图像中检测小目标的困难。标准的物体检测模型通常难以处理小目标,因为它们会将高分辨率图像调整为较小的输入尺寸,从而导致小目标丢失关键细节。SAHI 通过实现“切片推理”来克服这一问题。
工作原理
SAHI 不再将大图作为一个整体进行处理,而是将图像切片成较小的、重叠的补丁(patches)。每个补丁随后被独立地通过检测模型。最后,SAHI 将所有补丁的结果合并回原始图像坐标,从而确保在不丢失分辨率的情况下,以更高的精度检测到小目标。
适用人群
它专为处理高分辨率图像(如卫星图像、医学影像或大规模工业检测)的开发人员和研究人员设计,这些用户需要使用现有的物体检测框架来检测小目标。
亮点
- 框架无关性:支持来自 Ultralytics (YOLO), MMDetection, HuggingFace, TorchVision, 和 Roboflow 的广泛流行模型。
- 切片推理:实现在大规模图像中对小目标进行高精度检测。
- COCO Utilities:包含用于切片 COCO 注释、将数据集转换为 YOLO 格式以及进行错误分析的工具。
- 集成:可与 FiftyOne 配合使用,进行预测结果的交互式可视化和检查。
Sources
- undefinedobss/sahi