ultralytics: 针对 SOTA YOLO 计算机视觉模型的统一框架

ultralytics: 针对 SOTA YOLO 计算机视觉模型的统一框架

What it solves

Ultralytics 为 SOTA 计算机视觉任务提供了一个统一框架。它简化了目标检测、实例分割、语义分割、图像分类和姿态估计模型的训练、验证和部署过程,使这些复杂的 AI 任务变得触手可及且易于使用。

How it works

该项目实现了 YOLO (You Only Look Once) 系列模型,涵盖从早期版本如 YOLOv3 到最新的 YOLO26。用户可以通过命令行界面 (CLI) 进行快速任务,或者使用 ultralytics 包进行 Python 项目的直接集成。该框架支持在自定义数据集上进行训练、使用 mAP 和 mIoU 等指标进行性能评估,并将模型导出为 ONNX 等格式以进行部署。

Who it’s for

它专为开发者、AI 研究人员和工程师设计,旨在将高性能的计算机视觉能力集成到其应用中,从适用于 edge 设备的轻量级模型到适用于大规模基础设施的高精度模型。

Highlights

  • Multi-task Support: 目标检测、跟踪、分割(实例和语义)、分类和姿态估计。

  • Flexible Deployment: 支持导出为 ONNX 和其他格式以进行高效部署。

  • Crosspoint Accessibility: 同时提供 CLI 和 Python API,以适应不同的开发者工作流。

  • SOTA Performance: 提供一系列模型规模(nano, small, medium, large, x-large)以平衡速度和准确性。

Sources