yolov5: 一個用於物件偵測、分割與分類的快速且經過生產驗證的電腦視覺框架

yolov5: 一個用於物件偵測、分割與分類的快速且經過生產驗證的電腦視覺框架

它解決了什麼問題

YOLOv5 為電腦視覺任務提供了一個快速、準確且易於使用的框架。它簡化了即時或近乎即時進行物件偵測、影像分割與影像分類的過程,讓開發者與研究人員都能輕鬆上手。

運作原理

YOLOv5 基於 PyTorch 框架構建,實現了 "You Only Look Once" (YOLO) 架構。它允許使用者透過 PyTorch Hub 進行自動模型載入以執行推論,或透過專用的 detect.py 腳本進行推論,該腳本支援多種輸入來源,包括網路攝影機、本地檔案、YouTube URLs 與 RTSP streams。

目標對象

它是為開發者與 AI 從業者設計的,這些使用者需要一個在物件偵測、實例分割與影像分類方面,能平衡速度與準確度的、經過生產驗證的電腦視覺模型。

重點特色

  • 多功能的視覺任務:支援物件偵測、影像分割與影像分類。
  • 廣泛的部署選項:模型可以匯出至 ONNX、TensorRT、TFLite 與 CoreML 等格式,以便部署於各種硬體,包括 NVIDIA Jetson。
  • 靈活的推論:支援多種輸入來源,包括影像、影片、串流與螢幕擷取。
  • 多樣化的模型尺寸:提供從 Nano (YOLOv5n) 到 Extra-large (YOLOv5x) 的各種預訓練權重,以符合不同的硬體限制。
  • 進階訓練工具:包含 AutoBatch、Multi-GPU 訓練與超參數演化等功能。

Sources