onnxruntime:跨平台的機器學習模型推論與訓練加速器

onnxruntime:跨平台的機器學習模型推論與訓練加速器

它解決了什麼問題

ONNX Runtime 提供一個高效能、跨平台的引擎,用於執行(推論)和訓練機器學習模型。它解決了模型可移植性與在不同硬體、驅動程式與作業系統間的效能最佳化問題,讓開發者能夠將模型從 PyTorch 或 TensorFlow 等訓練框架順利移轉至生產環境。

工作原理

它充當加速器,利用硬體加速器、圖形最佳化與轉換,提供最佳效能。支援來自深度學習框架(PyTorch、TensorFlow/Keras)以及傳統機器學習函式庫(scikit-learn、LightGBM、XGBoost)的廣泛模型。

目標對象

需要在各種平台部署模型並確保其快速且具成本效益的開發者與機器學習工程師,以及希望在多節點 NVIDIA GPU 上加速 transformer 模型訓練且僅需對 PyTorch 程式碼做最小修改的人員。

重點特色

  • 跨平台支援:可在不同硬體、驅動程式與作業系統上運作。
  • 廣泛的框架相容性:支援來自 PyTorch、TensorFlow/Keras、scikit-learn、LightGBM 與 XGBoost 的模型。
  • 推論加速:透過硬體加速與圖形最佳化,提供更快的使用者體驗與降低成本。
  • 訓練加速:在多節點 NVIDIA GPU 上加速 transformer 模型的訓練,且只需對 PyTorch 程式碼做最小變更。

摘要: 跨平台的機器學習加速器,提供在各種硬體與作業系統上高效能的推論與訓練。

標題: onnxruntime:跨平台的機器學習模型推論與訓練加速器

Sources