ort: ハードウェア加速された ONNX モデルの推論および学習のための Rust インターフェース
ort: ハードウェア加速された ONNX モデルの推論および学習のための Rust インターフェース
何を解決するか
ort は、ONNX 形式の機械学習モデルを実行するための高性能な Rust インターフェースを提供します。PyTorch、TensorFlow、Keras、scikit-learn、および PaddlePaddle のようなフレームワークで作成されたモデルのデプロイを簡素化し、データセンターからエンドユーザーのデバイスまで、さまざまな環境のさまざまなハードウェアアクセラレータ上で効率的に実行できるようにします。
仕組み
Microsoft の ONNX Runtime ライブラリのラッパーとして機能すると同時に、他の純粋な Rust ランタイムもサポートします。これにより、Rust 開発者は、複雑な低レベルのバインディングを記述することなく、ONNX モデルの推論と学習の両方でハードウェア加速を利用できます。
対象者
高いパフォーマンスとハードウェア加速を備えた機械学習モデルを、デバイス上またはクラウドにデプロイする必要がある Rust 開発者。
ハイライト
- 幅広いフレームワークのサポート: PyTorch、TensorFlow、Keras、scikit-learn、および PaddlePaddle のモデルをサポートします。
- ハードウェア加速: ONNX Runtime を介して、ほぼすべてのハードウェアアクセラレータと互換性があります。
- 多用途なデプロイ: デバイス上での使用に適した軽量さと、データセンターへのデプロイに適した強力な機能を兼ね備えています。
- 幅広い採用: Hugging Face の Text Embeddings Inference (TEI) や Google の Magika のようなプロジェクトで使用されています。
Sources
- undefinedpykeio/ort