ComputeLibrary: Armハードウェア向けに最適化された低レベル機械学習関数のコレクション
ComputeLibrary: Armハードウェア向けに最適化された低レベル機械学習関数のコレクション
何を解決するか
Compute Libraryは、Armハードウェアに特化して最適化された低レベル機械学習関数のコレクションを提供します。マイクロアーキテクチャの最適化や、SVE2のような新しいArmテクノロジーへの即時サポートを活用することで、他のオープンソースの代替手段と比較して優れたパフォーマンスを提供することを目指しています。
仕組み
このライブラリは、複数の畳み込みアルゴリズム(GeMM、Winograd、FFT、Directなど)を含む100以上のMLプリミティブを実装しており、幅広いデータ型(FP32、FP16、INT8、UINT8、BFLOAT16)をサポートしています。カーネル融合、高速数学、テクスチャ利用などの高度な最適化技術を使用し、OpenCLチューナーとGeMM最適化ヒューリスティックを介してデバイス固有のチューニングが可能です。
対象ユーザー
Android、Linux、macOSなどのさまざまなオペレーティングシステムにおいて、Cortex-A、Neoverse、およびMali GPUを使用するシステム向けのAI/MLアプリケーションを構築する開発者。
ハイライト
- MITライセンスの下での独自のソースソフトウェア。
- Arm Cortex-A、Neoverse、およびMali GPU向けに最適化。
- BFLOAT16およびINT8を含む複数の精度データ型をサポート。
- 軽量なバイナリのための高度に構成可能なビルドオプション。
Sources
- undefinedARM-software/ComputeLibrary