llmfit: とは何なのか、どのような問題を解決し、なぜ注目を集めているのか
llmfit: とは何なのか、どのような問題を解決し、なぜ注目を集めているのか
解決する問題
llmfit は、ユーザーが特定のハードウェアに最適なサイズの Large Language Model (LLM) を見つけるためのターミナルツールです。システムスペック(RAM、CPU、GPU)を自動的に検出し、品質、速度、適合性の観点からモデルをスコアリングすることで、モデルが VRAM に収まるか、あるいは許容可能な速度で動作するかという推測を不要にします。
仕組み
このツールは、ハードウェアを分析し、数百ものモデルとプロバイダーのデータベースと比較します。システムの帯域幅とメモリに基づいて、各モデルの最適な量子化レベルと予想される 1 秒あたりのトークン数 (tok/s) を計算し、複合スコアを算出します。Ollama、llama.cpp、MLX、Docker Model Runner、および LM Studio を含む複数のローカルランタイムプロバイダーをサポートしています。
対象ユーザー
利用可能なハードウェアに基づいてモデルの選択を最適化したいローカル LLM ユーザー、および、どのモデルが動作可能になるかを確認するためにハードウェアのアップグレードを計画しているユーザーを対象としています。
ハイライト
- ハードウェア検出とシミュレーション: システムスペックを自動的に検出し、または異なるハードウェアをシミュレートして、何が適合するかを確認できます。
- インタラクティブな TUI: モデルの検索、フィルタリング、および比較を行うための、Vim に着想を得たターミナルインターフェースです。
- コミュニティリーダーボード: localmaxxing.com と連携し、他のユーザーの、同様のハードウェアを持つユーザーからの実世界のパフォーマンスデータ (tok/s、TTFT、VRAM) を表示します。
- プランモード: 特定のモデル構成を実行するために必要なハードウェア要件 (VRAM/RAM/CPU) を見積もります。
- ダウンロードマネージャー: モデルのダウンロードとディレクトリ構成を管理するための組み込みツールです。
- ライブ推論ベンチマーク: ローカルで実行中のプロバイダーに対して、実際のパフォーマンス (TTFT、TPS) を測定します。
Sources
- undefinedAlexsJones/llmfit