peft: それは何であり、どのような問題を解決し、なぜ注目を集めているのか
peft: それは何であり、どのような問題を解決し、なぜ注目を集めているのか
何を解決するのか
大規模な学習済みモデルのファインチューニングは、その膨大なスケールのため、計算リソースとストレージの面で非常にコストがかかることがよくあります。PEFTは、モデル内のすべてのパラメータを更新する必要なく、これらのモデルを特定のタスクに適応させる方法を提供します。
仕組み
フルファインチューニングの代わりに、PEFTは、ベースモデルを凍結したまま、少数の追加パラメータ(アダプター)のみを更新する手法を実装します。これにより、メモリとストレージの要件が劇的に減少します。量子化と組み合わせることで、モデルデータの精度をさらに下げることができ、コンシューマー向けハードウェアで大規模なモデルをトレーニングすることが可能になります。
対象者
限られたハードウェアリソースで大規模言語モデル(LLMs)や拡散モデル(Stable Diffusionなど)をファインチューニングしたい開発者や研究者、または複数のタスク固有のアダプターを効率的に管理する必要がある人々。
ハイライト
- 膨大なリソースの節約: GPUメモリの使用量とストレージの必要量を削減します(例:フルファインチューニングでは失敗する12Bパラメータのモデルを、80GBのGPUでトレーニングできます)。
- エコシステムとの統合: Hugging Faceの
Transformers,Diffusers,Accelerate, およびTRLとシームレスに動作します。 - 小さなチェックポイント: トレーニングされたアダプターの重みのみを保存するため、チェックポイントのサイズがGB単位ではなく数MBになります。
- 幅広いサポート: LoRA, IA3, および soft prompts を含むさまざまなPEFT手法をサポートしています。
Sources
- undefinedhuggingface/peft