peft: それは何であり、どのような問題を解決し、なぜ注目を集めているのか

peft: それは何であり、どのような問題を解決し、なぜ注目を集めているのか

何を解決するのか

大規模な学習済みモデルのファインチューニングは、その膨大なスケールのため、計算リソースとストレージの面で非常にコストがかかることがよくあります。PEFTは、モデル内のすべてのパラメータを更新する必要なく、これらのモデルを特定のタスクに適応させる方法を提供します。

仕組み

フルファインチューニングの代わりに、PEFTは、ベースモデルを凍結したまま、少数の追加パラメータ(アダプター)のみを更新する手法を実装します。これにより、メモリとストレージの要件が劇的に減少します。量子化と組み合わせることで、モデルデータの精度をさらに下げることができ、コンシューマー向けハードウェアで大規模なモデルをトレーニングすることが可能になります。

対象者

限られたハードウェアリソースで大規模言語モデル(LLMs)や拡散モデル(Stable Diffusionなど)をファインチューニングしたい開発者や研究者、または複数のタスク固有のアダプターを効率的に管理する必要がある人々。

ハイライト

  • 膨大なリソースの節約: GPUメモリの使用量とストレージの必要量を削減します(例:フルファインチューニングでは失敗する12Bパラメータのモデルを、80GBのGPUでトレーニングできます)。
  • エコシステムとの統合: Hugging Faceの Transformers, Diffusers, Accelerate, および TRL とシームレスに動作します。
  • 小さなチェックポイント: トレーニングされたアダプターの重みのみを保存するため、チェックポイントのサイズがGB単位ではなく数MBになります。
  • 幅広いサポート: LoRA, IA3, および soft prompts を含むさまざまなPEFT手法をサポートしています。

Sources