peft: 무엇이며, 어떤 문제를 해결하고 왜 주목받고 있는가
peft: 무엇이며, 어떤 문제를 해결하고 왜 주목받고 있는가
해결하는 문제
대규모 사전 학습 모델을 파인튜닝하는 것은 그 규모가 방대하기 때문에 연산 및 저장 측면에서 비용이 너무 많이 듭니다. PEFT는 모델의 모든 파라미터를 업데이트하지 않고도 특정 작업에 맞게 모델을 조정할 수 있는 방법을 제공합니다.
작동 원리
전체 파인튜닝 대신, PEFT는 기본 모델을 고정한 채 소수의 추가 파라미터(어댑터)만 업데이트하는 방식을 구현합니다. 이를 통해 메모리와 저장 요구량이 크게 감소합니다. 또한 양자화와 결합하면 모델 데이터의 정밀도를 더욱 낮출 수 있어, 일반 소비자용 하드웨어에서도 대규모 모델을 학습할 수 있게 합니다.
대상 사용자
제한된 하드웨어 자원으로 대형 언어 모델(LLM)이나 확산 모델(예: Stable Diffusion)을 파인튜닝하고 싶거나, 여러 작업별 어댑터를 효율적으로 관리해야 하는 개발자와 연구자.
주요 특징
- 엄청난 자원 절감: GPU 메모리 사용량과 저장 공간을 감소시킵니다(예: 12B 파라미터 모델을 전체 파인튜닝이 불가능한 80GB GPU에서 학습 가능).
- 생태계 통합: Hugging Face
Transformers,Diffusers,Accelerate,TRL과 원활하게 작동합니다. - 작은 체크포인트: 학습된 어댑터 가중치만 저장하므로 체크포인트가 몇 MB에 불과하고 GB 수준이 아닙니다.
- 폭넓은 지원: LoRA, IA3, soft prompts 등 다양한 PEFT 방식을 지원합니다.
요약
Parameter-Efficient Fine-Tuning(PEFT) 라이브러리는 대규모 사전 학습 모델의 파라미터 중 극히 일부만 학습함으로써 연산 및 저장 비용을 줄이며 모델을 효율적으로 맞춤화할 수 있게 해줍니다.
제목
peft: 무엇이며, 어떤 문제를 해결하고 왜 주목받고 있는가
Sources
- undefinedhuggingface/peft