gorilla
gorilla: 무엇인지, 어떤 문제를 해결하는지 & 왜 인기를 얻고 있는지
해결하는 문제
Gorilla는 대규모 언어 모델(LLMs)이 API를 호출하려고 할 때 발생하는 환각(hallucination) 문제를 해결합니다. 생성된 호출이 의미적 및 구문적으로 정확하도록 보장함으로써 LLM이 수천 개의 API를 정확하게 호출할 수 있도록 하여 도구 사용 시의 오류를 줄여줍니다.
작동 방식
Gorilla는 특화된 미세 조정(fine-tuning)과 검색 증강 학습(retrieval-augmented training)을 결합하여 LLM을 방대한 API 컬렉션과 연결합니다. 이 프로젝트는 다음과 같은 도구 모음을 제공합니다:
- OpenFunctions: 여러 언어(Python, Java, JavaScript) 및 REST API를 지원하는 함수 호출용 드롭인 대체제.
- GoEx (Execution Engine): 안전성을 보장하며 LLM이 생성한 작업을 실행하는 샌드박스 런타임으로, 위험을 완화하기 위해 "post-facto validation" 및 실행 취소 기능을 특징으로 합니다.
- API Zoo: 모델을 최신 상태로 유지하고 환각을 줄이기 위해 사용되는 구조화된 API 문서의 커뮤니티 유지 관리 저장소.
- RAFT: 모델이 문서를 직접 인용하도록 학습시키는 도메인 특화 검색 증강 생성(RAG)을 위한 미세 조정 레시피.
대상 사용자
AI 에이전트를 구축하는 개발자, LLM을 외부 서비스와 통합하는 소프트웨어 엔지니어, 그리고 함수 호출 및 도구 사용 벤치마크에 집중하는 연구원.
주요 특징
- 방대한 API 지원: 1,600개 이상의 API를 정확하게 호출할 수 있습니다.
- Berkeley Function Calling Leaderboard (BFCL): 단일 턴, 다중 턴 및 다단계 함수 호출을 평가하기 위한 종합적인 벤치마크.
- Agent Arena: ELO 레이팅 시스템을 사용하는 LLM 에이전트 간의 일대일 비교 플랫폼.
- 안전한 실행: GoEx를 통해 API 호출 및 파일 시스템 작업을 실행하기 위한 Docker 기반의 샌드박스 환경.
- 상업적 준비성: 상업적 이용을 위해 Apache 2.0 라이선스가 적용된 모델을 제공합니다.
Sources
- undefinedShishirPatil/gorilla