gorilla

gorilla: とは何なのか、どのような問題を解決し、なぜ注目を集めているのか

解決する問題

Gorillaは、大規模言語モデル(LLM)がAPIを呼び出そうとする際に発生するハルシネーション(幻覚)の問題に対処します。生成された呼び出しが意味的および構文的に正しいことを保証することで、LLMが数千ものAPIを正確に呼び出せるようにし、ツール使用時のエラーを削減します。

仕組み

Gorillaは、特化型のファインチューニングと検索拡張トレーニング(retrieval-augmented training)を組み合わせて、LLMを膨大なAPIコレクションに接続します。このプロジェクトは、以下のようなツールスイートを提供しています:

  • OpenFunctions: 関数呼び出し(function calling)のドロップイン代替手段であり、複数の言語(Python, Java, JavaScript)とREST APIをサポートしています。
  • GoEx (Execution Engine): 安全性を保証しながらLLMが生成したアクションを実行するサンドボックス実行環境であり、「事後検証(post-facto validation)」と、リスクを軽減するための「元に戻す(undo)」機能を備えています。
  • API Zoo: モデルを最新の状態に保ち、ハルシネーションを減らすために使用される、構造化されたAPIドキュメントのコミュニティ維持リポジトリです。
  • RAFT: ドメイン特化型の検索拡張生成(RAG)のためのファインチューニング手法であり、モデルがドキュメントを直接引用するようにトレーニングします。

対象者

AIエージェントを構築する開発者、LLMを外部サービスと統合するソフトウェアエンジニア、および関数呼び出しやツール使用のベンチマークに焦点を当てている研究者です。

ハイライト

  • 膨大なAPIサポート: 1,600以上のAPIを正確に呼び出すことが可能です。
  • Berkeley Function Calling Leaderboard (BFCL): シングルターン、マルチターン、およびマルチステップの関数呼び出しを評価するための包括的なベンチマークです。
  • Agent Arena: ELOレーティングシステムを使用してLLMエージェントを直接比較するプラットフォームです。
  • Safe Execution: GoExを介してAPI呼び出しやファイルシステム操作を実行するための、Dockerベースのサンドボックス環境です。
  • Commercial Readiness: 商用利用が可能なApache 2.0ライセンスのモデルを提供しています。

Sources