gorilla

gorilla: 它是什麼、解決什麼問題以及為什麼它正受到關注

解決什麼問題

Gorilla 解決了大型語言模型 (LLMs) 在嘗試呼叫 API 時產生幻覺的挑戰。它能讓 LLMs 精確地調用數千個 API,透過確保生成的呼叫在語義和語法上都是正確的,從而減少工具使用的錯誤。

如何運作

Gorilla 使用專門的微調和檢索增強訓練的結合,將 LLMs 與海量的 API 集合連接起來。該專案提供了一套工具,包括:

  • OpenFunctions: 一個可用於函數呼叫的即插即用替代方案,支援多種語言 (Python, Java, JavaScript) 和 REST APIs。
  • GoEx (Execution Engine): 一個沙盒運行時環境,可在具備安全性保障的情況下執行 LLM 生成的動作,具有「事後驗證」和撤銷功能,以降低風險。
  • API Zoo: 一個由社群維護的結構化 API 文件庫,用於保持模型更新並減少幻覺。
  • RAFT: 一種針對特定領域檢索增強生成 (RAG) 的微調配方,訓練模型直接引用文件。

對象是誰

開發 AI agent 的開發者、將 LLMs 與外部服務整合的軟體工程師,以及專注於函數呼叫和工具使用基準測試的研究人員。

重點摘要

  • 海量 API 支援: 能夠精確地調用 1,600+ 個 API。
  • Berkeley Function Calling Leaderboard (BFCL): 一個用於評估單輪、多輪和多步驟函數呼叫的全面基準測試。
  • Agent Arena: 一個使用 ELO 等級分系統的 LLM agent 進行對決的比較平台。
  • 安全執行: 基於 Docker 的沙盒環境,透過 GoEx 執行 API 呼叫和檔案系統操作。
  • 商業就緒: 提供 Apache 2.0 授權的模型供商業使用。

Sources