gorilla

gorilla: 它是什麼、解決什麼問題以及為什麼它正受到關注

解決什麼問題

Gorilla 解決了大型語言模型 (LLMs) 在嘗試呼叫 API 時產生幻覺的挑戰。它能讓 LLMs 精確地調用數千個 API，透過確保生成的呼叫在語義和語法上都是正確的，從而減少工具使用的錯誤。

如何運作

Gorilla 使用專門的微調和檢索增強訓練的結合，將 LLMs 與海量的 API 集合連接起來。該專案提供了一套工具，包括：

OpenFunctions: 一個可用於函數呼叫的即插即用替代方案，支援多種語言 (Python, Java, JavaScript) 和 REST APIs。
GoEx (Execution Engine): 一個沙盒運行時環境，可在具備安全性保障的情況下執行 LLM 生成的動作，具有「事後驗證」和撤銷功能，以降低風險。
API Zoo: 一個由社群維護的結構化 API 文件庫，用於保持模型更新並減少幻覺。
RAFT: 一種針對特定領域檢索增強生成 (RAG) 的微調配方，訓練模型直接引用文件。

對象是誰

開發 AI agent 的開發者、將 LLMs 與外部服務整合的軟體工程師，以及專注於函數呼叫和工具使用基準測試的研究人員。

重點摘要

海量 API 支援: 能夠精確地調用 1,600+ 個 API。
Berkeley Function Calling Leaderboard (BFCL): 一個用於評估單輪、多輪和多步驟函數呼叫的全面基準測試。
Agent Arena: 一個使用 ELO 等級分系統的 LLM agent 進行對決的比較平台。
安全執行: 基於 Docker 的沙盒環境，透過 GoEx 執行 API 呼叫和檔案系統操作。
商業就緒: 提供 Apache 2.0 授權的模型供商業使用。

Sources

undefinedShishirPatil/gorilla