gorilla
gorilla: 它是什麼、解決什麼問題以及為什麼它正受到關注
解決什麼問題
Gorilla 解決了大型語言模型 (LLMs) 在嘗試呼叫 API 時產生幻覺的挑戰。它能讓 LLMs 精確地調用數千個 API,透過確保生成的呼叫在語義和語法上都是正確的,從而減少工具使用的錯誤。
如何運作
Gorilla 使用專門的微調和檢索增強訓練的結合,將 LLMs 與海量的 API 集合連接起來。該專案提供了一套工具,包括:
- OpenFunctions: 一個可用於函數呼叫的即插即用替代方案,支援多種語言 (Python, Java, JavaScript) 和 REST APIs。
- GoEx (Execution Engine): 一個沙盒運行時環境,可在具備安全性保障的情況下執行 LLM 生成的動作,具有「事後驗證」和撤銷功能,以降低風險。
- API Zoo: 一個由社群維護的結構化 API 文件庫,用於保持模型更新並減少幻覺。
- RAFT: 一種針對特定領域檢索增強生成 (RAG) 的微調配方,訓練模型直接引用文件。
對象是誰
開發 AI agent 的開發者、將 LLMs 與外部服務整合的軟體工程師,以及專注於函數呼叫和工具使用基準測試的研究人員。
重點摘要
- 海量 API 支援: 能夠精確地調用 1,600+ 個 API。
- Berkeley Function Calling Leaderboard (BFCL): 一個用於評估單輪、多輪和多步驟函數呼叫的全面基準測試。
- Agent Arena: 一個使用 ELO 等級分系統的 LLM agent 進行對決的比較平台。
- 安全執行: 基於 Docker 的沙盒環境,透過 GoEx 執行 API 呼叫和檔案系統操作。
- 商業就緒: 提供 Apache 2.0 授權的模型供商業使用。
Sources
- undefinedShishirPatil/gorilla