gorilla: 它是什么,解决了什么问题以及为什么它正受到关注

gorilla: 它是什么,解决了什么问题以及为什么它正受到关注

它解决了什么问题

Gorilla 解决了大语言模型 (LLMs) 在尝试调用 API 时产生幻觉的问题。它通过确保生成的调用在语义和语法上都是正确的,使 LLMs 能够准确地调用数千个 API,从而减少工具使用中的错误。

它是如何工作的

Gorilla 使用专门的微调和检索增强训练相结合的方法,将 LLMs 与海量的 API 集合连接起来。该项目提供了一套工具,包括:

  • OpenFunctions: 一个可直接替换的函数调用替代方案,支持多种语言 (Python, Java, JavaScript) 和 REST APIs。
  • GoEx (Execution Engine): 一个沙箱运行时环境,可以在具有安全保障的情况下执行 LLM 生成的动作,具有“事后验证”和撤销功能,以降低风险。
  • API Zoo: 一个由社区维护的结构化 API 文档库,用于保持模型更新并减少幻觉。
  • RAFT: 一种用于特定领域检索增强生成 (RAG) 的微调方案,训练模型直接引用文档。

它是为谁准备的

构建 AI agent 的开发者、将 LLMs 与外部服务集成的软件工程师,以及专注于函数调用和工具使用基准测试的研究人员。

亮点

  • 海量 API 支持: 能够准确调用 1,600+ 个 API。
  • Berkeley Function Calling Leaderboard (BFCL): 一个用于评估单轮、多轮和多步函数调用的全面基准测试。
  • Agent Arena: 一个使用 ELO 评分系统的 LLM agent 对抗性比较平台。
  • Safe Execution: 基于 Docker 的沙箱环境,通过 GoEx 执行 API 调用和文件系统操作。
  • Commercial Readiness: 提供 Apache 2.0 许可的模型,可用于商业用途。

Sources