toon: 它是什么,解决了什么问题以及为什么它正受到关注

toon: 它是什么,解决了什么问题以及为什么它正受到关注

它解决了什么问题

TOON (Token-Oriented Object Notation) 降低了向大语言模型 (LLMs) 提供结构化数据的 token 成本。标准的 JSON 通常过于冗长,导致在大型上下文窗口中成本更高,并可能降低效率。TOON 提供了一种紧凑、无损的 JSON 数据模型的表示形式,更易于模型遵循。

它是如何工作的

TOON 作为 JSON 的转换层。它将用于嵌套对象的类 YAML 缩进与用于对象均匀数组的 CSV 风格表格布局相结合。通过一次性声明数组长度 [N] 和字段标题 {fields},它消除了在列表中为每个项目重复键名的需求,从而在保持显式结构的同时显著降低了 token 使用量。

它是为谁准备的

构建 LLM 驱动的应用的开发者,他们需要将大量结构化数据传入模型的 prompt,而又不想产生过高的 token 成本或失去结构可靠性。

亮点

  • Token 效率: 在混合结构基准测试中,比 JSON 使用约 40% 更少的 tokens。
  • JSON 兼容性: JSON 数据模型的无损、即插即用表示形式。
  • LMM 友好型护栏: 包括显式的数组长度和字段标题,以提高解析可靠性。
  • 多语言支持: 提供基于规范的 TypeScript、Python、Go、Rust 和 .NET 实现。
  • 表格化数组: 将均匀的对象数组折叠成紧凑的表格。

Sources