toon: 它是什么,解决了什么问题以及为什么它正受到关注
toon: 它是什么,解决了什么问题以及为什么它正受到关注
它解决了什么问题
TOON (Token-Oriented Object Notation) 降低了向大语言模型 (LLMs) 提供结构化数据的 token 成本。标准的 JSON 通常过于冗长,导致在大型上下文窗口中成本更高,并可能降低效率。TOON 提供了一种紧凑、无损的 JSON 数据模型的表示形式,更易于模型遵循。
它是如何工作的
TOON 作为 JSON 的转换层。它将用于嵌套对象的类 YAML 缩进与用于对象均匀数组的 CSV 风格表格布局相结合。通过一次性声明数组长度 [N] 和字段标题 {fields},它消除了在列表中为每个项目重复键名的需求,从而在保持显式结构的同时显著降低了 token 使用量。
它是为谁准备的
构建 LLM 驱动的应用的开发者,他们需要将大量结构化数据传入模型的 prompt,而又不想产生过高的 token 成本或失去结构可靠性。
亮点
- Token 效率: 在混合结构基准测试中,比 JSON 使用约 40% 更少的 tokens。
- JSON 兼容性: JSON 数据模型的无损、即插即用表示形式。
- LMM 友好型护栏: 包括显式的数组长度和字段标题,以提高解析可靠性。
- 多语言支持: 提供基于规范的 TypeScript、Python、Go、Rust 和 .NET 实现。
- 表格化数组: 将均匀的对象数组折叠成紧凑的表格。
Sources
- undefinedtoon-format/toon