toon: 這是什麼、解決了什麼問題以及為什麼它正受到關注
toon: 這是什麼、解決了什麼問題以及為什麼它正受到關注
解決了什麼問題
TOON (Token-Oriented Object Notation) 降低了向大型語言模型 (LLMs) 提供結構化數據的 token 成本。標準的 JSON 通常過於冗長,導致成本增加,並可能在大型上下文窗口中降低效率。TOON 提供了一種緊湊且無損的 JSON 數據模型表示方式,讓模型更容易遵循。
如何運作
TOON 作為 JSON 的轉換層。它將用於嵌套對象的類 YAML 縮進與用於一致對象數組的 CSV 式表格佈局相結合。透過一次性聲明數組長度 [N] 和字段標題 {fields},它消除了在列表中為每個項目重複鍵值的需求,從而顯著降低了 token 使用量,同時保持了明確的結構。
對象群體
正在構建 LLM 驅動應用程序的開發人員,他們需要在不產生過度 token 成本或失去結構可靠性的情況下,將大量結構化數據傳遞到模型的提示詞 (prompt) 中。
重點摘要
- Token 效率: 在混合結構基準測試中,比 JSON 使用約 40% 更少的 tokens。
- JSON 相容性: JSON 數據模型的無損、即插即用表示方式。
- LMM 友好的護欄: 包含明確的數組長度與字段標題,以提高解析可靠性。
- 多語言支持: 提供基於規範的 TypeScript, Python, Go, Rust, 和 .NET 的實現。
- 表格化數組: 將一致的對象數組壓縮成緊湊的表格。
Sources
- undefinedtoon-format/toon