toon: 這是什麼、解決了什麼問題以及為什麼它正受到關注

toon: 這是什麼、解決了什麼問題以及為什麼它正受到關注

解決了什麼問題

TOON (Token-Oriented Object Notation) 降低了向大型語言模型 (LLMs) 提供結構化數據的 token 成本。標準的 JSON 通常過於冗長,導致成本增加,並可能在大型上下文窗口中降低效率。TOON 提供了一種緊湊且無損的 JSON 數據模型表示方式,讓模型更容易遵循。

如何運作

TOON 作為 JSON 的轉換層。它將用於嵌套對象的類 YAML 縮進與用於一致對象數組的 CSV 式表格佈局相結合。透過一次性聲明數組長度 [N] 和字段標題 {fields},它消除了在列表中為每個項目重複鍵值的需求,從而顯著降低了 token 使用量,同時保持了明確的結構。

對象群體

正在構建 LLM 驅動應用程序的開發人員,他們需要在不產生過度 token 成本或失去結構可靠性的情況下,將大量結構化數據傳遞到模型的提示詞 (prompt) 中。

重點摘要

  • Token 效率: 在混合結構基準測試中,比 JSON 使用約 40% 更少的 tokens。
  • JSON 相容性: JSON 數據模型的無損、即插即用表示方式。
  • LMM 友好的護欄: 包含明確的數組長度與字段標題,以提高解析可靠性。
  • 多語言支持: 提供基於規範的 TypeScript, Python, Go, Rust, 和 .NET 的實現。
  • 表格化數組: 將一致的對象數組壓縮成緊湊的表格。

Sources