caveman: 這是什麼、解決什麼問題以及為什麼它正受到關注
caveman: 這是什麼、解決什麼問題以及為什麼它正受到關注
解決的問題
Caveman 是一個針對 AI agent(例如 Claude Code、Cursor、Gemini 和 Copilot)的插件/技能,旨在減少回應中所使用的輸出 token。它能消除冗餘詞彙和囉嗦的措辭,同時保持完整的技術準確性,從而實現更快的回應速度和更低的 API 成本。
工作原理
它作為一組指令(一個「技能」)運作,告訴 AI agent 捨棄填充詞、使用片段,並僅保留答案的核心實質內容。它支援多種壓縮層級——lite、full、ultra 和 wenyan(文言文)——並可以透過 session flags 或規則文件自動啟用。此外,它還包含一個名為 caveman-compress 的工具,用於將記憶文件(例如 CLAUDE.md)重寫為壓縮格式,以減少每個 session 的輸入 token。
對象
想要減少 token 消耗、提高 AI 回應速度,並在不失去技術精確度的情況下避免冗餘 AI「閒聊」的 AI 編碼 agent 使用者與開發者。
重點摘要
- 顯著的 Token 減少: 基準測試顯示輸出 token 平均減少了 65%。
- 多 Agent 支援: 相容於 30 多種 agent,包括 Claude Code、Codex、Gemini、Cursor、Windsurf、Cline 和 Copilot。
- 語言無關性: 無論使用何種語言(例如葡萄牙語、西班牙語、法語),都能壓縮回應的風格。
- Session 統計: 包含
/caveman-stats指令來追蹤即時 token 使用量和累積節省量。 - MCP 中間件: 提供
caveman-shrink用於壓縮 MCP server 的工具描述。 - Context 壓縮:
caveman-compress減少專案記憶文件的尺寸,以節省輸入 token。
Sources
- undefinedJuliusBrussee/caveman