caveman: 這是什麼、解決什麼問題以及為什麼它正受到關注

解決的問題

Caveman 是一個針對 AI agent（例如 Claude Code、Cursor、Gemini 和 Copilot）的插件/技能，旨在減少回應中所使用的輸出 token。它能消除冗餘詞彙和囉嗦的措辭，同時保持完整的技術準確性，從而實現更快的回應速度和更低的 API 成本。

工作原理

它作為一組指令（一個「技能」）運作，告訴 AI agent 捨棄填充詞、使用片段，並僅保留答案的核心實質內容。它支援多種壓縮層級——lite、full、ultra 和 wenyan（文言文）——並可以透過 session flags 或規則文件自動啟用。此外，它還包含一個名為 caveman-compress 的工具，用於將記憶文件（例如 CLAUDE.md）重寫為壓縮格式，以減少每個 session 的輸入 token。

對象

想要減少 token 消耗、提高 AI 回應速度，並在不失去技術精確度的情況下避免冗餘 AI「閒聊」的 AI 編碼 agent 使用者與開發者。

重點摘要

顯著的 Token 減少： 基準測試顯示輸出 token 平均減少了 65%。
多 Agent 支援： 相容於 30 多種 agent，包括 Claude Code、Codex、Gemini、Cursor、Windsurf、Cline 和 Copilot。
語言無關性： 無論使用何種語言（例如葡萄牙語、西班牙語、法語），都能壓縮回應的風格。
Session 統計： 包含 /caveman-stats 指令來追蹤即時 token 使用量和累積節省量。
MCP 中間件： 提供 caveman-shrink 用於壓縮 MCP server 的工具描述。
Context 壓縮： caveman-compress 減少專案記憶文件的尺寸，以節省輸入 token。

caveman: 這是什麼、解決什麼問題以及為什麼它正受到關注

caveman: 這是什麼、解決什麼問題以及為什麼它正受到關注

解決的問題

工作原理

對象

重點摘要

Sources