Tokenmaxxing 的演變：從強制採用到複合正確性

Tokenmaxxing 的轉變：從強制採用到策略性支出

Tokenmaxxing——最大化大型語言模型（LLM）代幣使用的做法——正從一種粗糙的企業 AI 採用工具，演變為提升輸出品質的技術策略。早期的「tokenmaxxing」是透過讓主管將績效評估與代幣支出掛鉤，迫使抗拒的員工使用 AI 工具；而現在，隨著「複合正確性」新體制的出現，透過迭代過程花費更多代幣，直接與更佳結果產生關聯。

第一波：Tokenmaxxing 作為管理工具

在企業 AI 整合的初期階段，一些組織將代幣支出作為 AI 採用的指標。這導致了扭曲的激勵機制，員工為了達成績效指標，會把代幣燒在毫無意義的任務上——例如讓兩個代理整天互相對話。

故意的摩擦

與其說這只是管理不善，有人認為這是一種有意的「粗暴」政策。透過激勵代幣支出，主管旨在突破高層與持保留態度員工的組織阻力，迫使他們將 AI 融入工作流程。目標是讓 Cursor 等 AI 輔助程式開發環境在全體員工中成為常態。

採用階段的結束

隨著 AI 使用逐漸常態化，且 OpenAI、Anthropic 等供應商的代幣補貼消失（API 價格上升、訂閱限制收緊），透過代幣配額強制採用的動機不復存在。這標誌著第一波 tokenmaxxing 的「死亡」。

第二波：複合正確性

一種新的技術範式正在形成：代幣支出與品質之間的關係變為正相關，而非中性或負相關。這被稱為「複合正確性」。

從複合錯誤到複合正確性

過去，長時間讓 AI 代理在缺乏人工監督的情況下運行，會產生「複合錯誤」——小的幻覺會不可逆地嵌入專案中。這樣的情況下代幣成本較低，因為沒有 24/7 運行的收益。

現在，產業正朝向一種體制發展：在任務上花費更多代幣會提升成功的可能性。這在以下領域尤為明顯：

網路安全：在尋找漏洞的過程中，安全性正變成「工作量證明」系統。防禦者必須花費比攻擊者更多的代幣來發現漏洞，才能加固系統。Anthropic 的 Mythos 模型報告指出，隨著代幣預算提升，模型持續進步，且未出現明顯的報酬遞減。
代理迴圈：使用「迴圈」（讓代理執行至完成一次回合，然後重新提示）可讓代理將龐大的規格拆分成較小的部分，並在無人工監督的情況下逐步解決。

開放模型的角色

開放模型平台將最能受惠於此轉變。因為前沿模型（如 Opus 4.X 系列）的成本遠高於開放模型（如 GLM 5.2），在數學上更可行的是透過較便宜的模型執行更多迴圈，以取得比一次昂貴的前沿模型呼叫更好的結果。

區分開發者生產力與管線低效

並非所有高代幣支出都是有生產力的。關鍵在於區分兩種 tokenmaxxing：

以開發者為中心的支出：使用 Claude Code 等工具提升工程師的生產力。這通常被視為高投資回報率的投資。
以管線為中心的支出：為本可由決定性程式碼處理的任務構建脆弱、非決定性的「代理」管線。這常導致「代理級聯」，即為修正主要代理錯誤而建立的品質檢查代理，成本成三倍增加，卻未提升準確度。

未來展望：軟體工廠

複合正確性的邏輯結論是「軟體工廠」或「暗黑工廠」——一個系統能自動產出程式碼、審查、修復錯誤、編寫測試，且無需人工監督。雖然有些業界聲稱——例如工程師每日花費 1,000 美元代幣——被視為炒作，但背後的動機仍是為了以激進的代幣支出實現自主、高品質的軟體生產。

社群觀點與反駁

向複合正確性的過渡並非沒有批評者。一些業界從業者認為這種轉變被過度渲染：

「大家已經說『現在情況不同了，代理現在是複合成功而非錯誤』至少一年了，但我就是沒看到…我認為找出安全漏洞是個不受此影響的使用案例。」

其他人則認為最初的 tokenmaxxing 只是「高薪經理階層盲目跟風」的症狀，而非策略性採用舉措。也有人擔憂，透過代幣支出強行逼出正向結果，並不能解決 AI 生成程式碼的理解與責任問題。

摘要：Tokenmaxxing 正從一種用於強制 AI 採用的粗糙管理工具，轉變為一種策略性技術方法；在此方法中，透過迭代迴圈增加代幣支出，可提升準確度。

標題：Tokenmaxxing 的演變：從強制採用到複合正確性

Tokenmaxxing 的演變：從強制採用到複合正確性

Tokenmaxxing 的演變：從強制採用到複合正確性

Tokenmaxxing 的轉變：從強制採用到策略性支出

第一波：Tokenmaxxing 作為管理工具

故意的摩擦

採用階段的結束

第二波：複合正確性

從複合錯誤到複合正確性

開放模型的角色

區分開發者生產力與管線低效

未來展望：軟體工廠

社群觀點與反駁

Sources