Tokenmaxxing 的演變:從強制採用到複合正確性

Tokenmaxxing 的演變:從強制採用到複合正確性

Tokenmaxxing 的轉變:從強制採用到策略性支出

Tokenmaxxing——最大化大型語言模型(LLM)代幣使用的做法——正從一種粗糙的企業 AI 採用工具,演變為提升輸出品質的技術策略。早期的「tokenmaxxing」是透過讓主管將績效評估與代幣支出掛鉤,迫使抗拒的員工使用 AI 工具;而現在,隨著「複合正確性」新體制的出現,透過迭代過程花費更多代幣,直接與更佳結果產生關聯。

第一波:Tokenmaxxing 作為管理工具

在企業 AI 整合的初期階段,一些組織將代幣支出作為 AI 採用的指標。這導致了扭曲的激勵機制,員工為了達成績效指標,會把代幣燒在毫無意義的任務上——例如讓兩個代理整天互相對話。

故意的摩擦

與其說這只是管理不善,有人認為這是一種有意的「粗暴」政策。透過激勵代幣支出,主管旨在突破高層與持保留態度員工的組織阻力,迫使他們將 AI 融入工作流程。目標是讓 Cursor 等 AI 輔助程式開發環境在全體員工中成為常態。

採用階段的結束

隨著 AI 使用逐漸常態化,且 OpenAI、Anthropic 等供應商的代幣補貼消失(API 價格上升、訂閱限制收緊),透過代幣配額強制採用的動機不復存在。這標誌著第一波 tokenmaxxing 的「死亡」。

第二波:複合正確性

一種新的技術範式正在形成:代幣支出與品質之間的關係變為正相關,而非中性或負相關。這被稱為「複合正確性」。

從複合錯誤到複合正確性

過去,長時間讓 AI 代理在缺乏人工監督的情況下運行,會產生「複合錯誤」——小的幻覺會不可逆地嵌入專案中。這樣的情況下代幣成本較低,因為沒有 24/7 運行的收益。

現在,產業正朝向一種體制發展:在任務上花費更多代幣會提升成功的可能性。這在以下領域尤為明顯:

  • 網路安全:在尋找漏洞的過程中,安全性正變成「工作量證明」系統。防禦者必須花費比攻擊者更多的代幣來發現漏洞,才能加固系統。Anthropic 的 Mythos 模型報告指出,隨著代幣預算提升,模型持續進步,且未出現明顯的報酬遞減。
  • 代理迴圈:使用「迴圈」(讓代理執行至完成一次回合,然後重新提示)可讓代理將龐大的規格拆分成較小的部分,並在無人工監督的情況下逐步解決。

開放模型的角色

開放模型平台將最能受惠於此轉變。因為前沿模型(如 Opus 4.X 系列)的成本遠高於開放模型(如 GLM 5.2),在數學上更可行的是透過較便宜的模型執行更多迴圈,以取得比一次昂貴的前沿模型呼叫更好的結果。

區分開發者生產力與管線低效

並非所有高代幣支出都是有生產力的。關鍵在於區分兩種 tokenmaxxing:

  1. 以開發者為中心的支出:使用 Claude Code 等工具提升工程師的生產力。這通常被視為高投資回報率的投資。
  2. 以管線為中心的支出:為本可由決定性程式碼處理的任務構建脆弱、非決定性的「代理」管線。這常導致「代理級聯」,即為修正主要代理錯誤而建立的品質檢查代理,成本成三倍增加,卻未提升準確度。

未來展望:軟體工廠

複合正確性的邏輯結論是「軟體工廠」或「暗黑工廠」——一個系統能自動產出程式碼、審查、修復錯誤、編寫測試,且無需人工監督。雖然有些業界聲稱——例如工程師每日花費 1,000 美元代幣——被視為炒作,但背後的動機仍是為了以激進的代幣支出實現自主、高品質的軟體生產。

社群觀點與反駁

向複合正確性的過渡並非沒有批評者。一些業界從業者認為這種轉變被過度渲染:

「大家已經說『現在情況不同了,代理現在是複合成功而非錯誤』至少一年了,但我就是沒看到…我認為找出安全漏洞是個不受此影響的使用案例。」

其他人則認為最初的 tokenmaxxing 只是「高薪經理階層盲目跟風」的症狀,而非策略性採用舉措。也有人擔憂,透過代幣支出強行逼出正向結果,並不能解決 AI 生成程式碼的理解與責任問題。


摘要:Tokenmaxxing 正從一種用於強制 AI 採用的粗糙管理工具,轉變為一種策略性技術方法;在此方法中,透過迭代迴圈增加代幣支出,可提升準確度。

標題:Tokenmaxxing 的演變:從強制採用到複合正確性

Sources