為何記憶會議文字稿不會提升 AI 程式編寫代理人的效能

會議文字稿對 SWE 代理人沒有效能提升

當 AI 代理人已經能取得其他形式的上下文時，讓它們能搜尋先前的會議文字稿對軟體工程（SWE）任務的效能提升為零。除非有人類介入來整理資訊，否則自動搜尋這些文字稿以改善上下文通常是無效的。

雖然直覺上認為文字稿包含了使用者意圖、被捨棄的方案以及程式碼背後的「為什麼」，但實證測試顯示，這層額外的記憶往往會讓模型表現更差。主要原因是，會議中最有價值的資訊應該被濃縮成永久性的產出——例如文件、提交訊息與 PR 說明——而不是保留為原始對話。

AI 代理人在「意圖漂移」上會遇到困難：模型會把上下文視窗中的每個 token 都當作當前意圖的表達，無論該 token 是否來自先前未審核的隨機決策。

代理人目前無法自行「整理」記憶。他們無法有效移除過時或錯誤的上下文，因為缺乏狀態，只能假設所有輸入的上下文皆為真實。這會導致多項關鍵問題：

與其索引原始文字稿，高效能的代理人工作流程更強調製作耐用的程式碼產出。

代理人不應依賴過去對話的資料庫，而應被指示將有價值的見解儲存於：

雖然文字稿對代理人撰寫程式碼幫助不大，但對人類驗證卻相當有價值。會議紀錄可以揭示代理人所執行的手動驗證步驟——例如使用 Playwright 駕駛應用程式或檢查生產環境設定——這些資訊往往不會被 CI 測試或最終程式碼捕捉到。

實務工作者對會議記憶的效用意見分歧，有人報告出現顯著的負面副作用，也有人認為在特定情境下仍有價值。

許多使用者指出，「被記憶」的上下文會滲透到無關的專案，導致幻覺。一位使用者寫道：

「我得到很多奇怪的輸出，因為上下文被『記憶』了，且滲透到完全不相關的專案與對話中。」

其他人認為目前的記憶實作是一種推論時的特性，模型並未被訓練去處理，因而在「現在發生什麼」與「之前發生了什麼」之間產生混淆。

有些開發者認為會議紀錄對追蹤跨不連續工作階段的狀態不可或缺。一位實務者使用一套提示系統，要求每次會議必須產生日誌或計畫，讓他們能向代理人詢問：「我在 Renovate 上的工作進度如何？」或「我們有修復備份問題嗎？」

此外，也有人發現記憶能顯示出相關的環境限制（例如運營團隊規模），這些資訊使用者可能忘記寫入專案的設定檔（如 CLAUDE.md）。

摘要：研究與實務經驗顯示，為 AI 代理人建立會議文字稿索引對軟體工程任務沒有任何效能提升，且常因意圖漂移而降低模型品質。

標題：為何記憶會議文字稿不會提升 AI 程式編寫代理人的效能