agents-best-practices: 這是什麼、解決什麼問題以及為什麼它正受到關注

解決什麼問題

它解決了建構生產環境安全 AI agent 的挑戰，使其能夠在真實系統中執行有用的工作，而不會給予 LLM 未經審核的直接控制權。它提供了一個框架來設計「harness」（即圍繞模型的運行時控制平面），以確保所有操作都經過驗證、授權並被記錄。

如何運作

這個專案是一個「Agent Skill」，一個可移植的領域知識套件，相容的 AI agent（例如 Claude Code 或 Codex）可以載入。它提供了一套參考指南和藍圖，引導 agent 實作嚴謹的運行時迴圈：指令 $\rightarrow$ 上下文建構器 $\rightarrow$ 模型呼叫 $\rightarrow$ 工具提案 $\rightarrow$ 驗證 $\rightarrow$ 權限決策 $\rightarrow$ 執行 $\rightarrow$ 觀察。

對象是誰

開發人員和架構師，正在為任何領域建構 agentic systems，包括程式碼編寫、研究、支援、營運、銷售、財務、數據分析、採購、法律、醫療保健以及一般工作流自動化。

重點

MVP Blueprints: 為特定領域生成最小化、有用且生產環境安全的 agent harness。
Harness Auditing: 識別運行時失敗點（例如：缺乏預算、上下文壓縮效果不佳）而非僅僅是 prompt 問題。
Permission Mapping: 按風險等級（讀取、草稿、寫入等）對工具進行分類，以確定何時自主行動是安全的，何時需要人工審核。
Runtime Discipline: 強調 harness（而非模型）負責執行操作，且長時間運行的任務需要對步驟、時間和成本設定嚴格的預算。

agents-best-practices: 這是什麼、解決什麼問題以及為什麼它正受到關注

agents-best-practices: 這是什麼、解決什麼問題以及為什麼它正受到關注

解決什麼問題

如何運作

對象是誰

重點

Sources