即将到来的循环:从编码智能体到自主智能体循环的转变
即将到来的循环:从编码智能体到自主智能体循环的转变
向 Harness-Level 循环的转变
软件开发正在超越简单的编码智能体,向“harness-level 循环”迈进。虽然标准的编码智能体在循环中运行(调用工具、读取文件、编辑和测试),但 harness-level 循环是一个管理智能体的外部编排层。这个 harness 会决定任务是否完成;如果未完成,它可能会注入新消息、修改上下文,或者将任务移交给另一台机器,从而在模型通常会发出“已完成”信号后,依然让过程保持活跃状态。
“软件即有机体”的风险
自主循环往往会产生优先考虑局部鲁棒性而非系统完整性的代码,这会导致长期项目的整体代码质量下降。
局部防御性的问题
模型往往“对异常感到极度恐惧”,导致它们倾向于添加局部防御和回退机制,而不是建立强大的不变性(invariants)来使错误状态变得不可能。当置于循环中时,这种行为会被放大:每一次迭代都会增加一层额外的微小防御,使系统看起来更鲁棒,但实际上变得越来越难以理解且更加复杂。
人类理解力的丧失
这一转变标志着从“软件作为确定性机器”——工程师可以剥开层级来理解逻辑——向“软件作为有机体”的转变。在这种模式下,开发者观察症状、提出假设并利用 AI 应用补救措施,对待系统的方式更像是在对待一个生物实体,而非设计的机器。危险在于,未来人类可能不再理解整个系统,只能在不真正理解其工作原理的情况下对其进行处理和稳定化。
自主循环在何处取得成功
尽管对长期架构存在风险,但智能体循环在代码寿命并非首要要求的领域非常有效:
- 代码移植: 大规模自动移植工作(例如,将 Bun 的部分组件从 Zig 移植到 Rust,或将 MiniJinja 移植到 Go)展示了令人印象深刻的结果。
- 性能探索: 机器可以快速进行实验、基准测试并丢弃失败的结果,以寻找最优路径。
- 安全扫描: 对复杂问题空间的自动化探索非常适合研究和漏洞发现。
- 机械化翻译: 可以通过二进制测试用例验证或由另一个 LLM 判断的任务非常适合循环。
循环化未来的必然性
由于外部压力,退出自主循环可能是不可能的:
- 安全不对称性: 攻击者和安全研究人员已经在利用循环来寻找漏洞。防御者必须使用类似的自动化手段,以人类无法手动处理的规模来进行问题分诊和复现。
- 竞争速度: 使用高效编排的小型团队可以通过纯粹的速度优势超越大型团队,更快地生产出功能性产品,无论底层代码是否是“slop”。
- 认知依赖: 存在一种日益增长的“认知依赖”风险,即代码库是由循环生成的、审查和修补的,以至于它们将机器参与作为其维护模型的核心部分。
保持工程学的理性
为了在自主循环的未来生存,行业必须进化其工具链,使其超越简单的编排。目标是找到方法“将人类重新拉回循环中”,使机器产生的变更在长期内是可读的。
下一个工程时代的中心挑战在于:如何在利用智能体循环速度的同时,保留人类的判断力和良好的工程规则。