开源领域中 AI 生成的 PR 垃圾信息激增
开源领域中 AI 生成的 PR 垃圾信息激增
AI 生成的 Pull Request 正在引发“内容垃圾”危机
开源维护者正面临着低质量、AI 生成的 pull request (PR) 的激增,这正重演 2000 年代初期的电子邮件垃圾邮件危机。来自 OpenClaw 仓库的数据显示,随着项目的增长,PR 的数量从每周两个激增到每周 3,400 个,而合并率却从 48% 骤降至 9.3% 以下。
这一趋势是由 AI 编程代理 (coding agents) 驱动的,它们允许用户以近乎零成本提交贡献。在一个极端案例中,一名贡献者在一天内提交了 106 个 PR,提交之间的中位时间仅为三秒。这种规模的“内容垃圾”迫使维护者不得不花费更多时间在过滤噪音,而不是审查有意义的代码。
发送者声誉系统的必要性
为了应对 AI 生成的垃圾信息涌入,开源项目正转向基于身份和声誉的过滤机制。正如电子邮件提供商使用黑名单和发送者历史记录来判断邮件是否进入收件箱一样,PR 管理现在也需要类似的架构来验证贡献者的身份和历史记录。
来自 OpenClaw 的统计证据表明,拥有良好记录的贡献者被合并的可能性显著更高:
- 首次贡献者: 8.2% 的合并率
- 拥有 2-5 个 PR 的贡献者: 10.3% 的合并率
- 拥有 5 个以上 PR 的贡献者: 18.6% 的合并率
一些维护者已经在实施这些解决方案。Ghostty 的创作者 Mitchell Hashimoto 开发了 Vouch,这是一个信任管理系统,要求用户必须经过“担保”才能进行贡献,从而有效地为开源贡献者创建了一个发送者声誉分。
思维多样性的侵蚀
虽然 AI 代理增加了代码库上的“眼睛”数量,但它们可能会减少传统上推动开源创新的视角多样性。当多个贡献者使用相同的 AI 模型(如 Claude, Codex, 或 Cursor)并使用类似的提示词 (prompts) 时,他们会产生相同或近乎相同的贡献。
来自 OpenClaw 的观察结果突显了这种趋同性:
- 四名不同的贡献者提交了标题完全相同的 PR:"feat(web-search): add SearXNG as a search provider."
- 六个人独立尝试修复同一个 Brave Search 本地化 bug,其中两人在 94 分钟内提交了标题完全相同的 PR。
- 五个人独立发现了 agent runner 中的同一个超时死锁问题。
这表明,Linus's Law(“只要眼睛足够多,所有的 bug 都无足轻重”)仅在那些眼睛代表着多样化的人类思维,而不是一组完全相同的 AI 生成输出时才成立。
高上下文上下文贡献优于通用型 AI 输出
数据表明,需要深层架构理解的贡献比通用的功能添加更具被接受的可能性。在 OpenClaw 数据集中,重构 (refactors) 的合并率达到 35%,而新功能的合并率仅为 9%。
这种差异表明,“思考比敲代码更重要”。能够通过审查的贡献通常是那些需要对现有系统有深入理解的任务——这些是 AI 代理无法独立完成的任务。例如,将 Claude Code 的工具流集成到 claude-mem 中可恢复的 Agent SDK observer session 中,是一个需要特定领域专业知识的非显而易见的架构选择。
随着 AI 处理代码的“构建”工作,开源贡献的价值正在转向“架构”——即能够将复杂的系统需求提炼成精确的提示词和检查清单,从而引导 AI 代理走向正确的、高上下文的解决方案的能力。