오픈 소스에서 AI가 생성한 PR 스팸의 증가

오픈 소스에서 AI가 생성한 PR 스팸의 증가

AI가 생성한 풀 리퀘스트가 "슬롭" 위기를 만들고 있습니다

오픈 소스 유지보수자들은 2000년대 초반 이메일 스팸 위기와 유사한, 저노력 AI 생성 풀 리퀘스트(PR)의 급증에 직면하고 있습니다. OpenClaw 저장소의 데이터에 따르면 프로젝트가 성장함에 따라 PR 양이 주당 2개에서 주당 3,400개로 급증했으며, 병합 비율은 48%에서 9.3% 이하로 급락했습니다.

이 추세는 사용자가 거의 비용 없이 기여를 제출할 수 있게 해주는 AI 코딩 에이전트에 의해 주도됩니다. 한 극단적인 사례에서는 한 기여자가 하루에 106개의 PR을 제출했으며, 제출 간 평균 시간은 3초였습니다. 이러한 "슬롭" 양은 유지보수자들이 의미 있는 코드를 검토하기보다 잡음을 걸러내는 데 더 많은 시간을 소비하도록 강요합니다.

발신자 평판 시스템의 필요성

AI가 생성한 스팸의 유입에 맞서기 위해 오픈 소스 프로젝트는 신원 및 평판 기반 필터링으로 전환하고 있습니다. 이메일 제공업체가 차단 목록과 발신자 기록을 사용해 메시지가 받은 편지함에 도달할지를 판단하듯, PR 관리 역시 기여자의 신원과 이력을 검증하는 유사한 인프라가 필요합니다.

OpenClaw의 통계적 증거에 따르면 검증된 실적을 가진 기여자는 병합될 가능성이 현저히 높습니다:

  • 첫 번째 기여자: 8.2% 병합 비율
  • 2-5개의 PR을 가진 기여자: 10.3% 병합 비율
  • 5개 이상의 PR을 가진 기여자: 18.6% 병합 비율

일부 유지보수자는 이미 이러한 솔루션을 구현하고 있습니다. Ghostty의 창시자 Mitchell Hashimoto는 Vouch를 개발했으며, 이는 사용자가 기여하기 위해 "보증"을 받아야 하는 신뢰 관리 시스템으로, 오픈 소스 기여자에 대한 발신자 평판 점수를 효과적으로 생성합니다.

사고 다양성의 침식

AI 에이전트가 코드베이스에 대한 "눈"의 수를 늘리지만, 전통적으로 오픈 소스 혁신을 이끌어 온 사고 다양성을 감소시킬 수 있습니다. 여러 기여자가 동일한 AI 모델(예: Claude, Codex, Cursor)과 유사한 프롬프트를 사용할 때, 그들은 거의 동일한 기여를 만들어냅니다.

OpenClaw의 관찰 결과는 이러한 수렴을 보여줍니다:

  • 네 명의 별도 기여자가 정확히 같은 제목의 PR을 제출했습니다: "feat(web-search): add SearXNG as a search provider."
  • 여섯 명이 독립적으로 동일한 Brave Search 로케일 버그를 수정하려 했으며, 그 중 두 명은 94분 이내에 동일한 제목을 제출했습니다.
  • 다섯 명이 독립적으로 에이전트 러너에서 동일한 타임아웃 교착 상태를 발견했습니다.

이는 Linus's Law(“충분히 많은 눈이 있으면 모든 버그는 얕아진다”)가 그 눈들이 다양한 인간 사고를 대표할 때만 성립한다는 것을 시사합니다. 동일한 AI 생성 결과물만으로는 충분하지 않습니다.

고컨텍스트 기여가 일반 AI 출력보다 우수함

데이터에 따르면 깊은 아키텍처 이해가 필요한 기여는 일반적인 기능 추가보다 훨씬 높은 병합 확률을 보입니다. OpenClaw 데이터셋에서 리팩터링은 35%의 병합 비율을 보이는 반면, 새로운 기능은 9%에 불과합니다.

이 격차는 "생각이 타이핑보다 중요하다"는 것을 나타냅니다. 리뷰를 통과하는 기여는 대개 기존 시스템에 대한 깊은 이해를 요구하는 작업이며, 이는 AI 에이전트가 단독으로 수행할 수 없습니다. 예를 들어 claude-mem에서 Claude Code의 도구 스트림을 재개 가능한 Agent SDK 옵저버 세션에 통합한 것은 비직관적인 아키텍처 선택으로, 특정 도메인 전문 지식이 필요합니다.

AI가 코드 "구축"을 담당함에 따라 오픈 소스 기여의 가치는 "아키텍처" 쪽으로 이동하고 있습니다—복잡한 시스템 요구사항을 정확한 프롬프트와 체크리스트로 추출해 AI 에이전트를 올바른 고컨텍스트 솔루션으로 이끄는 능력이 중요해지고 있습니다.

요약: OpenClaw 저장소에 대한 통계적 연구는 풀 리퀘스트 병합 비율의 급격한 감소와 중복된 AI 생성 기여의 급증을 보여주며, 오픈 소스에서 발신자 평판 시스템의 필요성을 시사합니다.

제목: 오픈 소스에서 AI가 생성한 PR 스팸의 증가

Sources