agents-best-practices: 무엇인지, 어떤 문제를 해결하며, 왜 인기를 얻고 있는지

agents-best-practices: 무엇인지, 어떤 문제를 해결하며, 왜 인기를 얻고 있는지

해결하는 문제

LLM에 감사되지 않은 직접적인 제어권을 부여하지 않으면서, 실제 시스템에서 유직한 작업을 수행할 수 있는 프로덕션 수준의 안전한 AI 에이전트를 구축하는 과제를 해결합니다. 모델을 둘러싸는 런타임 제어 평면인 "harness"를 설계하기 위한 프레임워크를 제공하여, 작업이 검증되고, 권한이 부여되며, 기록되도록 보장합니다.

작동 방식

이 프로젝트는 호환 가능한 AI 에이전트(예: Claude Code 또는 Codex)가 로드할 수 있는 도메인 지식의 휴대 가능한 패키지인 "Agent Skill"입니다. 에이전트가 엄격한 런타임 루프를 구현하도록 안내하는 일련의 참조 가이드와 청사진을 제공합니다: instructions $\rightarrow$ context builder $\rightarrow$ model call $
ightarrow$ tool proposal $
ightarrow$ validation $\rightarrow$ permission decision $
ightarrow$ execution $
ightarrow$ observation.

대상 사용자

코딩, 연구, 지원, 운영, 영업, 금융, 데이터 분석, 조달, 법률, 의료 및 일반 워크플로우 자동화를 포함한 모든 도메인을 위한 에이전트 시스템을 구축하는 개발자와 아키텍트입니다.

주요 특징

  • MVP Blueprints: 특정 도메인을 위한 가장 작고 유용한 프로덕션 수준의 안전한 에이전트 harness를 생성합니다.
  • Harness Auditing: 단순한 프롬프트 문제를 넘어 런타임 실패 지점(예: 예산 부족, 불량한 context compaction)을 식별합니다.
  • Permission Mapping: 도구를 위험 등급(읽기, 초안 작성, 쓰기 등)별로 분류하여 자율적인 작업이 안전한 곳과 인간의 승인이 필요한 곳을 결정합니다.
  • Runtime Discipline: 모델이 아닌 harness가 작업을 실행하며, 장기 실행 작업에는 단계, 시간 및 비용에 대한 엄격한 예산이 필요함을 강조합니다.

Sources