MetaClaw: 실세계 대화를 통해 AI 어시스턴트가 메타 학습하고 진화할 수 있게 하는 에이전트 프록시

MetaClaw: 실세계 대화를 통해 AI 어시스턴트가 메타 학습하고 진화할 수 있게 하는 에이전트 프록시

해결하는 문제

MetaClaw는 AI 에이전트가 배포 후 정체되는 문제를 해결합니다. 오프라인 학습에만 의존하는 대신, 사용자가 GPU 클러스터를 관리할 필요 없이 실세계의 실제 대화를 통해 에이전트가 지속적으로 학습하고 진화하며, 시간이 지남에 따라 성능을 개선하고 사용자 선호도를 반영할 수 있도록 합니다.

작동 방식

MetaClaw는 개인용 에이전트(OpenClaw, CoPaw 또는 NanoClaw와 같은)와 LLM API 사이에서 투명한 프록시 역할을 합니다. 상호작용을 가로채어 관련 기술(skills)을 주입하고 장기 기억을 유지합니다.

모드에 따라 학습 방식이 달라집니다:

  • Skills Mode: 대화를 짧은 Markdown 지침(skills)으로 자동 요약하여, 향후 프롬프트에 검색 및 주입합니다.
  • RL Mode: 판사 역할을 하는 LLM(PRM)을 사용하여 비동기적으로 응답을 점수화하고, Tinker, MinT 또는 Weaver와 같은 클라우드 기반 백엔드를 통해 LoRA 파인튜닝을 수행합니다.
  • Auto Mode: Skills와 RL을 결합하여, 스마트 스케줄러를 사용하여 가중치 업데이트를 유객 시간(수면, 유휴 시간 또는 캘린더 회의)으로 미루어 에이전트가 중단되지 않도록 합니다.

대상 사용자

로컬의 고사양 하드웨어가 필요하지 않으면서도, 세션 간에 사실, 선호도, 프로젝트 이력을 기억하고 진화하는 어시스턴트를 원하는 개인용 AI 에이전트 사용자들을 위해 설계되었습니다.

주요 특징

  • One-click deployment: 지원되는 개인용 에이전트를 자동으로 구성하는 간단한 CLI 설정.
  • Multi-agent support: OpenAI-compatible 또는 Anthropic-native 엔드포인트를 통해 OpenClaw, CoPaw, IronClaw 등을 포함한 다양한 에이전트와 호환됩니다.
  • Long-term memory: 세션 간의 사실과 선호도를 유지하여 일관된 컨텍스트를 제공합니다.
  • Asynchronous architecture: 서빙, 보상 모델링, 학습을 분리하여 실제 사용 중 지연 시간을 최소화합니다.
  • Flexible RL backends: Tinker, MinT, Weaver를 포함한 여러 클라우드 학습 제공업체를 지원합니다.

Sources