skills: AI 에이전트를 위한 브라우저 자동화 CLI, 안티봇 우회 및 인간-인-루프 핸드오프 지원
skills: AI 에이전트를 위한 브라우저 자동화 CLI, 안티봇 우회 및 인간-인-루프 핸드오프 지원
해결하는 문제
BrowserAct는 인간이 작성한 스크립트가 아니라 AI 에이전트를 위해 특별히 설계된 브라우저 자동화 CLI를 제공합니다. AI 에이전트가 안티봇 방어벽에 차단되고, 여러 격리된 계정을 관리하며, 복잡한 HTML/DOM 구조를 파싱해 웹 페이지와 상호작용하는 데 어려움을 겪는 문제를 해결합니다.
작동 방식
이 도구는 AI 에이전트가 쉘 명령을 실행해 제어할 수 있는 CLI를 통해 동작합니다. 세 가지 안티 차단 레이어를 사용합니다: 환경 스푸핑(지문, TLS, 프록시), 실행 도구(CAPTCHA 해결 및 스텔스 추출), 그리고 에이전트가 막혔을 때 인간이 실시간 URL을 통해 세션을 인계받을 수 있는 인간-인-루프 "remote-assist" 기능.
에이전트의 추론을 단순화하기 위해 복잡한 DOM 파싱을 인덱스화된 상호작용 시스템으로 대체합니다. 에이전트는 페이지 상태의 간소화되고 토큰 효율적인 텍스트 출력에 기반해 click 3 또는 input 2 "..."와 같은 명령만 호출하면 됩니다.
대상 사용자
Claude Code, Cursor, Gemini CLI와 같은 도구를 사용해 AI 에이전트를 구축하고, 에이전트가 탐지되지 않게 신뢰성 있는 웹 자동화, 스크래핑 및 계정 관리를 수행해야 하는 개발자들을 위한 것입니다.
주요 특징
- 안티봇 기능: 스텔스 지문, TLS 회전, 프록시 전환을 사용해 차단을 우회합니다.
- 에이전트 최적화 상호작용: 토큰 사용량을 줄이고 DOM 파싱 필요성을 없애는 간결한 인덱스 텍스트 출력을 제공합니다.
- 인간-인-루프: 복잡한 장애물에 대해 remote-assist URL을 통해 인간에게 원활히 인계합니다.
- 동시성 관리: 병렬 작업 시 교차 오염을 방지하기 위해 독립적인 브라우저 프로필, 쿠키, 지문을 지원합니다.
- Skill Forge: 사이트 API와 데이터 패턴을 자동으로 발견해 배포 가능한 스크래핑 스킬을 생성하는 통합 도구입니다.
Sources
- undefinedbrowser-act/skills