OpenCLI: 인간과 AI 에이전트를 위한 결정론적 CLI 인터페이스로 웹사이트와 브라우저 세션을 변환하는 프레임워크

OpenCLI: 인간과 AI 에이전트를 위한 결정론적 CLI 인터페이스로 웹사이트와 브라우저 세션을 변환하는 프레임워크

해결하는 문제

OpenCLI는 웹사이트, 브라우저 세션, 그리고 Electron 앱을 결정론적인 명령줄 인터페이스(CLI)로 변환합니다. 이를 통해 인간과 AI 에이전트가 웹 기반 서비스와 상호작용할 수 있게 하며—탐색, 양식 입력, 데이터 추출—브라우저 UI를 직접 조작할 필요 없이 사용자의 기존 로그인 세션을 활용합니다.

작동 방식

OpenCLI는 가벼운 Browser Bridge 확장과 로컬 데몬을 사용해 Chrome/Chromium에 연결합니다. open, click, type, extract와 같은 원시 명령 집합을 제공하며, 이를 명령줄에서 호출할 수 있습니다. AI 에이전트를 위해서는 구조화된 DOM 스냅샷을 기반으로 브라우저를 즉석에서 제어할 수 있는 특정 "스킬"(예: opencli-browser)을 제공합니다. 이는 스크린샷이 아니라 DOM 정보를 사용합니다.

대상 사용자

  • 개발자 및 파워 유저: 터미널을 통해 웹 작업을 자동화하거나 사이트 데이터를 접근하고 싶은 사람.
  • AI 에이전트 개발자: 사용자의 인증된 브라우저 세션을 이용해 에이전트가 실제 웹사이트를 조작할 수 있게 하고 싶은 사람.
  • 자동화 엔지니어: 특정 웹사이트에 대한 재사용 가능한 어댑터를 만들고 싶은 사람.

주요 특징

  • AI-Ready 스킬: Claude Code나 Cursor와 같은 에이전트를 위한 전용 스킬을 제공하여 웹을 탐색하고 상호작용할 수 있습니다.
  • 광범위한 내장 어댑터: X(Twitter), Reddit, Bilibili, LinkedIn 등 100개 이상의 사이트에 대한 사전 구성 명령을 포함합니다.
  • CLI 허브: gh, docker와 같은 다른 로컬 바이너리 및 Electron 앱(예: Cursor, ChatGPT App)을 위한 통합 인터페이스 역할을 합니다.
  • 멀티 프로파일 지원: 여러 Chrome 프로파일을 관리하고 전환할 수 있습니다.
  • 유연한 출력: JSON, YAML, CSV, Markdown 등 다양한 데이터 형식을 지원합니다.

요약

웹사이트와 브라우저 세션을 명령줄 인터페이스로 변환하여 인간과 AI 에이전트가 기존 로그인 세션을 활용해 웹 상호작용을 자동화할 수 있게 하는 도구.

제목

OpenCLI: 인간과 AI 에이전트를 위한 결정론적 CLI 인터페이스로 웹사이트와 브라우저 세션을 변환하는 프레임워크

Sources