OpenCLI:将网站和浏览器会话转换为面向人类和 AI 代理的确定性 CLI 界面的框架

OpenCLI:将网站和浏览器会话转换为面向人类和 AI 代理的确定性 CLI 界面的框架

它解决了什么问题

OpenCLI 将网站、浏览器会话和 Electron 应用转换为确定性的命令行界面(CLI)。它使人类和 AI 代理能够与基于网页的服务交互——导航、填写表单、提取数据——无需手动操作浏览器 UI,同时利用用户已有的登录会话。

工作原理

OpenCLI 使用轻量级的 Browser Bridge 扩展和本地守护进程连接到 Chrome/Chromium。它提供一组原语(如 openclicktypeextract),可以通过命令行触发。对于 AI 代理,它提供特定的“技能”(例如 opencli-browser),使 LLM 能够使用结构化的 DOM 快照而非截图来临时驱动浏览器。

适用人群

  • 开发者和高级用户:希望通过终端自动化网页任务或访问站点数据。
  • AI 代理开发者:希望让其代理能够使用用户已认证的浏览器会话操作真实网站。
  • 自动化工程师:希望为特定网站创建可复用的适配器。

亮点

  • AI 就绪技能:为代理(如 Claude Code 或 Cursor)提供专用技能,以在网页上导航和交互。
  • 丰富的内置适配器:为 100 多个站点预配置命令,包括 X(Twitter)、Reddit、哔哩哔哩 和 LinkedIn。
  • CLI Hub:充当其他本地二进制文件(如 ghdocker)和 Electron 应用(如 Cursor、ChatGPT App)的统一接口。
  • 多配置文件支持:能够管理并在不同的 Chrome 配置文件之间切换。
  • 灵活的输出:支持多种数据格式,包括 JSON、YAML、CSV 和 Markdown。

Sources