OpenCLI:将网站和浏览器会话转换为面向人类和 AI 代理的确定性 CLI 界面的框架
OpenCLI:将网站和浏览器会话转换为面向人类和 AI 代理的确定性 CLI 界面的框架
它解决了什么问题
OpenCLI 将网站、浏览器会话和 Electron 应用转换为确定性的命令行界面(CLI)。它使人类和 AI 代理能够与基于网页的服务交互——导航、填写表单、提取数据——无需手动操作浏览器 UI,同时利用用户已有的登录会话。
工作原理
OpenCLI 使用轻量级的 Browser Bridge 扩展和本地守护进程连接到 Chrome/Chromium。它提供一组原语(如 open、click、type 和 extract),可以通过命令行触发。对于 AI 代理,它提供特定的“技能”(例如 opencli-browser),使 LLM 能够使用结构化的 DOM 快照而非截图来临时驱动浏览器。
适用人群
- 开发者和高级用户:希望通过终端自动化网页任务或访问站点数据。
- AI 代理开发者:希望让其代理能够使用用户已认证的浏览器会话操作真实网站。
- 自动化工程师:希望为特定网站创建可复用的适配器。
亮点
- AI 就绪技能:为代理(如 Claude Code 或 Cursor)提供专用技能,以在网页上导航和交互。
- 丰富的内置适配器:为 100 多个站点预配置命令,包括 X(Twitter)、Reddit、哔哩哔哩 和 LinkedIn。
- CLI Hub:充当其他本地二进制文件(如
gh、docker)和 Electron 应用(如 Cursor、ChatGPT App)的统一接口。 - 多配置文件支持:能够管理并在不同的 Chrome 配置文件之间切换。
- 灵活的输出:支持多种数据格式,包括 JSON、YAML、CSV 和 Markdown。
Sources
- undefinedjackwener/OpenCLI