skills: 专为 AI agent 设计的浏览器自动化 CLI,具备反爬虫绕过与人机协作接管功能
skills: 专为 AI agent 设计的浏览器自动化 CLI,具备反爬虫绕过与人机协作接管功能
它解决了什么问题
BrowserAct 提供了一个专为 AI agent 而非人工编写脚本设计的浏览器自动化 CLI。它解决了 AI agent 被反爬虫墙拦截、管理多个隔离账号以及 agent 在解析复杂的 HTML/DOM 结构以进行网页交互时遇到的困难。
工作原理
该工具通过一个 AI agent 可以执行 shell 命令来控制的 CLI 进行操作。它采用了三层反拦截机制:环境伪装(指纹、TLS、代理)、执行工具(CAPTCHA 验证码破解与隐身提取)以及人机协作的“remote-assist”功能,允许人类在 agent 陷入困境时通过实时 URL 接管会话。
为了简化 agent 的推理过程,它将复杂的 DOM 解析替换为一种索引化交互系统,agent 只需要根据页面状态的简化、高 token 效率的文本输出,调用诸如 click 3 或 input 2 "..." 之类的命令即可。
适用人群
正在构建 AI agent(使用 Claude Code、Cursor 或 Gemini CLI 等工具)的开发者,他们需要其 agent 执行可靠的网页自动化、爬虫抓取和账号管理,且不被识别为机器人。
亮点
- 反爬虫能力:使用隐身指纹、TLS 轮换和代理切换来绕过拦截。
- 面向 Agent 优化的交互:提供紧凑、索引化的文本输出,以减少 token 使用量并消除对 DOM 解析的需求。
- 人机协作:通过 remote-assist URL 实现向人类的无缝接管,以应对复杂的障碍。
- 并发管理:支持独立的浏览器配置文件、cookies 和指纹,用于并行任务以防止交叉污染。
- Skill Forge:一个集成工具,可以自动发现网站 API 和数据模式,从而生成可部署的爬虫技能。
Sources
- undefinedbrowser-act/skills