browser-harness: 它是什么,解决了什么问题以及为什么它正受到关注
browser-harness: 它是什么,解决了什么问题以及为什么它正受到关注
解决了什么问题
浏览器工具箱 (browser-harness) 通过 Chrome DevTools Protocol (CDP) 为大语言模型 (LLMs) 提供了一种直接与真实 Web 浏览器交互的方式。它移除了智能体 (agent) 与浏览器之间的限制性层级,允许智能体以完全的自由度执行复杂任务,并能够在执行过程中修改其自身的辅助代码以克服障碍。
工作原理
该系统使用一个轻量级的 CDP 工具箱,将 LLM 连接到正在运行的 Chrome 或 Chromium 浏览器。当智能体遇到无法使用现有工具完成的任务时,它可以编写并编辑其自身的辅助函数,并在专用工作区 (agent_helpers.py) 中进行,或者在单独的目录中创建可重用的特定于站点的“领域技能” (domain skills)。这使得智能体能够提升自身能力并从每次运行中学习。
适用人群
它专为希望使用编程智能体 (如 Claude Code 或 Codex) 自动化浏览器任务的用户,以及那些需要对 AI 智能体如何与 Web 交互进行高度灵活性和控制权的用户而设计。
亮点
- 自我改进: 智能体可以即时编写并更新其自身的辅助代码和技能以解决问题。
- 直接连接: 使用 websocket 直接通过 CDP 连接到 Chrome,最大限度地减少了抽象层。
- 轻量级架构: 核心包很小,由分布在四个核心文件中的约 1,000 行代码组成。
- 云端集成: 支持通过 Browser Use Cloud 连接到本地浏览器或隐身/无头浏览器。
Sources
- undefinedbrowser-use/browser-harness