browser-use: 它是什么，解决了什么问题以及为什么它正受到关注

它解决了什么问题

Browser Use 允许 LLM 与 Web 浏览器进行交互，就像人类一样，使它们能够自动化执行复杂的、多步骤的 Web 任务，例如填写求职申请、购买杂货以及在多个网站上研究信息。

它是如何工作的

该项目提供了一个浏览器框架（harness）和一个由 Rust 驱动的原生核心，为 LLM 提供了一个真实的浏览器操作空间。它将高层级的任务转化为具体的浏览器操作（点击、输入、导航），并包含用于处理错误的恢复循环。用户可以通过 Python API、命令行界面 (CLI) 或完全托管的云端版本来运行该代理（agent），以获得更好的隐蔽性和可扩展性。

它是面向谁的

需要执行 Web 操作的 AI 代理开发者，以及希望通过简单的 Python 脚本或 CLI 自动化重复的浏览器工作流的用户。

亮点

多模型支持：支持包括 OpenAI、Anthropic 和 Google 在内的各种 LLM，以及针对浏览器自动化优化的专用 ChatBrowserUse 模型。
Rust 核心：一个由 Rust 核心驱动的测试版代理，旨在提高性能和可靠性。
自定义工具：能够添加自定义 Python 函数作为工具来扩展代理的能力。
隐蔽性与扩展性：提供云端选项，支持代理轮换、CAPTCHA 解决和隐蔽的浏览器指纹识别，以避免检测。
CLI 工具：用于快速、持久的浏览器自动化和迭代的命令行界面 (CLI)。

browser-use: 它是什么，解决了什么问题以及为什么它正受到关注

browser-use: 它是什么，解决了什么问题以及为什么它正受到关注

它解决了什么问题

它是如何工作的

它是面向谁的

亮点

Sources