BrowserOS:它是什么、解决了什么问题以及为什么它正受到关注

BrowserOS:它是什么、解决了什么问题以及为什么它正受到关注

它解决了什么问题

BrowserOS 提供了一个隐私优先、开源的 AI 集成浏览器替代方案。它通过允许用户在 Chromium 分支中使用自己的 API 密钥或本地模型原生运行 AI agent,解决了依赖闭源 AI 浏览器工具的问题,从而确保数据保留在用户的机器上。

它是如何工作的

它是一个结合了使用 TypeScript 和 Go 构建的 agent 平台与 Chromium 分支的系统。该系统使用 Bun server 来通过 Model Context Protocol (MCP) 暴露超过 50 种浏览器自动化工具,使 AI agent 能够使用自然语言进行导航、点击、输入和提取数据。它集成了各种 LLM 提供商(如 OpenAI、Claude、Gemini 以及通过 Ollama 实现的本地选项)并包含一个用于基于终端控制的 CLI。

目标用户

它专为希望获得具有严格隐私控制的 AI 驱动浏览器自动化、希望通过 AI 编程 agent(如 Claude Code)控制浏览器的开发者,以及需要可基准测试的 agentic browser 环境的研究人员而设计。

亮点

  • Native AI Agents:包含 53+ 种用于自然语言浏览器控制的自动化工具。
  • MCP Server:允许外部 MCP 客户端(例如 Claude Code、Gemini CLI)控制浏览器。
  • Cowork Feature:将 Web 自动化与本地文件系统操作相结合。
  • Local Model Support:兼容 Ollama 和 LM Studio,实现完全离线的 AI 使用。
  • Scheduled Tasks:能够按照设定的自动驾驶计划运行 AI agent。
  • Privacy-First:开源 Chromium 分支,具备广告拦截和本地优先的数据处理方式。

Sources