BrowserOS:它為何物、解決什麼問題以及為何受到關注
BrowserOS:它為何物、解決什麼問題以及為何受到關注
解決的問題
BrowserOS 提供了一個以隱私為優先、開源的 AI 整合瀏覽器替代方案。它透過允許使用者使用自己的 API keys 或本地模型,在 Chromium fork 中原生運行 AI agents,從而解決了依賴閉源 AI 瀏覽器工具的問題,確保數據保留在使用者自己的機器上。
運作方式
它是一個結合了使用 TypeScript 和 Go 構建的 agent 平台的 Chromium fork。該系統使用 Bun server 來透過 Model Context Protocol (MCP) 提供超過 50 種瀏覽器自動化工具,使 AI agents 能夠使用自然語言進行導航、點擊、輸入和提取數據。它整合了各種 LLM providers(例如 OpenAI、Claude、Gemini 以及透過 Ollama 提供的本地選項)並包含一個用於終端機控制的 CLI。
目標對象
它專為想要具有嚴格隱私控制的 AI 驅動瀏覽器自動化使用者、想要透過 AI coding agents(例如 Claude Code)控制瀏覽器的開發者,以及需要可基準測試的 agentic browser 環境的研究人員而設計。
重點特色
- Native AI Agents:包含 53+ 種用於自然語言瀏覽器控制的自動化工具。
- MCP Server:允許外部 MCP clients(例如 Claude Code、Gemini CLI)控制瀏覽器。
- Cowork Feature:將 Web 自動化與本地文件系統操作相結合。
- Local Model Support:相容於 Ollama 和 LM Studio,實現完全離線的 AI 使用。
- Scheduled Tasks:能夠在設定的自動駕駛排程上運行 AI agents。
- Privacy-First:開源的 Chromium fork,具備廣告攔截和本地優先的數據處理方式。
Sources
- undefinedbrowseros-ai/BrowserOS