skills:一個為 AI 代理設計的瀏覽器自動化 CLI,具備防機器人繞過與人機協作交接功能
skills:一個為 AI 代理設計的瀏覽器自動化 CLI,具備防機器人繞過與人機協作交接功能
它解決了什麼問題
BrowserAct 提供一個專為 AI 代理而非人工腳本設計的瀏覽器自動化 CLI。它解決了 AI 代理被防機器人牆阻擋、需要管理多個獨立帳號,以及代理在解析複雜 HTML/DOM 結構以與網頁互動時的困難。
工作原理
此工具透過 CLI 運作,AI 代理可以執行 shell 指令來控制瀏覽器。它使用三層防阻擋機制:環境偽裝(指紋、TLS、代理)、執行工具(CAPTCHA 解題與 stealth 抽取),以及人機協作的「remote-assist」功能,讓人類在代理卡住時可透過即時 URL 接管會話。
為了簡化代理的推理,它以索引互動系統取代複雜的 DOM 解析,代理只需根據頁面狀態的簡化、節省 token 的文字輸出,呼叫類似 click 3 或 input 2 "..." 的指令即可。
目標對象
開發 AI 代理的開發者(使用 Claude Code、Cursor、或 Gemini CLI 等工具),需要讓代理執行可靠的網頁自動化、資料抓取與帳號管理,且不被偵測為機器人。
重點特色
- 防機器人能力:使用 stealth 指紋、TLS 輪換與代理切換繞過封鎖。
- 代理優化互動:提供緊湊的索引文字輸出,降低 token 用量,免除 DOM 解析需求。
- 人機協作:透過 remote-assist URL 無縫交接給人類,處理複雜阻礙。
- 併發管理:支援獨立的瀏覽器設定檔、Cookie 與指紋,讓平行任務不會相互污染。
- Skill Forge:內建工具可自動發掘網站 API 與資料模式,產生可直接部署的抓取技能。
Sources
- undefinedbrowser-act/skills