steel-browser:為 AI 代理提供內建會話管理與防偵測的開源瀏覽器 API

steel-browser:為 AI 代理提供內建會話管理與防偵測的開源瀏覽器 API

它解決了什麼問題

Steel 提供一套專為 AI 代理與自動化工具設計的瀏覽器 API。它免除開發者必須從頭自行建置與管理複雜的瀏覽器自動化基礎設施的需求,負責處理會話管理、代理輪換以及防偵測等繁重工作,這些往往是與網頁互動的 AI 所面臨的障礙。

工作原理

Steel 使用 Puppeteer 與 Chrome DevTools Protocol(CDP)來管理 Chrome 實例,並將其以 REST API 形式公開。這讓開發者可以透過 Puppeteer、Playwright 或 Selenium 連接。它提供兩種主要的互動模式:用於複雜工作流程的有狀態「會話」以及用於一次性任務(如爬取資料或截圖)的「快速操作」。

目標對象

需要可擴展、受管控的瀏覽器環境,且內建會話持久化與隱蔽功能的 AI 代理、網頁爬蟲與瀏覽器自動化工具開發者。

重點特色

  • 完整的瀏覽器控制:支援 Puppeteer、Playwright 與 Selenium 整合。
  • 會話管理:在請求之間保留 Cookie、Local Storage 與瀏覽器狀態。
  • 防偵測:內建指紋管理與隱蔽插件,避免被封鎖。
  • 代理支援:內建 IP 輪換與代理鏈管理。
  • 瀏覽器工具:提供將頁面快速轉換為 Markdown、可讀性格式、截圖或 PDF 的 API。
  • 擴充功能支援:可載入自訂 Chrome 擴充套件。

Sources