OpenCLI:將網站與瀏覽器工作階段轉換為人類與 AI 代理人可使用的確定性 CLI 介面的框架

OpenCLI:將網站與瀏覽器工作階段轉換為人類與 AI 代理人可使用的確定性 CLI 介面的框架

它解決了什麼問題

OpenCLI 能將網站、瀏覽器工作階段以及 Electron 應用程式轉換為確定性的指令列介面(CLI)。它讓人類與 AI 代理人能夠與基於網路的服務互動——瀏覽、填寫表單、擷取資料——而不必手動操作瀏覽器 UI,同時利用使用者已登入的會話。

它如何運作

OpenCLI 使用輕量級的 Browser Bridge 擴充功能與本機 daemon 連接至 Chrome/Chromium。它提供一組原語(如 openclicktypeextract),可透過指令列觸發。對於 AI 代理人,則提供特定的「技能」(例如 opencli-browser),讓大型語言模型能以結構化的 DOM 快照而非螢幕截圖即時駕駛瀏覽器。

目標對象

  • 開發者與進階使用者:想要自動化網路任務或透過終端機存取網站資料。
  • AI 代理人開發者:希望讓其代理人能使用使用者已驗證的瀏覽器會話操作真實網站。
  • 自動化工程師:尋求為特定網站建立可重複使用的轉接器。

重點特色

  • AI 就緒技能:為代理人(如 Claude Code 或 Cursor)提供專屬技能,以在網路上導航與互動。
  • 豐富內建轉接器:預先配置超過 100 個站點的指令,包含 X(Twitter)、Reddit、Bilibili 與 LinkedIn。
  • CLI Hub:作為其他本機二進位檔(例如 ghdocker)與 Electron 應用程式(例如 Cursor、ChatGPT App)的統一介面。
  • 多個人設定檔支援:能管理與切換不同的 Chrome 人設定檔。
  • 彈性輸出:支援多種資料格式,包括 JSON、YAML、CSV 與 Markdown。

Sources