OpenCLI: 人間と AI エージェント向けに、ウェブサイトやブラウザセッションを決定論的な CLI インターフェースに変換するフレームワーク
OpenCLI: 人間と AI エージェント向けに、ウェブサイトやブラウザセッションを決定論的な CLI インターフェースに変換するフレームワーク
解決する課題
OpenCLI はウェブサイト、ブラウザセッション、そして Electron アプリを決定論的なコマンドラインインターフェース(CLI)に変換します。人間や AI エージェントがウェブベースのサービスとやり取りできるようにし、ページのナビゲーション、フォーム入力、データ抽出をブラウザ UI を手動で操作することなく実行でき、かつユーザーの既存のログイン済みセッションを活用します。
仕組み
OpenCLI は軽量な Browser Bridge 拡張機能とローカルデーモンを使用して Chrome/Chromium に接続します。open、click、type、extract などのプリミティブをコマンドラインから呼び出せるように提供します。AI エージェント向けには、LLM がスクリーンショットではなく構造化された DOM スナップショットを用いてブラウザを即席で操作できるようにする特定の「スキル」(例: opencli-browser)を提供します。
対象ユーザー
- 開発者・パワーユーザー:ターミナルからウェブタスクを自動化したり、サイトデータにアクセスしたりしたい人。
- AI エージェント開発者:ユーザーの認証済みブラウザセッションを利用して、エージェントに実際のウェブサイトを操作させたい人。
- 自動化エンジニア:特定のウェブサイト向けに再利用可能なアダプターを作成したい人。
ハイライト
- AI 対応スキル:Claude Code や Cursor などのエージェント向けに、ウェブのナビゲーションや操作を行う専用スキルを提供。
- 豊富な組み込みアダプター:X(Twitter)、Reddit、Bilibili、LinkedIn など 100 以上のサイト向けに事前設定されたコマンドを収録。
- CLI ハブ:
gh、dockerなどのローカルバイナリや Electron アプリ(例: Cursor、ChatGPT App)への統一インターフェースとして機能。 - マルチプロファイルサポート:複数の Chrome プロファイルを管理・切り替え可能。
- 柔軟な出力形式:JSON、YAML、CSV、Markdown など複数のデータフォーマットに対応。
要約
ウェブサイトやブラウザセッションをコマンドラインインターフェースに変換し、既存のログイン済みセッションを活用して人間と AI エージェントがウェブ操作を自動化できるツールです。
タイトル
OpenCLI: 人間と AI エージェント向けに、ウェブサイトやブラウザセッションを決定論的な CLI インターフェースに変換するフレームワーク
Sources
- undefinedjackwener/OpenCLI