Gemini-API: Google Gemini ウェブアプリ用のリバースエンジニアリングされた非同期 Python ラッパー

Gemini-API: Google Gemini ウェブアプリ用のリバースエンジニアリングされた非同期 Python ラッパー

何を解決するか

リバースエンジニアリングされた非同期 Python ラッパーを使用して、Google Gemini ウェブアプリ(旧 Bard)とプログラム的に対話する方法を提供します。これにより、開発者は公式 API に依存せずに Gemini のウェブベースの機能を利用できるようになります。

仕組み

このライブラリは、Gemini ウェブインターフェースのラッパーとして機能します。認証にはセッションクッキー (__Secure-1PSID__Secure-1PSIDTS) を使用し、asyncio を使用してリクエストを送信してレスポンスを受け取る非同期クライアントを実装しています。また、常時稼働サービスのためにセッションを維持するための、クッキーを自動的に更新するバックグラウンドメカニズムが含まれています。

対象者

画像/ビデオ/オーディオ生成、ディープリサーチ、Gemini Gems などの Gemini のウェブアプリ機能を、自身のアプリケーションやスクリプトに統合したい Python 開発者。

ハイライト

  • マルチモーダル機能: 画像の生成と編集、ならびにビデオやオーディオ/音楽コンテンツの生成をサポートします。
  • ディープリサーチ: プラン作成、ステータス・ポーリング、結果取得のための完全なワークフローを実装しています。
  • Gemini Gems サポート: カスタムシステムプロンプト (Gems) の適用、作成、更新、削除を許可します。
  • 拡張機能の統合: YouTube や Gmail などの Gemini 拡張機能の使用をサポートします。
  • 高度なセッション管理: 自動更新機能付きの永続的なクッキーと、会話を履歴に保存しない一時モードを備えています。
  • 開発者フレンドリー: CLI ツール、リアルタイムレスポンス用のストリーミングモード、および公式の Google Generative AI API にインスパイアされたインターフェースを含んでいます。

Sources