remove-ai-watermarks: 画像から可視オーバーレイ、不可視の周波数領域ウォーターマーク、およびAIプロバナンス(由来)メタデータを剥ぎ取るための包括的なユーティリティ

remove-ai-watermarks: 画像から可視オーバーレイ、不可視の周波数領域ウォーターマーク、およびAIプロバナンス(由来)メタデータを除去するための包括的なユーティリティ

解決する課題

このツールは、画像から可視および不可視のAI生成ウォーターマークとプロバナンスメタデータを両方除去します。ユーザーが自身で生成したコンテンツに対して自律性を持てるように設計されており、ストックフォトの除去ツールに頼ることなく、Google Gemini、DALL-E、Stable Diffusion、Adobe Fireflyなどのモデルによるラベルを剥ぎ取ります。

仕組み

このプロジェクトは、ウォーターマークの種類に基づいて異なる手法を採用しています。

  • 可視ウォーターマーク: 既知のマーク(GeminiのキラキラマークやSamsung Galaxy AIのラベルなど)に対しては、リバース・アルファ・ブレンディングを使用します。このプロセスは、インペインティングによる推測ではなく、キャプチャされたアルファマップを使用して元のピクセルを復元します。任意のロゴに対しては、cv2またはbig-LaMaインペインティングを使用した汎用的な領域消去機能を提供します。
  • 不可視ウォーターマーク: SynthID、StableSignature、TreeRingのようなパターンを除去するために、ツールは拡散ベースの再生成を使用します。画像を潜在空間(latent space)にエンコードし、ノイズを加え、SDXLまたはQwen-Imageパイプラインを使用してデノイズします。このプロセス中、顔やテキストの構造を維持するために、デフォルトでCanny ControlNetが使用されます。
  • メタデータ: PNG、JPEG、AVIF、HEIF、MP4などのさまざまなファイル形式から、C2PAマニフェスト、EXIF/XMPラベル、およびその他のAI開示タグを剥ぎ取ります。

対象ユーザー

AI画像を生成し、よりクリーンな最終結果を得るために、プラットフォーム固有のブランディング、不可視の追跡マーカー、またはメタデータタグを自身の出力から除去したいユーザー。

ハイライト

  • マルチモデル対応: Gemini、DALL-E 3、Stable Diffusion、FLUX、Adobe Fireflyなどのウォーターマークを対象としています。
  • 構造の維持: 不可視ウォーターマークを除去しながら、テキストや顔の構造を鮮明に保つためにControlNetを使用します。
  • 包括的な検出: 起源プラットフォームと検出されたウォーターマークの完全なインベントリを報告するidentifyコマンドを含んでいます。
  • 柔軟なパイプライン: SDXLや、より優れたテキスト保存のために実験的なQwen-Image (20B)を含む、複数の再生成パイプラインを提供します。
  • クロスプラットフォーム: Python経由でのオフライン動作、またはクラウドベースのウェブインターフェースを介して動作します。

Sources